




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
長風破浪會有時,直掛云帆濟滄海。南開大學23春“物聯網工程”《數據分析》考試高頻考點參考題庫帶答案(圖片大小可自由調整)第I卷一.綜合考核(共15題)1.ID3算法流程為()。A.從根結點開始,對結點計算所有可能的特征的信息增益,選擇信息增益最大的特征作為結點的特征,由該特征的不同取值建立子結點B.所有特征的信息增益均很小或沒有特征可以選擇C.得到一個決策樹D.對子結點遞歸地調用,構建決策樹2.統計學習方法的組成:()。A.監督學習B.無監督學習C.強化學習3.()反映了學習方法對未知的測試數據集的預測能力,是學習中的重要概念。A.訓練誤差B.測試誤差C.統計誤差D.平均誤差4.在鏈接作弊的垃圾農場中,作弊者擁有并完全控制的網頁稱為()。A.不可達網頁B.可達網頁C.自有網頁5.DAG中的父節點是唯一的。()A.正確B.錯誤6.聚類分析中,一個類是樣本的一個子集。()A.正確B.錯誤7.SVM是在特征空間上的間隔最大的線性分類器。()A.正確B.錯誤8.要防止過擬合,進行最優的模型選擇,即選擇復雜度最適當的模型,以達到使測試誤差最小的學習目的。()A.正確B.錯誤9.數據采集,又稱數據獲取,是大數據生命周期的第一個環節,通過RFID射頻識別技術、傳感器、交互型社交網絡以及移動互聯網等方式獲得的各種類型的結構化、半結構化及非結構化的海量數據。()A.正確B.錯誤10.FP-growth算法可以避免冗余的IO讀寫。()A.正確B.錯誤11.大數據的速度快體現在數據產生速度快和要求分析處理速度快。()A.正確B.錯誤12.評價分類器效果時,表示正確分類的樣本數與總樣本數之比的指標是()。A.準確率B.精確率C.召回率D.F1值13.kNN算法中,選擇較大的k值“學習”的估計誤差會減小。()A.正確B.錯誤14.數據產生方式變革中數據產生方式是主動的主要是來自哪個階段?()A.運營式系統階段B.用戶原創內容階段C.感知式系統階段15.TF-IDF算法中,IDF指的是文檔頻率。()A.正確B.錯誤第II卷一.綜合考核(共15題)1.TrustRank算法中,創建優質網頁集合時,不會選擇成員受限的域名。()A.正確B.錯誤2.決策樹中為了防止過擬合現象可以對已生成的樹自上而下剪枝。()A.正確B.錯誤3.大數據在教育中的應用:()。A.網上公開課B.慕課C.智慧校園D.翻轉課堂4.類的R型聚類是指()。A.對樣本個體進行聚類B.對指標變量進行聚類5.決策樹中的葉結點表示()。A.特征B.類C.屬性D.值域輸出6.按社團形成機制分類,社團包括()。A.明顯的社團B.預定義社團C.自組織社團D.隱含的社團7.樸素貝葉斯等價于期望風險最小化。()A.正確B.錯誤8.大數據在電信中的應用有()。A.基于用戶、業務及流量分級的多維管控機制B.精準的客戶分析及營銷C.利用位置和軌跡信息服務社會9.聚類屬于()。A.有監督學習B.無監督學習C.強化學習D.對抗學習10.決策樹的生成過程是()。A.遞歸地進行下去,直至所有訓練據子集被基本正確分類,或者沒有合適的特征為止,最后每個子集都被分到葉結點上,即都有了明確的類B.如果這些子集已經能夠被基本正確分類,那么構建葉結點,并將這些子集分到所對應的葉結點中去C.構建根結點,將所有訓練數據都放在根結點D.選擇一個最優特征,按照這一特征將訓練數據集分割成子集,使得各個子集有一個在當前條件下最好的分類E.如果還有子集不能被基本正確分類,那么就對這些子集選擇新的最優特征,繼續對其進行分割,構建相應的結點11.基于分類對象的分類有()。A.Q型聚類B.凝聚方式C.R型聚類D.分解方式12.下列哪些任務適合構建分類模型?()A.銀行業務中,客戶申請貸款,根據客戶的相關數據分析他是屬于“誠信”類還是“失信”類B.郵件系統可以根據email標題和內容區分出垃圾郵件C.醫學研究人員根據病理數據,合理辨識病情狀況,采取合理治療手段D.房價預測13.PageRank算法是圖數據上的無監督學習方法。()A.正確B.錯誤14.閔式距離參數是()時代表曼哈頓距離。A.0B.1C.2D.無窮15.回歸分析方法中,按照輸入變量個數分類,可分為()。A.一元回歸B.多元回歸C.線性回歸D.非線性回歸第III卷一.綜合考核(共15題)1.潛在語義分析中,以()表示文本的語義內容。A.話題B.話題向量C.語義向量D.距離向量2.如果一個網頁被很多網頁所指向,那么該網頁很可能是重要的。()A.正確B.錯誤3.文本中所有單詞的出現情況表示了文本的()。A.種類B.特征C.語義內容D.語義結構4.潛在語義分析創新地引入了()。A.單詞維度B.文本維度C.話題維度5.在估計PLSA生成模型的參數時,使用()。A.極大似然估計B.對數似然函數C.特征獨立假設D.貝葉斯定理6.通過分析已知訓練樣本類別的數據集屬性,通過訓練建立相應分類模型,是監督學習。()A.正確B.錯誤7.ID3算法的核心是在決策樹葉結點上應用信息增益準則選擇特征,遞歸地構建決策樹。()A.正確B.錯誤8.為了計算中介度,必須計算所有邊上()的數目。A.所有路徑B.最短路徑C.結點入度D.節點出度9.KNN算法用MapReduce實現,要進行幾輪MapReduce?()A.1B.2C.3D.410.下列屬于樸素貝葉斯缺點的是()。A.分類效果不穩定B.不適合增量式訓練C.先驗模型可能導致結果不佳D.對缺失數據不太敏感11.監督學習是從標注數據中學習預測模型的機器學習問題。()A.正確B.錯誤12.向量空間模型中,將單詞在文本中出現的數據用一個()表示。A.單詞-文本矩陣B.單詞-向量矩陣C.距離矩陣D.權重矩陣13.k均值聚類是硬聚類。()A.正確B.錯誤14.支持向量機的MapReduce實現要進行幾輪MapReduce?()A.1B.2C.3D.自行規定15.邏輯斯諦分布的分布函數范圍在()。A.(-∞,∞)B.(0,1)C.(-1/2,1/2)D.(-1,1)第I卷參考答案一.綜合考核1.參考答案:ABCD2.參考答案:ABC3.參考答案:B4.參考答案:C5.參考答案:B6.參考答案:A7.參考答案:A8.參考答案:A9.參考答案:A10.參考答案:A11.參考答案:A12.參考答案:A13.參考答案:A14.參考答案:B15.參考答案:B第II卷參考答案一.綜合考核1.參考答案:B2.參考答案:B3.參考答案:ABCD4.參考答案:B5.參考答案:B6.參考答案:BC7.參考答案:A8.參考答案:ABC9.參考答案:B10.參考答案:ABCDE11.參考答案:BD12.參考答案:ABC13.參考答案:A14.參考答案
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- dr考試試題及答案
- b站考試試題及答案
- 2025年實體書店應對電商沖擊的轉型策略研究報告
- 2024教資考試試題及答案
- 早產兒出院健康教育
- 遺傳糖尿病的家庭護理
- 2025新版中外技術許可合同
- 2025年初中7年級道德與法治部編版上冊第2單元復習《單元測試》04
- 大學宿舍衛生標準
- 北京市朝陽區2022-2023學年高三上學期上學期期中地理無答案
- 弘揚非遺傳統文化-評書2
- 《商業文化與素養》教案全套 第一周專題一認知商業文化1-第十八周專題六自我管理3
- AED(自動體外除顫儀)的使用
- 2024中考復習必背初中英語單詞詞匯表(蘇教譯林版)
- 《土源性線蟲病》課件
- 找個管家管安全管理
- 浙江省蒼南縣新希望學校聯考2023-2024學年上學期九年級第二次學科素養檢測數學試題(含答案)
- 韻達云倉方案
- 《創傷失血性休克中國急診專家共識(2023)》解讀
- 全國自然教育中長期發展規劃
- 2022-2023年湖南省普通高中學業水平合格考試英語真題試卷 含詳解
評論
0/150
提交評論