【MOOC】大數據解析與應用導論-浙江大學 中國大學慕課MOOC答案_第1頁
【MOOC】大數據解析與應用導論-浙江大學 中國大學慕課MOOC答案_第2頁
【MOOC】大數據解析與應用導論-浙江大學 中國大學慕課MOOC答案_第3頁
免費預覽已結束,剩余3頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

【MOOC】大數據解析與應用導論-浙江大學中國大學慕課MOOC答案第一周作業第一周測驗1、【單選題】下列場景適用于回歸分析的是本題答案:【天氣預報】2、【多選題】下列屬于多元統計方法的為本題答案:【主元分析#回歸分析】3、【多選題】多元統計分析的圖表示法有本題答案:【輪廓圖#雷達圖#調和曲線圖#散布圖矩陣】4、【判斷題】聚類分析也可以稱為判別分析。本題答案:【錯誤】5、【判斷題】多元統計分析不僅變量的波動,還要研究變量間的耦合性。本題答案:【正確】6、【判斷題】完整的數據分析過程,包括數據采集、數據清洗和數據分析。本題答案:【正確】第二周作業第二周測驗1、【單選題】下列哪種方法不是數據填補的手段本題答案:【均值標準化】2、【多選題】一般常見的缺失值處理的方法有本題答案:【替換填充法#最近鄰插補填充法#回歸填充法#插值填充】3、【多選題】一般常見的數據歸一化的方法有本題答案:【最小最大規范化#零均值規范化】4、【判斷題】少量的異常值完全不會影響數據分析。本題答案:【錯誤】5、【判斷題】一般初步收集到的數據可能是帶有異常值的。本題答案:【正確】6、【判斷題】主成分分析可以降低數據維度。本題答案:【正確】第三周作業第三周測驗1、【單選題】SVM的中文全稱叫什么?本題答案:【支持向量機】2、【單選題】SVM算法的最小時間復雜度是O(n2),基于此,以下哪種規格的數據集并不適該算法?本題答案:【大數據集】3、【判斷題】費舍爾判別分析通過不同類別數據投影后中心點間的距離來衡量類間分離程度。本題答案:【正確】4、【判斷題】拉格朗日乘子法可用于線性可分SVM的模型求解。本題答案:【正確】5、【填空題】曼哈頓距離是各變量之差的()之和。本題答案:【絕對值】第四周作業第四周測驗1、【單選題】最小二乘方法的擬合程度衡量指標是本題答案:【殘差平方和】2、【多選題】最典型的兩種擬合不佳的情況是本題答案:【欠擬合#過擬合】3、【判斷題】嶺回歸適用于樣本很少,但變量很多的回歸問題。本題答案:【正確】4、【判斷題】維數災難是指當變量指標、特征逐步增加時導致計算量、計算難度成指數爆炸性增長,而模型準確性卻在降低的情況。本題答案:【正確】5、【填空題】主元回歸分析是基于()算法的結果進行后續回歸建模分析。本題答案:【主成分分析】第五周作業第五周測驗1、【多選題】閔可夫斯基距離是一組距離的定義,下列距離中屬于閔可夫斯基距離的有本題答案:【歐式距離#切比雪夫距離#曼哈頓距離】2、【多選題】在利用EM算法估計高斯混合模型參數的時候,需要預先設定的參數有本題答案:【高斯元的均值#高斯元的方差#高斯元的權重系數#類別個數】3、【判斷題】在區分某個算法是否是聚類算法時,往往可以通過該算法是否需要預先設定明確的類中心來判斷本題答案:【正確】4、【判斷題】如果兩個變量的相關系數為0,則說明兩個變量是獨立的。本題答案:【錯誤】5、【判斷題】樣本的順序會影響K均值聚類算法的結果。本題答案:【錯誤】6、【填空題】GMM模型是借助多個()分布的線性累加去估計任意的分布。本題答案:【高斯】7、【填空題】GMM模型需要預先設定高斯元個數去確定()個數。本題答案:【類別】第六周作業第六周測驗1、【單選題】在Bootstrap自助采樣法中,真實的情況是本題答案:【在每一次采樣中,樣本之間可能有重復;在完成n次采樣之后,有些樣本可能沒有被采集到】2、【單選題】對于離散型隨機變量X,它的熵取決于本題答案:【X取每個值的概率】3、【判斷題】隨機森林只能選擇決策樹作為基分類器。本題答案:【錯誤】4、【判斷題】隨機森林的各個基分類器之間是互相獨立的,在訓練的時候可以并行訓練。本題答案:【正確】5、【判斷題】決策樹算法只能處理具有離散特征屬性的數據集,對于連續特征屬性的數據集無能為力。本題答案:【錯誤】第七周作業第七周測驗1、【單選題】CCA算法在求解時,分別在兩組變量中選取具有代表性的綜合變量Ui,Vi,每個綜合變量是原變量的線性組合,選擇綜合變量時的目標是本題答案:【最大化兩者的相關系數】2、【單選題】相比于普通CCA算法,KernelCCA本題答案:【能分析兩組隨機變量之間的非線性關系】3、【多選題】關于典型相關分析CCA與主成分分析PCA,下面說法錯誤的是本題答案:【PCA可以視為一種降維技術,CCA不可以視為一種降維技術#是否進行歸一化,都不影響分析結果】4、【判斷題】典型相關分析適用于分析兩組變量之間的關系本題答案:【正確】5、【判斷題】對數據進行歸一化操作會影響典型相關分析的結果本題答案:【錯誤】第八周作業第八周測驗1、【單選題】關于卷積神經網絡CNN,以下說法錯誤的是:本題答案:【由于卷積核的大小一般是3*3或更大,因此卷積層得到的特征圖像一定比原圖像小。】2、【多選題】相較于傳統RNN,LSTM引入了獨特的門控機制。以下哪些是LSTM中包含的門結構:本題答案:【輸入門#輸出門#遺忘門】3、【多選題】關于卷積神經網絡CNN與循環神經網絡RNN,下面說法正確的有:本題答案:【CNN適用于圖像處理,而RNN適用于序列數據處理。#CNN和RNN都采用了權值共享機制以減少網絡中的參數量。】4、【判斷題】神經網絡是一種模仿動物神經網絡行為特征,進行分布式并行信息處理的算法數學模型。它通過訓練調整內部節點之間相互連接的關系,從而達到處理信息的目的。本題答案:【正確】5、【判斷題】為了提高預測結果的精度,網絡結構設置得越復雜越好,不必考慮訓練網絡時所花費的時間。本題答案:【錯誤】第九周作業第九周測驗1、【單選題】關于去噪自編碼器DAE,以下說法錯誤的是:本題答案:【DAE的Loss函數用于最小化預測結果與噪聲數據間的誤差】2、【多選題】在稀疏自編碼器中,假設神經元采用tanh作為激活函數,則:本題答案:【當神經元的輸出接近1的時候,認為它被激活。#當神經元的輸出接近-1的時候,認為它被抑制。】3、【多選題】關于變分自編碼器VAE,以下說法正確的有:本題答案:【VAE是一類生成模型,可用于訓練出一個樣本的生成器#

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論