大學數(shù)據(jù)挖掘期末考試題_第1頁
大學數(shù)據(jù)挖掘期末考試題_第2頁
大學數(shù)據(jù)挖掘期末考試題_第3頁
大學數(shù)據(jù)挖掘期末考試題_第4頁
大學數(shù)據(jù)挖掘期末考試題_第5頁
已閱讀5頁,還剩1頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精選文檔數(shù)據(jù)發(fā)掘試卷課程代碼:C0204413課程:數(shù)據(jù)發(fā)掘A卷題目-四五六七八九十總成績復核一-三二:得分二號學閱卷教師:一、判斷題(每題1分,10分)名姓班1.從點作為個體簇開始,每一步合并兩個最湊近的簇,這是一種分裂的層次聚類方法。()級2.數(shù)據(jù)發(fā)掘的目標不在于數(shù)據(jù)收集策略,而在于對已經存在的數(shù)據(jù)進行模式的發(fā)掘。()3.在聚類分析中間,簇內的相似性越大,簇間的差異越大,聚類的成效就越差。()4.當兩個點之間的周邊度取它們之間距離的平方時,Ward方法與組均勻特別相似。()5.DBSCAN是相抗衡噪聲的,而且可以辦理隨便形狀和大小的簇。()6.屬性的性質不用與用來胸襟他的值的性質同樣。()

2、7.全鏈對噪聲點和離群點很敏感。()專8.關于非對稱的屬性,只有非零值才是重要的。()9.K均值可以很好的辦理不一樣密度的數(shù)據(jù)。()10.單鏈技術善于辦理橢圓形狀的簇。()二、選擇題(每題2分,30分)當不知道數(shù)據(jù)所帶標簽時,可以使用哪一種技術促使帶同類標簽的數(shù)據(jù)與帶其余標簽的數(shù)據(jù)相分院學院學學科離?息信()與學數(shù)A.分類B.聚類C.關系分析D.主成分分析題試一試考末期期學季春年學2.()將兩個簇的周邊度定義為不一樣簇的全部點對周邊度的均勻值,它是一種凝聚層次聚類技術。B.MAX(全鏈)C.組均勻D.Ward方法A.MIN(單鏈)3?數(shù)據(jù)發(fā)掘的經典事例“啤酒與尿布試驗”最主若是應用()數(shù)據(jù)發(fā)掘

3、方法。了A分類B展望C關系規(guī)則分析D聚類4關于K均值和DBSCAN的比較,以下說法不正確的選項是()A.K均值扔掉被它識別為噪聲的對象,而DBSCAN一般聚類全部對象。B.K均值使用簇的基于原型的看法,DBSCAN使用基于密度的看法。C.K均值很難辦理非球形的簇和不一樣大小的簇,DBSCAN可以辦理不一樣大小和不一樣形狀的簇D.K均值可以發(fā)現(xiàn)不是明顯分其他簇,即使簇有重疊也可以發(fā)現(xiàn),但是DBSCAN會合并有重疊的簇以下關于WardMethod說法錯誤的選項是:()對噪聲點和離群點敏感度比較小善于辦理球狀的簇關于Ward方法,兩個簇的周邊度定義為兩個簇合并時以致的平方偏差D.當兩個點之間的周邊度

4、取它們之間距離的平方時,Ward方法與組均勻特別相似6.以下關于層次聚類存在的問題說法正確的選項是:()擁有全局優(yōu)化目標函數(shù)GroupAverage善于辦理球狀的簇可以辦理不一樣大小簇的能力Max對噪聲點和離群點很敏感7.以下關于凝聚層次聚類的說法中,說法錯誤的事:()一旦兩個簇合并,該操作就不可以撤掉算法的停止條件是僅剩下一個簇空間復雜度為Om2擁有全局優(yōu)化目標函數(shù)8規(guī)則牛奶,尿布T啤酒的支持度和置信度分別為:()精選文檔精選文檔A,根結點(rootnode)B,內部結點(internalnode)C,外面結點(externalnode)D,葉結點(leafnode)TID項集13.建立一個

5、模型,經過這個模型依據(jù)已知的變量值來展望其余某個變量值屬于數(shù)據(jù)發(fā)掘的哪一類任面1牛奶包,2務?()3面尿啤雞蛋A.依據(jù)內容檢索B.建模描畫C.展望建模D.找尋模式和規(guī)則包,布,酒,45牛尿啤可樂14.以下哪個描畫是正確的?()奶,布,酒,面牛尿包,奶,布,啤酒A、分類和聚類都是有指導的學習B、分類和聚類都是無指導的學習面牛尿可樂包,奶,布,C、分類是有指導的學習,聚類是無指導的學習D、分類是無指導的學習,聚類是有指導的學習A.0.4,0.4B.0.67,0.67C.0.4,0.67D.0.67,0.415.下邊購物籃可以提取的3-項集的最大數(shù)目是多少()9?以下()是屬于分裂層次聚類的方法。I

6、D購買項A.MinB.MaxC.GroupAverageD.MST1牛奶,啤酒,尿布2面包,黃油,牛奶3牛奶,尿布,餅干4面包,黃油,餅干5啤酒,餅干,尿布6牛奶,尿布,面包,黃油10.對以下圖數(shù)據(jù)進行凝聚聚類操作,簇間相似度使用MAX計算,第二步是哪兩個簇合并:()7面包,黃油,尿布8啤酒,尿布9牛奶,尿布,面包,黃油11I2I3I4I510啤酒,餅干11.00.90.100650.20A.1B.C.3D41002I0.91.00.700.600.502001.000.400.30三、簡答題(每題8分,40分)I0.1070300.60.401.000.80I0.61.何謂數(shù)據(jù)發(fā)掘?它有哪些

7、方面的功能?450I0.20.50,300.80too500A.在和1,2合并B.3和4,5合并C.2,3和4,5合并D.2,3和4,5形成簇和3合并11.將原始數(shù)據(jù)進行集成、變換、維度規(guī)約、數(shù)值規(guī)約是在以下哪個步驟的任務?()C.數(shù)據(jù)預辦理D.數(shù)據(jù)流發(fā)掘A.屢次模式發(fā)掘B.分類和展望12.決策樹中不包括一下哪一種結點()2.簡述數(shù)據(jù)預辦理方法和內容。精選文檔精選文檔3?何謂聚類?它與分類有什么異同?4.什么是決策樹?如何用決策樹進行分類?5.簡述ID3算法的基本思想及其主算法的基本步驟四、算法題(每題10分,20分)1.由以下圖已給出的距離矩陣,將Max用于6個點樣本數(shù)據(jù)集,畫出層次聚類的樹狀圖?P1P2P3P4P5P6P10.000.240.220.370.340.23P20.240.000.140.200.130.25P30.220.140.000.150.280.11P40.370.200.150.000.290.22P50.340.130.280.290.000.39P60.230.250.110.220.390.002.假設數(shù)據(jù)發(fā)掘的任務是將以下的8個點(用(x,y)代表位置)聚類為3個類:X1(2,10)、X2(

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論