




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
精品文檔-下載后可編輯數據挖掘與數據分析常見測試題匯編數據挖掘與數據分析常見測試題匯編
1.【單選題】2分|某超市研究銷售紀錄數據后發現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的哪類問題()。
A關聯規則發現
B聚類
C分類
D自然語言處理
2.【單選題】2分|將原始數據進行集成、變換、維度規約、數值規約是在以下哪個步驟的任務()
A頻繁模式挖掘
B分類和預測
C數據預處理
D數據流挖掘
3.【單選題】2分|當不知道數據所帶標簽時,可以使用哪種技術促使帶同類標簽的數據與帶其他標簽的數據相分離()。
A分類
B聚類
C關聯分析
D隱馬爾可夫鏈
4.【單選題】2分|什么是KDD()。
A數據挖掘與知識發現
B領域知識發現
C文檔知識發現
D動態知識發現
5.【單選題】2分|為數據的總體分布建模;把多維空間劃分成組等問題屬于數據挖掘的哪一類任務()
A探索性數據分析
B建模描述
C預測建模
D尋找模式和規則
6.【單選題】2分|建立一個模型,通過這個模型根據已知的變量值來預測其他某個變量值屬于數據挖掘的哪一類任務()
A根據內容檢索
B建模描述
C預測建模
D尋找模式和規則
7.【單選題】2分|用戶有一種感興趣的模式并且希望在數據集中找到相似的模式,屬于數據挖掘哪一類任務()
A根據內容檢索
B建模描述
C預測建模
D尋找模式和規則
8.【單選題】2分|下面哪種不屬于數據預處理的方法()
A變量代換
B離散化
C聚集
D估計遺漏值
9.【單選題】2分|下面哪個不屬于數據的屬性類型:()
A標稱
B序數
C區間
D相異
10.【單選題】2分|以下哪種方法不屬于特征選擇的標準方法:()
A嵌入
B過濾
C包裝
D抽樣
11.【單選題】2分|在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是:()
A有放回的簡單隨機抽樣
B無放回的簡單隨機抽樣
C分層抽樣
D漸進抽樣
12.【多選題】4分|數據倉庫是隨著時間變化的,下面的描述正確的是()
A數據倉庫隨時間的變化不斷增加新的數據內容;
B捕捉到的新數據會覆蓋原來的快照;
C數據倉庫隨事件變化不斷刪去舊的數據內容;
D數據倉庫中包含大量的綜合數據,這些綜合數據會隨著時間的變化不斷地進行重新綜合;
13.【單選題】2分|OLAP技術的核心是:()
A在線性;
B對用戶的快速響應;
C互操作性;
D多維分析;
14.【多選題】4分|有關數據倉庫的開發特點,正確的描述是:()
A數據倉庫開發要從數據出發;
B數據倉庫使用的需求在開發出去就要明確;
C數據倉庫的開發是一個不斷循環的過程,是啟發式的開發;
D在數據倉庫環境中,并不存在操作型環境中所固定的和較確切的處理流,數據倉庫中數據分析和處理更靈活,且沒有固定的模式
15.【單選題】2分|關于OLAP的特性,下面正確的是:(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性()
A(1)(2)(3)
B(2)(3)(4)
C(1)(2)(3)(4)
D(1)(2)(3)(4)(5)
16.【多選題】4分|在有關數據倉庫測試,下列說法正確的是:()
A在完成數據倉庫的實施過程中,需要對數據倉庫進行各種測試.測試工作中要包括單元測試和系統測試.
B當數據倉庫的每個單獨組件完成后,就需要對他們進行單元測試.
C系統的集成測試需要對數據倉庫的所有組件進行大量的功能測試和回歸測試.
D在測試之前沒必要制定詳細的測試計劃.
17.【單選題】2分|設X={1,2,3}是頻繁項集,則可由X產生()個關聯規則。
A4
B5
C6
D7
18.【單選題】2分|以下哪些算法是分類算法()
ADBSCAN
BC4.5
CK-Mean
DEM
19.【單選題】2分|以下哪些分類方法可以較好地避免樣本的不平衡問題()
AKNN
BSVM
CBayes
D神經網絡
20.【多選題】4分|關于OLAP和OLTP的區別描述,正確的是:()
AOLAP主要是關于如何理解聚集的大量不同的數據.它與OTAP應用程序不同.
B與OLAP應用程序不同,OLTP應用程序包含大量相對簡單的事務.
COLAP的特點在于事務量大,但事務內容比較簡單且重復率高.
DOLAP是以數據倉庫為基礎的,但其最終數據來源與OLTP一樣均來自底層的數據庫系統,兩者面對的用戶是相同的.
21.【單選題】2分|如果規則集中的規則按照優先級降序排列,則稱規則集是()
A無序規則
B窮舉規則
C互斥規則
D有序規則
22.【單選題】2分|以下哪個聚類算法不是屬于基于原型的聚類()。
A模糊c均值
BEM算法
CSOM
DCLIQUE
23.【單選題】2分|一個對象的離群點得分是該對象周圍密度的逆。這是基于()的離群點定義。
A概率
B鄰近度
C密度
D聚類
24.【單選題】2分|下面關于Jarvis-Patrick(JP)聚類算法的說法不正確的是()。
AJP聚類擅長處理噪聲和離群點,并且能夠處理不同大小、形狀和密度的簇。
BJP算法對高維數據效果良好,尤其擅長發現強相關對象的緊致簇。
CJP聚類是基于SNN相似度的概念。
DJP聚類的基本時間復雜度為O(m)。
25.【多選題】4分|關于決策樹的說法,正確的是()
A冗余屬性不會對決策樹的準確率造成不利的影響
B子樹可能在決策樹中重復多次
C決策樹算法對于噪聲的干擾非常敏感
D尋找最佳決策樹是NP完全問題
26.【多選題】4分|以下關于人工神經網絡(ANN)的描述正確的有()
A神經網絡對訓練數據中的噪聲非常魯棒
B可以處理冗余特征
C訓練ANN是一個很耗時的過程
D至少含有一個隱藏層的多層神經網絡
27.【多選題】4分|關于混合模型聚類算法的優缺點,下面說法不正確的是()。
A當簇只包含少量數據點,或
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 電腦配件代銷合同范本
- 電車營運車輛轉讓協議書
- 農村羊群承包協議書
- 非婚子女撫養協議書
- 人投資股份制協議書
- 村民財產調解協議書
- 澄邁應急聯動協議書
- 郗利爾單招合同范本
- 租賃合同調解協議書
- 長三角醫療服務協議書
- 偏微分方程的數值解法課后習題答案
- 保密管理-保密教育培訓簽到簿
- 手術室剖宮產護理查房-課件
- 消防檔案范本(企業類)
- 隧道工程隧道洞口臨建施工方案
- 心理咨詢的面談技術
- (word完整版)污水處理廠安全評價報告
- DB50∕T 867.6-2019 安全生產技術規范 第6部分:黑色金屬冶煉企業
- 新產品開發流程課件
- 高中語文部編版選擇性必修下冊第四單元 單元學習導航 課件 (8張PPT)
- 貫徹三標一規范咨詢工作計劃
評論
0/150
提交評論