數據挖掘與數據分析常見測試題匯編_第1頁
數據挖掘與數據分析常見測試題匯編_第2頁
數據挖掘與數據分析常見測試題匯編_第3頁
數據挖掘與數據分析常見測試題匯編_第4頁
數據挖掘與數據分析常見測試題匯編_第5頁
已閱讀5頁,還剩3頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

精品文檔-下載后可編輯數據挖掘與數據分析常見測試題匯編數據挖掘與數據分析常見測試題匯編

1.【單選題】2分|某超市研究銷售紀錄數據后發現,買啤酒的人很大概率也會購買尿布,這種屬于數據挖掘的哪類問題()。

A關聯規則發現

B聚類

C分類

D自然語言處理

2.【單選題】2分|將原始數據進行集成、變換、維度規約、數值規約是在以下哪個步驟的任務()

A頻繁模式挖掘

B分類和預測

C數據預處理

D數據流挖掘

3.【單選題】2分|當不知道數據所帶標簽時,可以使用哪種技術促使帶同類標簽的數據與帶其他標簽的數據相分離()。

A分類

B聚類

C關聯分析

D隱馬爾可夫鏈

4.【單選題】2分|什么是KDD()。

A數據挖掘與知識發現

B領域知識發現

C文檔知識發現

D動態知識發現

5.【單選題】2分|為數據的總體分布建模;把多維空間劃分成組等問題屬于數據挖掘的哪一類任務()

A探索性數據分析

B建模描述

C預測建模

D尋找模式和規則

6.【單選題】2分|建立一個模型,通過這個模型根據已知的變量值來預測其他某個變量值屬于數據挖掘的哪一類任務()

A根據內容檢索

B建模描述

C預測建模

D尋找模式和規則

7.【單選題】2分|用戶有一種感興趣的模式并且希望在數據集中找到相似的模式,屬于數據挖掘哪一類任務()

A根據內容檢索

B建模描述

C預測建模

D尋找模式和規則

8.【單選題】2分|下面哪種不屬于數據預處理的方法()

A變量代換

B離散化

C聚集

D估計遺漏值

9.【單選題】2分|下面哪個不屬于數據的屬性類型:()

A標稱

B序數

C區間

D相異

10.【單選題】2分|以下哪種方法不屬于特征選擇的標準方法:()

A嵌入

B過濾

C包裝

D抽樣

11.【單選題】2分|在抽樣方法中,當合適的樣本容量很難確定時,可以使用的抽樣方法是:()

A有放回的簡單隨機抽樣

B無放回的簡單隨機抽樣

C分層抽樣

D漸進抽樣

12.【多選題】4分|數據倉庫是隨著時間變化的,下面的描述正確的是()

A數據倉庫隨時間的變化不斷增加新的數據內容;

B捕捉到的新數據會覆蓋原來的快照;

C數據倉庫隨事件變化不斷刪去舊的數據內容;

D數據倉庫中包含大量的綜合數據,這些綜合數據會隨著時間的變化不斷地進行重新綜合;

13.【單選題】2分|OLAP技術的核心是:()

A在線性;

B對用戶的快速響應;

C互操作性;

D多維分析;

14.【多選題】4分|有關數據倉庫的開發特點,正確的描述是:()

A數據倉庫開發要從數據出發;

B數據倉庫使用的需求在開發出去就要明確;

C數據倉庫的開發是一個不斷循環的過程,是啟發式的開發;

D在數據倉庫環境中,并不存在操作型環境中所固定的和較確切的處理流,數據倉庫中數據分析和處理更靈活,且沒有固定的模式

15.【單選題】2分|關于OLAP的特性,下面正確的是:(1)快速性(2)可分析性(3)多維性(4)信息性(5)共享性()

A(1)(2)(3)

B(2)(3)(4)

C(1)(2)(3)(4)

D(1)(2)(3)(4)(5)

16.【多選題】4分|在有關數據倉庫測試,下列說法正確的是:()

A在完成數據倉庫的實施過程中,需要對數據倉庫進行各種測試.測試工作中要包括單元測試和系統測試.

B當數據倉庫的每個單獨組件完成后,就需要對他們進行單元測試.

C系統的集成測試需要對數據倉庫的所有組件進行大量的功能測試和回歸測試.

D在測試之前沒必要制定詳細的測試計劃.

17.【單選題】2分|設X={1,2,3}是頻繁項集,則可由X產生()個關聯規則。

A4

B5

C6

D7

18.【單選題】2分|以下哪些算法是分類算法()

ADBSCAN

BC4.5

CK-Mean

DEM

19.【單選題】2分|以下哪些分類方法可以較好地避免樣本的不平衡問題()

AKNN

BSVM

CBayes

D神經網絡

20.【多選題】4分|關于OLAP和OLTP的區別描述,正確的是:()

AOLAP主要是關于如何理解聚集的大量不同的數據.它與OTAP應用程序不同.

B與OLAP應用程序不同,OLTP應用程序包含大量相對簡單的事務.

COLAP的特點在于事務量大,但事務內容比較簡單且重復率高.

DOLAP是以數據倉庫為基礎的,但其最終數據來源與OLTP一樣均來自底層的數據庫系統,兩者面對的用戶是相同的.

21.【單選題】2分|如果規則集中的規則按照優先級降序排列,則稱規則集是()

A無序規則

B窮舉規則

C互斥規則

D有序規則

22.【單選題】2分|以下哪個聚類算法不是屬于基于原型的聚類()。

A模糊c均值

BEM算法

CSOM

DCLIQUE

23.【單選題】2分|一個對象的離群點得分是該對象周圍密度的逆。這是基于()的離群點定義。

A概率

B鄰近度

C密度

D聚類

24.【單選題】2分|下面關于Jarvis-Patrick(JP)聚類算法的說法不正確的是()。

AJP聚類擅長處理噪聲和離群點,并且能夠處理不同大小、形狀和密度的簇。

BJP算法對高維數據效果良好,尤其擅長發現強相關對象的緊致簇。

CJP聚類是基于SNN相似度的概念。

DJP聚類的基本時間復雜度為O(m)。

25.【多選題】4分|關于決策樹的說法,正確的是()

A冗余屬性不會對決策樹的準確率造成不利的影響

B子樹可能在決策樹中重復多次

C決策樹算法對于噪聲的干擾非常敏感

D尋找最佳決策樹是NP完全問題

26.【多選題】4分|以下關于人工神經網絡(ANN)的描述正確的有()

A神經網絡對訓練數據中的噪聲非常魯棒

B可以處理冗余特征

C訓練ANN是一個很耗時的過程

D至少含有一個隱藏層的多層神經網絡

27.【多選題】4分|關于混合模型聚類算法的優缺點,下面說法不正確的是()。

A當簇只包含少量數據點,或

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論