




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、Forpersonaluseonlyinstudyandresearch;notforcommercialuse單項選擇題某商場研究銷售紀錄數據后發現,買啤酒的人很大體率也會購置尿布,這類屬于數據發掘的哪種問題?(A)A.關系規則發現B.聚類C.分類D.自然語言辦理3.將原始數據進行集成、變換、維度規約、數值規約是在以下哪個步驟的任務?(C)A.屢次模式發掘B.分類和展望C.數據預辦理D.數據流發掘當不知道數據所帶標簽時,能夠使用哪一種技術促進帶同類標簽的數據與帶其余標簽的數據相分別?(B)A.分類B.聚類C.關系剖析D.隱馬爾可夫鏈6.使用交互式的和可視化的技術,對數據進行探究屬于數據發掘的
2、哪一類任務?(A)A.探究性數據剖析B.建模描繪C.展望建模D.找尋模式和規則11.下邊哪一種不屬于數據預辦理的方法?(D)A變量代換B失散化C齊集D預計遺漏值12.假定12個銷售價錢記錄組已經排序以下:5,10,11,13,15,35,50,55,72,92,204,215使用以下每種方法將它們區分紅四個箱。等頻(等深)區分時,15在第幾個箱子內?(B)A第一個B第二個C第三個D第四個13.上題中,等寬區分時(寬度為50),15又在哪個箱子里?(A)A第一個B第二個C第三個D第四個只有非零值才重要的二元屬性被稱作:(C)A計數屬性B失散屬性C非對稱的二元屬性D對稱屬性17.以下哪一種方法不屬
3、于特色選擇的標準方法:(D)A嵌入B過濾C包裝D抽樣18.下邊不屬于創立新屬性的有關方法的是:(B)A特色提取B特色改正C映照數據到新的空間D特色結構假定屬性income的最大最小值分別是12000元和98000元。利用最大最小規范化的方法將屬性的值映照到0至1的范圍內。對屬性income的73600元將被轉變為:(D)A0.821B1.224C1.458D0.71623.假定用于剖析的數據包含屬性age。數據元組中age的值以下(按遞加序):13,15,16,16,19,20,20,21,22,22,25,25,25,30,33,33,35,35,36,40,45,46,52,70,問題:使
4、用按箱均勻值光滑方法對上述數據進行光滑,箱的深度為3。第二個箱子值為:(A)A18.3B22.6C26.8D27.928.數據庫房是跟著時間變化的,下邊的描繪不正確的選項是(C)A.數據庫房隨時間的變化不停增添新的數據內容;B.捕獲到的新數據會覆蓋本來的快照;C.數據庫房隨事件變化不停刪去舊的數據內容;D.數據庫房中包含大批的綜合數據,這些綜合數據會跟著時間的變化不停地進行從頭綜合.對于基本數據的元數據是指:(D)A.基本元數據與數據源,數據庫房,數據市集和應用程序等結構有關的信息;B.基本元數據包含與公司有關的管理方面的數據和信息;1/7C.基本元數據包含日記文件和簡歷履行辦理的時序調動信息
5、;D.基本元數據包含對于裝載和更新辦理,剖析辦理以及管理方面的信息.下邊對于數據粒度的描繪不正確的選項是:(C)A.粒度是指數據庫房小數據單元的詳盡程度和級別;B.數據越詳盡,粒度就越小,級別也就越高;C.數據綜合度越高,粒度也就越大,級別也就越高;D.粒度的詳細區分將直接影響數據庫房中的數據量以及查問質量.33.OLAP技術的核心是:(D)A.在線性;B.對用戶的迅速響應;C.互操作性.D.多維剖析;34.對于OLAP的特征,下邊正確的選項是:(D)迅速性(2)可剖析性(3)多維性(4)信息性(5)共享性A.(1)(2)(3)B.(2)(3)(4)C.(1)(2)(3)(4)D.(1)(2)
6、(3)(4)(5)對于OLAP和OLTP的差別描繪,不正確的選項是:(C)A.OLAP主假如對于怎樣理解齊集的大批不同的數據.它與OTAP應用程序不同.B.與OLAP應用程序不同,OLTP應用程序包含大批相對簡單的事務.C.OLAP的特色在于事務量大,但事務內容比較簡單且重復率高.D.OLAP是以數據庫房為基礎的,但其最后數據根源與OLTP同樣均來自基層的數據庫系統,二者面對的用戶是同樣的.對于OLAP和OLTP的說法,以下不正確的選項是:(A)A.OLAP事務量大,但事務內容比較簡單且重復率高.B.OLAP的最后數據根源與OLTP不同樣.C.OLTP面對的是決議人員和高層管理人員.D.OLT
7、P以應用為核心,是應用驅動的.38.設X=1,2,3是屢次項集,則可由X產生_(C)_個關系規則。A、4B、5C、6D、7觀點分層圖是_(B)_圖。A、無向無環B、有向無環C、有向有環D、無向有環41.屢次項集、屢次閉項集、最大屢次項集之間的關系是:(C)A、屢次項集屢次閉項集=最大屢次項集B、屢次項集=屢次閉項集最大屢次項集C、屢次項集屢次閉項集最大屢次項集D、屢次項集=屢次閉項集=最大屢次項集44.在圖會合中發現一組公共子結構,這樣的任務稱為(B)A、屢次子集發掘B、屢次子圖發掘C、屢次數據項發掘D、屢次模式發掘48.以下哪些算法是分類算法,A,DBSCANB,C4.5C,K-MeanD,
8、EM(B)50.決議樹中不包含一下哪一種結點,A,根結點(rootnode)B,內部結點(internalnode)C,外面結點(externalnode)D,葉結點(leafnode)(C)53.以下哪項對于決議樹的說法是錯誤的(C)2/7冗余屬性不會對決議樹的正確率造成不利的影響子樹可能在決議樹中重復多次決議樹算法對于噪聲的擾亂特別敏感找尋最正確決議樹是NP完好問題在鑒于規則分類器的中,依照規則質量的某種胸懷對規則排序,保證每一個測試記錄都是由覆蓋它的“最好的”規格來分類,這類方案稱為(B)鑒于類的排序方案鑒于規則的排序方案鑒于胸懷的排序方案鑒于規格的排序方案。57.假如對屬性值的任一組合
9、,R中都存在一條規則加以覆蓋,則稱規則集R中的規則為(B)A,無序規則B,窮舉規則C,互斥規則D,有序規則58.假如規則集中的規則依照優先級降序擺列,則稱規則集是(D)A,無序規則B,窮舉規則C,互斥規則D,有序規則61.以下對于人工神經網絡(ANN)的描繪錯誤的有(A)A,神經網絡對訓練數據中的噪聲特別魯棒B,能夠辦理冗余特色C,訓練ANN是一個很耗時的過程D,起碼含有一個隱蔽層的多層神經網絡二、多項選擇題1.經過數據發掘過程所推倒出的關系和綱要常常被稱為:(AB)A.模型B.模式C.典范D.模具找尋數據集中的關系是為了找尋精準、方便而且有價值地總結了數據的某一特色的表示,這個過程包含了以下
10、哪些步驟?(ABCD)決定要使用的表示的特色和結構決定怎樣量化和比較不同表示擬合數據的利害選擇一個算法過程使評分函數最優決定用什么樣的數據管理原則以高效地實現算法。4.數據發掘算法的組件包含:(ABCD)A.模型或模型結構B.評分函數C.優化和搜尋方法D.數據管理策略5.以下哪些學科和數據發掘有親密聯系?(AD)A.統計B.計算機構成原理C.礦產發掘D.人工智能在現實世界的數據中,元組在某些屬性上缺乏值是常有的。描繪辦理該問題的各樣方法有:()A忽視元組C使用一個全局常量填補空缺值B使用屬性的均勻值填補空缺值D使用與給定元組屬同一類的全部樣本的均勻值使用最可能的值填補空缺值8.對于數據發掘中的
11、原始數據,存在的問題有:()A不一致B重復C不完好D含噪聲E維度高12.下邊列出的條目中,哪些是數據庫房的基本特色:(ACD)A.數據庫房是面向主題的B.數據庫房的數據是集成的C.數據庫房的數據是相對穩固的D.數據庫房的數據是反應歷史變化的數據庫房是面向事務的13.以下各項均是針對數據庫房的不同說法,你以為正確的有(BCDE)。數據庫房就是數據庫3/7B數據庫房是全部商業智能系統的基礎C數據庫房是面向業務的,支持聯機事務辦理(OLTP)D數據庫房支持決議而非事務辦理E數據庫房的主要目標就是幫助剖析,做長久性的戰略擬訂14.數據庫房在技術上的工作過程是:(ABCD)A.數據的抽取B.儲存和管理C
12、.數據的表現D.數據庫房設計E.數據的表現15.聯機剖析辦理包含以下哪些基本剖析功能?(BCD)A.聚類B.切片C.轉軸D.切塊E.分類利用Apriori算法計算屢次項集能夠有效降低計算屢次集的時間復雜度。在以下的購物籃中產生支持度不小于3的候選3-項集,在候選2-項集中需要剪枝的是(BD)ID項集面包、牛奶面包、尿布、啤酒、雞蛋牛奶、尿布、啤酒、可樂面包、牛奶、尿布、啤酒面包、牛奶、尿布、可樂A、啤酒、尿布B、啤酒、面包C、面包、尿布D、啤酒、牛奶18.Apriori算法的計算復雜度受_(ABCD)?_影響。A、支持度閥值B、項數(維度)C、事務數D、事務均勻寬度19.非屢次模式_(AD)_
13、A、其支持度小于閾值B、都是不讓人感興趣的C、包含負模式和負有關模式D、對異樣數據項敏感22.貝葉斯信念網絡(BBN)有以下哪些特色,A,結構網絡費時費勁B,對模型的過分問題特別魯棒C,貝葉斯網絡不合適辦理不完好的數據D,網絡結構確立后,增添變量相當麻煩(AB)三、判斷題數據發掘的主要任務是從數據中發現潛伏的規則,進而能更好的達成描繪數據、展望數據等任務。(對)數據發掘的目標不在于數據收集策略,而在于對于已經存在的數據進行模式的發掘。(對)圖發掘技術在社會網絡剖析中飾演了重要的角色。(對)模式為對數據集的全局性總結,它對整個丈量空間的每一點做出描繪;模型則對變量變化空間的一個有限地區做出描繪。
14、(錯)5.找尋模式和規則主假如對數據進行擾亂,使其切合某種規則以及模式。(錯)6.離群點能夠是合法的數據對象或許值。(對)7.失散屬性老是擁有有限個值。(錯)8.噪聲和偽像是數據錯誤這一同樣表述的兩種叫法。(錯)9.用于分類的失散化方法之間的根本差別在于能否使用類信息。(對)10.特色提取技術其實不依靠于特定的領域。(錯)12.定量屬性能夠是整數值或許是連續值。(對)DSS主假如鑒于數據庫房.聯機數據剖析和數據發掘技術的應用。(對)OLAP技術重視于把數據庫中的數據進行剖析、變換成協助決議信息,是繼數據庫技術4/7發展以后迅猛發展起來的一種新技術。(對)17.數據庫房中間層OLAP服務器只好采
15、納關系型OLAP(錯)18數據庫房系統的構成部分包含數據庫房,庫房管理,數據抽取,剖析工具等四個部分.(錯)21.關系規則發掘過程是發現知足最小支持度的全部項集代表的規則。(錯)24.假如規則不知足置信度閾值,則形如的規則必定也不知足置信度閾值,此中是X的子集。(對)25.擁有較高的支持度的項集擁有較高的置信度。(錯)26.聚類(clustering)是這樣的過程:它找出描繪并區分數據類或觀點的模型(或函數),以便能夠使用模型展望類標志未知的對象類。(錯)分類和回歸都可用于展望,分類的輸出是失散的類型值,而回歸的輸出是連續數值。(對)Bayes法是一種在已知后驗概率與類條件概率的狀況下的模式分類方法,待分樣本的分類結果取決于各種域中樣本的全體。(錯)5/7僅供個人用于學習、研究;不得用于商業用途。Forpersonaluseonlyinstudyandresearch;notforcommercialuse.Nurfrdenpers?nlichenfrStudien,Forschung,zukommerziellenZweckenverwendetwerden.Pourltudeetlarechercheuniquementfinspersonnelles;despasdesfinscommerciales.,.
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 產科個人總結
- 學校綜合辦管理制度
- 學生工分制管理制度
- 學院瑜伽室管理制度
- 安檢崗保安管理制度
- 安置房水電管理制度
- 完善綜合部管理制度
- 客戶管理部管理制度
- 室內安全與管理制度
- 家委會記賬管理制度
- 2024年昆明市公安局招聘勤務輔警真題
- 口腔實習生崗前培訓課件
- 小學生數學學習習慣的培養講座
- DeepSeek+AI大模型賦能制造業智能化供應鏈解決方案
- 自動生成的文檔-202504081202-70
- 2025河南省豫地科技集團有限公司社會招聘169人筆試參考題庫附帶答案詳解析集合
- 鋼結構檢測管理制度
- 2025年河南省洛陽市中考一模歷史試題(含答案)
- 2025年度專業技術人員繼續教育公需科目考試題(附答案)
- 《陸上風電場工程概算定額》NBT 31010-2019
- 2023 版《中國近現代史綱要》 課后習題答案
評論
0/150
提交評論