


版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、-.z.z.一、選擇題此題共 5 道小題,每題 2 分,共 10 分數據倉庫是隨著時間變化的,下面的描述不正確的選項是 (C)。數據倉庫隨時間的變化不斷增加新的數據內容捕捉到的新數據會覆蓋原來的快照數據倉庫隨事件變化不斷刪去舊的數據內容有關數據倉庫的開發特點,不正確的描述(B 。數據倉庫使用的需求在開發初期就要明確數據倉庫開發要從數據出發分析和處理更靈活,且沒有固定的模式在有關數據倉庫測試,以下說法不正確的選項是 (D。測試和系統測試。當數據倉庫的每個單獨組件完成后,就需要對他們進展單元測試。系統的集成測試需要對數據倉庫的所有組件進展大量的功能測試和回歸測試。在測試之前沒必要制定詳細的測試方案
2、。關于根本數據的元數據是指 (D)。根本元數據與數據源、數據倉庫、數據集市和應用程序等構造相關的信息根本元數據包括與企業相關的管理方面的數據和信息根本元數據包括日志文件和簡歷執行處理的時序調度信息下面關于數據粒度的描述不正確的選項是 (C)。粒度是指數據倉庫小數據單元的詳細程度和級別數據越詳細,粒度就越小,級別也就越高數據綜合度越高,粒度也就越大,級別也就越高粒度的具體劃分將直接影響數據倉庫中的數據量以及查詢質量關于OLAP 的特性,下面正確的選項是D) (1)快速性 (2)可分析性 (3)多維性 (4)信息性 (5)共享A. (1) (2) (3)B. (2) (3) (4)C. (1) (
3、2) (3) (4)D. (1) (2) (3) (4) (5)關于OLAP 和OLTP 的區別描述,不正確的選項是: (C)OLAP 主要是關于如何理解聚集的大量不同的數據,它與OTAP 應用程序不同。與OLAP 應用程序不同,OLTPOLAPOLAP 是以數據倉庫為根底的,但其最終數據來源與OLTP 一樣均來自底層的數據庫系統,兩者面對的用戶是一樣的。關于OLAP 和OLTP 的說法,以下不正確的選項是: (A)OLAPOLAP 的最終數據來源與OLTPOLTPOLTPOLAP 技術的核心(D。在線性對用戶的快速響應互操作性多維分析*超市研究銷售紀錄數據后發現,買啤酒的人很大概率也會購置尿
4、布,這種屬于數據掘的哪類問.(A)關聯規則B. 聚類C. 分類D. 自然語言處理分析型CRM C功能可以讓 CRM 對所進展的銷售活動相關信息進展存儲和理,將客戶所發生的交易與互動事件轉化為有意義、高獲利的銷售商機。促銷管理B. 個性化和標準化C. 客戶分析和建模D. 客戶溝通運用關鍵績效指標法設計組織關鍵績效指標依次經過以下幾個步驟AA.確定關鍵成功領域、確定關鍵績效要素、確定關鍵績效指標方案目標、實施目標、評價結果、反響D.確定長期整體目標、確定短期目標什么是KDD. (A)A. 知識發現 B. 領域知識發現C. 文檔知識發現D. 動態知識發現呼叫中心是一種基于D的一種新的綜合信息效勞系統
5、A IT 技術B CTI 技術C WEB 技術D CRM技術.(C)頻繁模式挖掘B. 分類和預測C. 數據預處理D. 數據流挖掘.(B)分類B. 聚類C. 關聯分析D. 隱馬爾可夫鏈使用交互式的和可視化的技術,對數據進展探索屬于數據挖掘的哪一類任.A探索性數據分析B. 建模描述C. 預測建模D. 尋找模式和規則.(B)探索性數據分析B. 建模描述C. 預測建模D. 尋找模式和規則任務.(C)根據內容檢索B. 建模描述C. 預測建模D. 尋找模式和規則務.(A)根據內容檢索B. 建模描述C. 預測建模D. 尋找模式和規則21(D)A. 變量代換B. 離 散化C. 聚集D. 估計遺漏值下面哪個不屬
6、于數據的屬性類( D)A.標稱B.序數區間D. 相 異在上題中,屬于定量的屬性類型(C)A.標稱B.序數C. 區間D.相異只有非零值才重要的二元屬性被稱( C)。A.計數屬性B.離散屬性C. 非對稱的二元屬性D. 對稱屬性以下哪種方法不屬于特征選擇的標準方法 (D)。嵌入B.過濾C.包裝下面不屬于創立新屬性的相關方法的(C)。特征提取B. 特征修改C. 映射數據到新的空間D. 特征構造下面哪個屬于映射數據到新的空間的方. (A) A.傅立葉變換B. 特征加權C.漸進抽樣D. 維歸企業所建立的預測模型的好壞取決于模型(A)上的表現效果。得分集B. 訓 練集C. 測 試集D. 評價集客戶在經濟活動
7、中具有多重身份,下面哪一種不是其身份之(C)。行為身份B. 所有權身份C. 學習身份D. 決策身份以下四條描述中,正確的一條(B)。企業實施數據挖掘,必須要有數據倉庫。企業要實施數據挖掘最好的方式是請編外專家。來的現成模型設計之初的假設相吻合。在建模的時侯,增益最高的模型就是最好的模型。數據挖掘算法(D)形式來組織數據。行B. 列C. 記錄D.表 格企業要建立預測模型,需準備建模數據集,以下四條描述建模數據集正確的選項(B)。數據越多越好。盡可能多的適合的數據。得分集數據是建模集數據的一局部。以上三條都正確。K均值類別偵測要求輸入的數據類型必須(B)。整型B. 數 值型C. 字 符型D. 邏輯
8、型在決策樹和累計增益圖的關系轉化過程圖中決策樹*一頁節點的增益與累計增益圖的(D)相對應。線段長度B. 線段斜率C. 相對應的線段長度D. 相對應的線段斜率企業為提升每個客戶的價值,應實(C)最優化。促銷活動B. 預算最優化C. 客戶最優化D. 三者都不是數據挖掘的經典案例“啤酒與尿布試驗最主要是應用(C)數據挖掘方法。分類B. 預測C. 組合或關聯法則D. 聚 類企業成功實施數據挖掘, 需要以(B)知識或技術。預先的規劃B.對商業文體的理解C. 綜合商業知識和技能D. 都需要以下哪個不是專門用于可視化時間空間數據的技(B)A.等高線圖 B. 餅圖C.曲面圖D.矢量場圖在抽樣方法中,當適宜的樣
9、本容量很難確定時,可以使用的抽樣方法是 (D)A.有放回的簡單隨機抽樣B. 無放回的簡單隨機抽樣C. 分層抽樣D.漸進抽樣設*=1,2,3是頻繁項集,則可*產(C個關聯規則A. 4 B. 5 C. 6 D. 7概念分層圖(B圖。無向無環 B. 有向無環C. 有向有環D. 無向有環以下哪些算法是分類算法B。A.DBSCAN B. C4.5 C. K-Mean D. EM以下哪些分類方法可以較好地防止樣本的不平衡問題A。 A. KNN B. SVM Bayes D. 神經網絡以下關于人工神經網絡ANN的描述錯誤的有 (A。神經網絡對訓練數據中的噪聲非常魯棒可以處理冗余特征訓練ANN至少含有一個隱藏
10、層的多層神經網絡通過聚集多個分類器的預測來提高分類準確率的技術稱為 (A) 。組(ensemble)B. 聚 (aggregate)C. 合 (bination)D. 投(voting)簡單地將數據對象集劃分成不重疊的子集,使得每個數據對象恰在一個子集中,這種類類型稱作B。層次聚類B. 劃分聚類C. 非互斥聚類D. 模糊聚類在根本 K 均值算法里,當鄰近度函數采用A的時候,適宜的質心是簇中各點的位數A. 曼哈頓距離B. 平方歐幾里德距離C. 余弦距離D. Bregman散度 C 是一個觀測值,它與其他觀測值的差異如此之大,以至于疑心它是由不同的機產生的A. 邊界點B. 質心C. 離 群點D.
11、核心點 48. 檢測一元正態分布中的離群點,屬于異常檢測中的基于 A 的離群點檢測。統計方法B. 鄰 近度C. 密度D. 聚類技術DBSCAN 在最壞情況下的時間復雜度是 B A. O(m)B. O(m2)C. m)D. O(m*log m)關于 K 均值和DBSCAN 的比擬,以下說法不正確的選項是 AA. K 均值丟棄被它識別為噪聲的對象,而DBSCAN 一般聚類所有對象。B. K而 DBSCANC. K 均值很難處理非球形的簇和不同大小的簇,DBSCAN 可以處理不同大小和不同形狀的簇。D. K 均值可以發現不是明顯別離的簇,即便簇有重疊也可以發現,但是DBSCAN 會合并有重疊的簇。A
12、 探索性數據分析B. 建模描述C. 預測建模D. 尋找模式和規52.下面哪種不屬于數據預處理的方. (D)A 變量代換B 離散化C 聚集D 估計遺漏值二、判斷題此題共 10 道小題,每題 1 分,共 10 分 T 1商務智能指收集、轉換、分析和發布數據的過程,目的是為了更好的決策。 F 2數據分析是整合企業原始數據的第一步,包括數據抽取、轉換和裝載三個過程。 T 3維是人們觀察數據的特定角度,是考慮問題時的一類屬性。 F 4獨立的數據集市架構的優點是企業內數據一致,不會產生信息孤島。 T 5. 星型模型的核心是事實表,事實表把各種不同的維表連接起來。 F值。 T 7衡量客戶忠誠的唯一尺度就是客
13、戶是否重復或持久地購置企業的產品或者效勞。 T 8在BI 中,DW 是前提和根底,負責統一數據規則的處理和存儲。 F 9客戶效勞管理是對客戶意見或投訴以及售前、售中、售后效勞進展管理。 F 10. 平衡計分卡共包括三個層面,分別是財務層面、客戶層面、內部業務流程層面。 T 11數據挖掘的主要任務是從數據中發現潛在的規則,從而能更好的完成描述數據、預測數據等任務。 F 12在聚類分析當中,簇內的相似性越大,簇間的差異越大,聚類的效果就越差。 F 13OLAP 是用來協助企業對響應事件或事務的日常商務活動進展處理。 T 14數據倉庫是面向主題的、集成的、穩定的、隨時間變化的數據集合,用以支持管理決
14、策的過程。 T 15. 數據預處理是整合企業原始數據的第一步,包括數據抽取、轉換和裝載三個過程。 F 16C4.5 決策樹算法是國際上最早、最有影響力的決策樹算法, T 17平衡計分卡是從財務、客戶、內部運營、學習與成長四個角度,將組織的戰略落實為可操作的衡量指標和目標值的一種新型績效管理體系。 F 18客戶效勞管理是對客戶意見或投訴以及售前、售中、售后效勞進展管理。 F 19. 企業績效管理的目的在于進一步加強本錢的事前控制,同時有助于通過盈虧分析,輔助產品科學的報價。FFTF3FFID3TC4.5FFTFFTSQL Server 2005FFTFT數據挖掘的目標不在于數據采集策略,而在于對
15、于已經存在的數據進展模式的開掘。 T 圖挖掘技術在社會網絡分析中扮演了重要的角色 T模式為對數據集的全局性總結,它對整個測量空間的每一點做出描述;模型則對變量化空間的一個有限區域做出描述 F尋找模式和規則主要是對數據進展干擾,使其符種規則以及模式F 離群點可以是合法的數據對象或者值。 T離散屬性總是具有有限個值。 F噪聲和偽像是數據錯誤這一一樣表述的兩種叫法。F用于分類的離散化方法之間的根本區別在于是否使用類信息。T特征提取技術并不依賴于特定的領域。FF定量屬性可以是整數值或者是連續值。T49. 可視化技術對于分析的數據類型通常不是專用性的。T50. DSS 主要是基于數據倉庫、聯機數據分析和
16、數據挖掘技術的應用F51. OLAP 技術側重于把數據庫中的數據進展分析、轉換成輔助決策信息是繼數據庫技術開展之后迅猛開展起來的一種新技術T52. 商業智能系統與一般交易系統之間在系統設計上的主要區別在于:后者把構造強加于商務之 上,一旦系統設計完畢,其程序和規則不會輕易改變;而前者則是一個學習型系統,能自適應商務不斷變化的要求T53. 數據倉庫中間層 OLAP 效勞器只能采用關系型OLAPF54數據倉庫系統的組成局部包括數據倉庫、倉庫管理、數據抽取、分 析工具等四個局部。 (F)55.WebF 56.F 57. 聚類clusteringF58.(T)59. 對于 SVM本對分類結果沒有影響T
17、60. Bayes 法是一種在后驗概率與類條件概率的情況下的模式分類方法,待分樣本的分類結果取決于各類域中樣本的全體。 (F)三、名詞解釋此題共 4 道小題,每題 5 分,共 20 分1.商務智能決策,提升企業競爭力。數據倉庫數據倉庫是面向主題的、集成的、穩定的、隨時間變化的數據集合,用以支持管理決策的過程。數據集成供全面的數據共享。OLAPOLAP 是使分析人員、管理人員或執行人員能夠從多種角度對從原始數據中轉化出來的、能夠真正為用戶所理解的、并真實反映企業維特性的信息進展快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟件技術。數據挖掘數據挖掘是從大量的、不完全的、有噪聲的、模糊的
18、、隨機的數據中提取正確的、有用的、未知的、綜合的以及人們感興趣的知識并用于決策支持的過程。孤立點:指數據庫中包含的一些與數據的一般行為或模型不一致的異常數據。01小數定標標準化。聚類:是將物理或抽象對象的集合分組成為多個類或簇(cluster中的對象之間具有較高的相似度,而不同簇中的對象差異較大。ROLAP通常采用星型或雪花型架構,由一個事實表和多個維度表構成。數據歸約:縮小數據的取值范圍,使其更適合于數據挖掘算法的需要,并且能夠得到和原始數據一樣的分析結果。以認為是以時間為關鍵屬性的關聯知識。掘的典型方法,可用于對新樣本進展分類。遺傳算法:是一種優化搜索算法,它首先產生一個初始可行解群體,然
19、后對這個群體通 創造、獲取和使用知識的過程知識的創造、儲存、分享、應用和更新Web 挖掘:Web 挖掘是從大量Web 文檔的集合C 中發現隱含的、有用的模式P 的過程: CP 。四、簡答題此題共 5 道小題,每題 6 分,共 30 分1實現商務智能的四個階段是什么.答:實現商務智能的四個階段是數據預處理、建立數據倉庫、數據分析及數據展現2 分1 分數據倉庫則是處理海量數據的根底; 1 分數據分析是表達系統智能的關鍵,一般采用OLAP 和 DM1 分數據展現則主要保障系統分析結果的可視化1 分2. 數據庫系統的局限性雜。面這些細節數據會分散決策者的注意力。當事務型處理環境和分析型處理環境在同一個
20、數據庫系統中的混亂。對于外部數據中的一些非構造化數據,數據庫系統常常是無能為力。 3座模式,因為它能對多個相關的主題建模3市,流行星型或雪花模式,因為它們都適合對單個主題建模3 分4. OLAP 的特點快速性Fast:用戶對OLAP 的快速反響能力有很高的要求。可分析性Analysis:OLAP 系統應能處理與應用有關的任何邏輯分析和統計分析。多維性 Multidimensional:多維性是 OLAP 的關鍵屬性。系統必須提供對數據的多維視圖和分析,包括對層次維和多重層次維的完全支持。信息性Information:OLAP 系統應能及時獲得信息,并且管理大容量信息。5簡述OLAP 的根本操作
21、有哪些.答:OLAP 的根本操作有:(Slice and 2鉆取(Drill) :鉆取包含向下鉆取(Drill-down(Drill-up)/上卷(Roll-up的深度與維所劃分的層次相對應2旋轉(Rotate)/(Pivot):通過旋轉可以得到不同視角的數據2 分6簡述OLAP 與數據挖掘的區別和聯系。答:OLAP 側重于與用戶的交互、快速的響應速度及提供數據的多維視圖,而數據挖掘則注重自動發現隱藏在數據中的模式和有用信息,盡管允許用戶指導這一過程3 分OLAP 深度,可以發現OLAP 所不能發現的更為復雜、細致的信息3 分7何謂數數據挖掘的功能包括:概念描述、關聯分析、分類與預測、聚類分析
22、、趨勢分析、孤立點分析以及偏差分析等。3 分為數據挖掘算法提供完整、干凈、準確、有針對性的數據,減少算法的計算量,提高挖掘效率和準確程度。簡述數據預處理方法和內容。數據清洗:包括填充空缺值,識別孤立點,去掉噪聲和無關數據。據源的數據匹配問題、數值沖突問題和冗余問題等。數據變換:將原始數據轉換成為適合數據挖掘的形式。包括對數據的匯總、聚集、概化、標準化,還可能需要進展屬性的重構。數據一樣的分析結果。聚類分析;分類分析;關聯分析;序列模式挖掘;回歸分析;時間序列分析。數據挖掘中的數據需要采用以下格式: 所有數據應該在一個表格/數據庫視圖中 每一行對應于與業務問題相關的一個案例 忽略具有單一值/幾乎
23、單一值的列 忽略所有行的值都不同的列 刪除所有同義列 對于預測模型,目標列必須是可識別的12簡述K-近鄰分類法的根本思想。答:根本思想:K近鄰分類是基于類比學習的,每個樣本代表d 維空間的一個點。3 分當給定一個未知樣本時,K-近鄰分類法將搜索樣本空間,找出最接近未知樣本的 K 個訓練樣本,這K 個訓練樣本是未知樣本的K 個“近鄰。 3 分13關聯規則挖掘能發現什么知識.簡述其挖掘的根本步驟。答:關聯規則挖掘有助于發現交易數據庫中不同商品之間的聯系,找出顧客購置行為模式。2 分minSupp集稱其為頻繁項集2 分然后由頻繁項集生成關聯規則,對于頻繁項集A,假設BA,且置信度confidence
24、(B不小于最小置信度minConf,則 BA-B 構 成 關 聯 規 則 2 分 14遺傳算法與傳統尋優算法相比有什么特.遺傳算法為群體搜索,有利于尋找到全局最優解; 遺傳算法處理的對象是個體而不是參變量,具有廣泛的應用領域;遺傳算法具有隱含并行性,具有更高的運行效率。*本的類別。決策樹方法是數據挖掘中非常有效的分類方法。簡述K輸入:簇的數目k 和包含n 個對象的數據集。輸出:k 個簇,使平方誤差準則最小。步驟:任意選擇k 個對象作為初始的簇中心;計算其它對象與這k 個中心的距離,然后把每個對象歸入離它“最近的簇; 2 第 3簡述構造智能CRM答:構建一個完整的智能CRM 系統的幾個步驟:CR
25、MCRM 系統的企換,從而保證客戶數據的一致性2建立客戶數據倉庫:規劃數據倉庫,以企業的業務模型為根底,確定需要建立能夠描述制定數據存儲策略以及各種商業規則等2 分1 分118何謂數據倉庫.為什么要建立數據倉庫.3 分建立數據倉庫的目的有 3一是為了解決企業決策分析中的系統響應問題規模決策分析的響應速度。統事務數據庫不能直接提供的。3 分簡述數據倉庫設計的三級模型及其根本內容。2關系模式、定義記錄系統2 分I/O率和維護代價等。數據、建立廣義索引等2 分聚類是將物理或抽象對象的集合分組成為多個類或簇(cluster對象之間具有較高的相似度,而不同簇中的對象差異較大3 分3 分它與信息檢索之間有
26、以下幾方面的區別1 分于用戶的信息需求,是用戶無法預知的。著眼點不同:信息檢索著重于文檔中字、詞和;而文本挖掘在于理解文本的內容和構造。求的文本子集;而文本挖掘是為了提醒文本中隱含的知識。簡潔性等來衡量所發現知識的有效性、可用性和可理解性。使用場合不同:文本挖掘是比信息檢索更高層次的技術,可用于信息檢索技術不能解決的 5 分遺傳算法為群體搜索,有利于尋找到全局最優解; 遺傳算法處理的對象是個體而不是參變量,具有廣泛的應用領域;遺傳算法具有隱含并行性,具有更高的運行效率6 分商務智能應用趨勢BI 到操作型或者實時型的關注價值、關注數據質量。商務智能開展的特點實時;標準化;嵌入式商務智能;移動商務智能;群眾化趨勢;供給商的動向; 易 用 性 。 26內涵不同;知識的管理過程和技術不同;關注的只是類型不同;面向的用戶不同。27. Web 日志挖掘的應用獲取用戶訪問模式信息,理解用戶的意圖和行為分析用戶的存取模式,為用戶提供個性化的效勞確定的潛在客戶群,合理制訂網絡廣告策略等改良Web 站點的構造,使點隨時間、用戶需求的變化而不斷調整對日志數據進展多種統計,包括頻繁訪問頁、單位時間訪問頻度、訪問量的時間分布等利用關聯規則確定相關Web 查詢查詢修正六、論述題共 10 分1、試舉
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 人教版八年級化學期末模擬試題(帶解析)
- 凸面鏡的成像特點及應用測試題帶答案
- 速度的概念及計算公式測試題帶答案
- 計算機教師資格證初中科三測試題及答案
- excel基礎測試題及答案及答案
- 《荀子勸學》測試題帶答案
- 同步電機驅動器電流傳感器容錯控制研究
- 微小通道內高溫水的空化流動特性可視化研究
- 基于噬菌體展示技術的抗AbOmpA多肽的篩選及其抗菌作用研究
- 基于患者椎旁肌力學特性的脊柱側彎矯形器設計研究
- Oxford-3000-牛津核心詞匯
- 散打裁判的基本手勢
- 《延安我把你追尋》課件
- 石材產品質量保證書
- 部編版五年級語文下冊作文范文全套
- 兒童意外傷害預防-ppt課件
- 衰老生物學ppt課件(PPT 57頁)
- 外研版必修二短語(教師版)
- 企業部門單位工傷事故報告書
- 河南中考B補全對話練習補全對話
- 機械制圖(一)自學考試試題和答案
評論
0/150
提交評論