第5章 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的DSS_第1頁(yè)
第5章 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的DSS_第2頁(yè)
第5章 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的DSS_第3頁(yè)
第5章 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的DSS_第4頁(yè)
第5章 數(shù)據(jù)倉(cāng)庫(kù)與數(shù)據(jù)挖掘的DSS_第5頁(yè)
已閱讀5頁(yè),還剩173頁(yè)未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說(shuō)明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請(qǐng)進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡(jiǎn)介

1、1.“1.“數(shù)據(jù)太多,信息不足數(shù)據(jù)太多,信息不足”的現(xiàn)狀的現(xiàn)狀2. 2. 異構(gòu)環(huán)境的數(shù)據(jù)源異構(gòu)環(huán)境的數(shù)據(jù)源 據(jù)美國(guó)據(jù)美國(guó)幸福幸福雜志所列的全球雜志所列的全球20002000家大家大公司中已有公司中已有90%90%將將InternetInternet網(wǎng)絡(luò)和數(shù)據(jù)倉(cāng)庫(kù)這兩網(wǎng)絡(luò)和數(shù)據(jù)倉(cāng)庫(kù)這兩項(xiàng)技術(shù)列入企業(yè)計(jì)劃。項(xiàng)技術(shù)列入企業(yè)計(jì)劃。 數(shù)據(jù)倉(cāng)庫(kù)是數(shù)據(jù)倉(cāng)庫(kù)是19951995年開(kāi)始盛行起來(lái)的。年開(kāi)始盛行起來(lái)的。 (1 1)W.H.InmonW.H.Inmon在在建立數(shù)據(jù)倉(cāng)庫(kù)建立數(shù)據(jù)倉(cāng)庫(kù)一書(shū)中,對(duì)數(shù)據(jù)倉(cāng)庫(kù)的定義為:一書(shū)中,對(duì)數(shù)據(jù)倉(cāng)庫(kù)的定義為: 數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)數(shù)據(jù)倉(cāng)庫(kù)是面向主題的、集成的、穩(wěn)定的

2、,不同時(shí)間的數(shù)據(jù)集合,用于支持經(jīng)定的,不同時(shí)間的數(shù)據(jù)集合,用于支持經(jīng)營(yíng)管理中決策制定過(guò)程。營(yíng)管理中決策制定過(guò)程。(2 2)SASSAS軟件研究所定義:軟件研究所定義: 數(shù)據(jù)倉(cāng)庫(kù)是一種管理技術(shù),旨在通過(guò)數(shù)據(jù)倉(cāng)庫(kù)是一種管理技術(shù),旨在通過(guò)通暢、合理、全面的信息管理,達(dá)到有通暢、合理、全面的信息管理,達(dá)到有效的決策支持。效的決策支持。 傳統(tǒng)數(shù)據(jù)庫(kù)用于事務(wù)處理,也叫操作型處理,傳統(tǒng)數(shù)據(jù)庫(kù)用于事務(wù)處理,也叫操作型處理,是指對(duì)數(shù)據(jù)庫(kù)聯(lián)機(jī)進(jìn)行日常操作,即對(duì)一個(gè)或一組記是指對(duì)數(shù)據(jù)庫(kù)聯(lián)機(jī)進(jìn)行日常操作,即對(duì)一個(gè)或一組記錄的查詢和修改,主要為企業(yè)特定的應(yīng)用服務(wù)的。用錄的查詢和修改,主要為企業(yè)特定的應(yīng)用服務(wù)的。用戶關(guān)心

3、的是響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性。戶關(guān)心的是響應(yīng)時(shí)間,數(shù)據(jù)的安全性和完整性。 數(shù)據(jù)倉(cāng)庫(kù)用于決策支持,也稱分析型處理,用于數(shù)據(jù)倉(cāng)庫(kù)用于決策支持,也稱分析型處理,用于決策分析,它是建立決策支持系統(tǒng)(決策分析,它是建立決策支持系統(tǒng)(DSSDSS)的基礎(chǔ)。)的基礎(chǔ)。操作型數(shù)據(jù)(操作型數(shù)據(jù)(DBDB數(shù)據(jù))與數(shù)據(jù))與分析型數(shù)據(jù)(分析型數(shù)據(jù)(DWDW數(shù)據(jù))之間的差別為:數(shù)據(jù))之間的差別為:DBDB 數(shù)據(jù)數(shù)據(jù) DWDW 數(shù)據(jù)數(shù)據(jù) 細(xì)節(jié)的細(xì)節(jié)的 綜合或提煉的綜合或提煉的 在存取時(shí)準(zhǔn)確的在存取時(shí)準(zhǔn)確的 代表過(guò)去的數(shù)據(jù)代表過(guò)去的數(shù)據(jù) 可更新的可更新的 不更新不更新 一次操作數(shù)據(jù)量小一次操作數(shù)據(jù)量小 一次操作數(shù)據(jù)量

4、大一次操作數(shù)據(jù)量大 面向應(yīng)用面向應(yīng)用 面向分析面向分析 支持管理支持管理 支持決策支持決策 主題是數(shù)據(jù)歸類(lèi)的標(biāo)準(zhǔn),每一個(gè)主題基本對(duì)應(yīng)一主題是數(shù)據(jù)歸類(lèi)的標(biāo)準(zhǔn),每一個(gè)主題基本對(duì)應(yīng)一個(gè)宏觀的分析領(lǐng)域。個(gè)宏觀的分析領(lǐng)域。 例如,銀行的數(shù)據(jù)倉(cāng)庫(kù)的主題:客戶例如,銀行的數(shù)據(jù)倉(cāng)庫(kù)的主題:客戶 DWDW的客戶數(shù)據(jù)來(lái)源:的客戶數(shù)據(jù)來(lái)源: 從從銀行儲(chǔ)蓄銀行儲(chǔ)蓄DBDB、信用卡、信用卡DBDB、貸款、貸款DBDB等三個(gè)等三個(gè)DBDB中抽中抽取同一客戶的數(shù)據(jù)整理而成。取同一客戶的數(shù)據(jù)整理而成。 在在DWDW中分析客戶數(shù)據(jù),可決定是否繼續(xù)給予貸款。中分析客戶數(shù)據(jù),可決定是否繼續(xù)給予貸款。面向主題面向主題汽車(chē)人壽健康意外

5、傷亡操作性環(huán)境操作性環(huán)境應(yīng)應(yīng) 用用顧客保險(xiǎn)單保險(xiǎn)費(fèi)索賠數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)主主 題題 數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前,必須經(jīng)過(guò)加工與集成。數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)之前,必須經(jīng)過(guò)加工與集成。 對(duì)不同的數(shù)據(jù)來(lái)源進(jìn)行統(tǒng)一數(shù)據(jù)結(jié)構(gòu)和編碼。對(duì)不同的數(shù)據(jù)來(lái)源進(jìn)行統(tǒng)一數(shù)據(jù)結(jié)構(gòu)和編碼。統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的同名異統(tǒng)一原始數(shù)據(jù)中的所有矛盾之處,如字段的同名異義,異名同義,單位不統(tǒng)一,字長(zhǎng)不一致等。義,異名同義,單位不統(tǒng)一,字長(zhǎng)不一致等。 將原始數(shù)據(jù)結(jié)構(gòu)做一個(gè)從面向應(yīng)用到面向主題將原始數(shù)據(jù)結(jié)構(gòu)做一個(gè)從面向應(yīng)用到面向主題的大轉(zhuǎn)變。的大轉(zhuǎn)變。2.2 集成集成 數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù) 應(yīng)用A m,f應(yīng)用B 1,0應(yīng)用C x,y應(yīng)用D

6、男,女 數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù) m,f編碼應(yīng)用A 管道cm應(yīng)用B 管道inches應(yīng)用C 管道m(xù)cf應(yīng)用D 管道yds管道cm屬性度量應(yīng)用A 描述應(yīng)用B 描述應(yīng)用C 描述應(yīng)用D 描述應(yīng)用A char(10)應(yīng)用B dec fixed(9,2)應(yīng)用C pic 9999999應(yīng)用D char(12)多重信息源 ?描述char(12)沖突的鍵碼集成集成 數(shù)據(jù)倉(cāng)庫(kù)中包括了大量的歷史數(shù)據(jù)。數(shù)據(jù)經(jīng)集數(shù)據(jù)倉(cāng)庫(kù)中包括了大量的歷史數(shù)據(jù)。數(shù)據(jù)經(jīng)集成進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)后是極少或根本不更新的。成進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)后是極少或根本不更新的。非易失性非易失性插入刪除插入修改刪除訪問(wèn)修改訪問(wèn)數(shù)據(jù)的逐個(gè)記錄方式處理數(shù)據(jù)的逐個(gè)記錄方式處理數(shù)據(jù)的批

7、量載入數(shù)據(jù)的批量載入/訪問(wèn)訪問(wèn)數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù) 數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)時(shí)限在數(shù)據(jù)倉(cāng)庫(kù)內(nèi)的數(shù)據(jù)時(shí)限在510510年,故數(shù)據(jù)的鍵年,故數(shù)據(jù)的鍵碼包含時(shí)間項(xiàng),標(biāo)明數(shù)據(jù)的歷史時(shí)期,這適合碼包含時(shí)間項(xiàng),標(biāo)明數(shù)據(jù)的歷史時(shí)期,這適合DSSDSS進(jìn)行時(shí)間趨勢(shì)分析。進(jìn)行時(shí)間趨勢(shì)分析。 而數(shù)據(jù)庫(kù)只包含當(dāng)前數(shù)據(jù),即存取某一時(shí)間的而數(shù)據(jù)庫(kù)只包含當(dāng)前數(shù)據(jù),即存取某一時(shí)間的正確的有效的數(shù)據(jù)。正確的有效的數(shù)據(jù)。2.4 隨時(shí)間變化隨時(shí)間變化數(shù)據(jù)庫(kù)數(shù)據(jù)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)時(shí)間期限:當(dāng)前到6090天 記錄更新鍵碼結(jié)構(gòu)可能包括也可能不 包括時(shí)間元素時(shí)間期限:510年 數(shù)據(jù)的復(fù)雜快照鍵碼結(jié)構(gòu)包括時(shí)間元素 (5 5)DWDW中數(shù)據(jù)量大。中數(shù)據(jù)量

8、大。 大型大型DWDW是一個(gè)是一個(gè)TBTB(1000GB1000GB)級(jí)數(shù)據(jù)庫(kù)問(wèn))級(jí)數(shù)據(jù)庫(kù)問(wèn)題(一般為題(一般為10GB10GB級(jí)相當(dāng)于一般數(shù)據(jù)庫(kù)級(jí)相當(dāng)于一般數(shù)據(jù)庫(kù)100MB100MB的的100100倍)倍) 需要一個(gè)巨大的硬件平臺(tái)需要一個(gè)巨大的硬件平臺(tái) 需要一個(gè)并行的數(shù)據(jù)庫(kù)系統(tǒng)需要一個(gè)并行的數(shù)據(jù)庫(kù)系統(tǒng) 最好的數(shù)據(jù)倉(cāng)庫(kù)是大的和昂貴的。最好的數(shù)據(jù)倉(cāng)庫(kù)是大的和昂貴的。 (6 6)是信息的概括和聚集。)是信息的概括和聚集。 操作性數(shù)據(jù)倉(cāng)庫(kù) J Jones女1945年7月20日。J Jones去年有兩張罰單一次大事故。 J JonesMain大街123號(hào)已婚。 J Jones兩個(gè)孩子高血壓。人壽保險(xiǎn)汽

9、車(chē)保險(xiǎn)房產(chǎn)保險(xiǎn)健康保險(xiǎn)J Jones女1945年7月20日出生去年兩張罰單一次大事故已婚兩個(gè)孩子高血壓。顧客 (7 7)對(duì)計(jì)算機(jī)軟硬件要求較高:需要一)對(duì)計(jì)算機(jī)軟硬件要求較高:需要一巨大硬件平臺(tái)和并行計(jì)算的數(shù)據(jù)庫(kù)系統(tǒng)。巨大硬件平臺(tái)和并行計(jì)算的數(shù)據(jù)庫(kù)系統(tǒng)。 1 數(shù)據(jù)的粒度2 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織結(jié)構(gòu)3 數(shù)據(jù)的分割4 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織形式5 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織模式6 數(shù)據(jù)的追加1 粒度粒度n粒度是指數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)單位中保存數(shù)據(jù)的細(xì)化或總合程度的級(jí)別。n細(xì)化程度越高,粒度級(jí)就越小;細(xì)化程度越低,粒度級(jí)就越大。n粒度細(xì)節(jié)的級(jí)別n粒度的劃分決定了數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)量的大小和查詢的詳細(xì)程度。n多重粒度粒度的一

10、個(gè)例子粒度的一個(gè)例子高細(xì)化低細(xì)化每月200個(gè)記錄每月40,000個(gè)字節(jié)每月一個(gè)記錄每月200個(gè)字節(jié)通過(guò)檢索可以回答無(wú)細(xì)節(jié)無(wú)法回答詢問(wèn)某一電話的細(xì)節(jié) 近期基本數(shù)據(jù):近期基本數(shù)據(jù):是最近時(shí)期的業(yè)務(wù)數(shù)據(jù),是數(shù)是最近時(shí)期的業(yè)務(wù)數(shù)據(jù),是數(shù)據(jù)倉(cāng)庫(kù)用戶最感興趣的部分,數(shù)據(jù)量大。據(jù)倉(cāng)庫(kù)用戶最感興趣的部分,數(shù)據(jù)量大。 歷史基本數(shù)據(jù):歷史基本數(shù)據(jù):近期基本數(shù)據(jù)隨時(shí)間的推移,近期基本數(shù)據(jù)隨時(shí)間的推移,由數(shù)據(jù)倉(cāng)庫(kù)的時(shí)間控制機(jī)制轉(zhuǎn)為歷史基本數(shù)據(jù)。由數(shù)據(jù)倉(cāng)庫(kù)的時(shí)間控制機(jī)制轉(zhuǎn)為歷史基本數(shù)據(jù)。 輕度綜合數(shù)據(jù):輕度綜合數(shù)據(jù):是從近期基本數(shù)據(jù)中提取出的,是從近期基本數(shù)據(jù)中提取出的,這 層 數(shù) 據(jù) 是 按 時(shí) 間 段 選 取 ,

11、或 者 按 數(shù) 據(jù) 屬 性這 層 數(shù) 據(jù) 是 按 時(shí) 間 段 選 取 , 或 者 按 數(shù) 據(jù) 屬 性(attributesattributes)和內(nèi)容()和內(nèi)容(contentscontents)進(jìn)行綜合。)進(jìn)行綜合。 高度綜合數(shù)據(jù)層:高度綜合數(shù)據(jù)層:這一層的數(shù)據(jù)是在輕度綜合這一層的數(shù)據(jù)是在輕度綜合數(shù)據(jù)基礎(chǔ)上的再一次綜合,是一種準(zhǔn)決策數(shù)據(jù)。數(shù)據(jù)基礎(chǔ)上的再一次綜合,是一種準(zhǔn)決策數(shù)據(jù)。2 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織結(jié)構(gòu)2 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織結(jié)構(gòu)元數(shù)據(jù)元數(shù)據(jù)高度綜合級(jí)高度綜合級(jí)輕度綜合級(jí)輕度綜合級(jí)(數(shù)據(jù)集市數(shù)據(jù)集市)銷(xiāo)售細(xì)節(jié)級(jí)銷(xiāo)售細(xì)節(jié)級(jí)2000-2001操作型轉(zhuǎn)換

12、操作型轉(zhuǎn)換早期細(xì)節(jié)級(jí)早期細(xì)節(jié)級(jí)每月銷(xiāo)售每月銷(xiāo)售1994-2001每周銷(xiāo)售每周銷(xiāo)售1994-2001當(dāng)前細(xì)節(jié)級(jí)當(dāng)前細(xì)節(jié)級(jí)銷(xiāo)售細(xì)節(jié)級(jí)銷(xiāo)售細(xì)節(jié)級(jí)1994-19993 分割分割n分割將當(dāng)前細(xì)節(jié)數(shù)據(jù)分散到各自的物理單元中去以便能分別獨(dú)立處理,以提高數(shù)據(jù)處理效率。n分片數(shù)據(jù)分割后的獨(dú)立單元。n數(shù)據(jù)的分割 提高了數(shù)據(jù)管理的靈活性重構(gòu)、索引、重組、恢復(fù)、監(jiān)控n分割的標(biāo)準(zhǔn):日期、地域、業(yè)務(wù)領(lǐng)域。分割的一個(gè)例子分割的一個(gè)例子分片9分片8分片72001分片6分片5分片42000分片3分片2分片11999事故保險(xiǎn)生命保險(xiǎn)健康保險(xiǎn)4 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織形式數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織形式n簡(jiǎn)單堆積數(shù)據(jù)n輪轉(zhuǎn)綜合數(shù)據(jù)n簡(jiǎn)化直接數(shù)據(jù)

13、n連續(xù)數(shù)據(jù)簡(jiǎn)單堆積文件簡(jiǎn)單堆積文件 1月1日 1月2日 1月3日 2月1日 2月2日 2月3日 3月1日 3月2日 3月3日 輪轉(zhuǎn)綜合文件輪轉(zhuǎn)綜合文件 星期一 星期二 星期天 第一周 第二周 第五周 一月 二月 十二月 簡(jiǎn)化直接文件簡(jiǎn)化直接文件數(shù)據(jù)庫(kù)快照姓名 顧客號(hào) 地址張平 C960100 北京王珂 C960101 上海劉輝 C960102 天津李強(qiáng) C960103 成都 . . . 一月份顧客表操作性數(shù)據(jù)生成簡(jiǎn)化直接文件生成簡(jiǎn)化直接文件連續(xù)文件連續(xù)文件姓名 顧客號(hào) 地址張平 C020100 北京王珂 C020101 上海張順 C020102 天津李強(qiáng) C020103 成都姓名 顧客號(hào) 地址

14、張平 C020100 北京王珂 C020101 上海張順 C020101 廣州李強(qiáng) C020103 成都劉誠(chéng) C020105 杭州姓名 顧客號(hào) 日期 地址張平 C020100 1-2月 北京王珂 C020101 1-2月 上海張順 C020103 1月 天津張順 C020103 2月 廣州李強(qiáng) C020103 1-2月 成都劉誠(chéng) C020105 2月 杭州1月份顧客表2月份顧客表1-2月份顧客表元數(shù)據(jù)(元數(shù)據(jù)(Metadata)n元數(shù)據(jù)關(guān)于數(shù)據(jù)的數(shù)據(jù),它描述了數(shù)據(jù)的結(jié)構(gòu)、內(nèi)容、碼、索引等。n元數(shù)據(jù)的內(nèi)容不僅為數(shù)據(jù)倉(cāng)庫(kù)的創(chuàng)建提供必要的信息、描述和定義,還為DSS分析人員訪問(wèn)數(shù)據(jù)倉(cāng)庫(kù)提供直接的或輔

15、助的信息。數(shù)據(jù)倉(cāng)庫(kù)中元數(shù)據(jù)必須包含的內(nèi)容數(shù)據(jù)倉(cāng)庫(kù)中元數(shù)據(jù)必須包含的內(nèi)容n數(shù)據(jù)倉(cāng)庫(kù)的主題描述: 主題名、主體的公共碼鍵、有關(guān)描述信息等n外部數(shù)據(jù)和非結(jié)構(gòu)化數(shù)據(jù)的描述: 外部數(shù)據(jù)源名、存儲(chǔ)地點(diǎn)、存儲(chǔ)內(nèi)容簡(jiǎn)述 n記錄系統(tǒng)定義: 主題名、屬性名、數(shù)據(jù)源系統(tǒng)、源表名、源屬性名n邏輯模型的定義: 關(guān)系名、屬性1、屬性2屬性nn數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)的轉(zhuǎn)換規(guī)則n數(shù)據(jù)的抽取歷史n粒度的定義n數(shù)據(jù)分割的定義n廣義索引:廣義索引名,屬性1、屬性2屬性nn有關(guān)存儲(chǔ)路徑和結(jié)構(gòu)的描述 它是現(xiàn)有的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源的描述信息。這它是現(xiàn)有的業(yè)務(wù)系統(tǒng)的數(shù)據(jù)源的描述信息。這類(lèi)元數(shù)據(jù)是是對(duì)不同平臺(tái)上的數(shù)據(jù)源的物理結(jié)構(gòu)和類(lèi)元數(shù)據(jù)是是對(duì)不同

16、平臺(tái)上的數(shù)據(jù)源的物理結(jié)構(gòu)和含義的描述。具體為:含義的描述。具體為: 數(shù)據(jù)源中所有物理數(shù)據(jù)結(jié)構(gòu),包括所有的數(shù)據(jù)數(shù)據(jù)源中所有物理數(shù)據(jù)結(jié)構(gòu),包括所有的數(shù)據(jù)項(xiàng)及數(shù)據(jù)類(lèi)型。項(xiàng)及數(shù)據(jù)類(lèi)型。 所有數(shù)據(jù)項(xiàng)的業(yè)務(wù)定義。所有數(shù)據(jù)項(xiàng)的業(yè)務(wù)定義。 每個(gè)數(shù)據(jù)項(xiàng)更新的頻率,以及由誰(shuí)或那個(gè)過(guò)程每個(gè)數(shù)據(jù)項(xiàng)更新的頻率,以及由誰(shuí)或那個(gè)過(guò)程更新的說(shuō)明。更新的說(shuō)明。 每個(gè)數(shù)據(jù)項(xiàng)的有效值。每個(gè)數(shù)據(jù)項(xiàng)的有效值。(1 1)關(guān)于數(shù)據(jù)源的元數(shù)據(jù))關(guān)于數(shù)據(jù)源的元數(shù)據(jù) 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型是星型模型。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型是星型模型。 通常企業(yè)數(shù)據(jù)模型被用作建立倉(cāng)庫(kù)數(shù)通常企業(yè)數(shù)據(jù)模型被用作建立倉(cāng)庫(kù)數(shù)據(jù)模型的起始點(diǎn),再對(duì)模型加以修改和變據(jù)模型的起始點(diǎn),再

17、對(duì)模型加以修改和變換。換。(2 2)關(guān)于數(shù)據(jù)模型的元數(shù)據(jù))關(guān)于數(shù)據(jù)模型的元數(shù)據(jù) 這類(lèi)元數(shù)據(jù)是數(shù)據(jù)源與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)間的這類(lèi)元數(shù)據(jù)是數(shù)據(jù)源與數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)間的映射。映射。 當(dāng)數(shù)據(jù)源中的一個(gè)數(shù)據(jù)項(xiàng)與數(shù)據(jù)倉(cāng)庫(kù)建立當(dāng)數(shù)據(jù)源中的一個(gè)數(shù)據(jù)項(xiàng)與數(shù)據(jù)倉(cāng)庫(kù)建立了映射關(guān)系,就應(yīng)該記下這些數(shù)據(jù)項(xiàng)發(fā)生的任了映射關(guān)系,就應(yīng)該記下這些數(shù)據(jù)項(xiàng)發(fā)生的任何變換或變動(dòng)。即用元數(shù)據(jù)反映數(shù)據(jù)倉(cāng)庫(kù)中的何變換或變動(dòng)。即用元數(shù)據(jù)反映數(shù)據(jù)倉(cāng)庫(kù)中的數(shù)據(jù)項(xiàng)是從哪個(gè)特定的數(shù)據(jù)源填充的,經(jīng)過(guò)那數(shù)據(jù)項(xiàng)是從哪個(gè)特定的數(shù)據(jù)源填充的,經(jīng)過(guò)那些轉(zhuǎn)換,變換和加載過(guò)程。些轉(zhuǎn)換,變換和加載過(guò)程。(3 3)關(guān)于數(shù)據(jù)倉(cāng)庫(kù)映射的元數(shù)據(jù))關(guān)于數(shù)據(jù)倉(cāng)庫(kù)映射的元數(shù)據(jù) 這類(lèi)元數(shù)據(jù)是

18、數(shù)據(jù)倉(cāng)庫(kù)中信息的使用情況描述。這類(lèi)元數(shù)據(jù)是數(shù)據(jù)倉(cāng)庫(kù)中信息的使用情況描述。 數(shù)據(jù)倉(cāng)庫(kù)的用戶最關(guān)心的是兩類(lèi)元數(shù)據(jù):數(shù)據(jù)倉(cāng)庫(kù)的用戶最關(guān)心的是兩類(lèi)元數(shù)據(jù): (1 1)元數(shù)據(jù)告訴數(shù)據(jù)倉(cāng)庫(kù)中有什么數(shù)據(jù),它們從哪里來(lái)。)元數(shù)據(jù)告訴數(shù)據(jù)倉(cāng)庫(kù)中有什么數(shù)據(jù),它們從哪里來(lái)。即如何按主題查看數(shù)據(jù)倉(cāng)庫(kù)的內(nèi)容。即如何按主題查看數(shù)據(jù)倉(cāng)庫(kù)的內(nèi)容。 (2 2)元數(shù)據(jù)提供已有的可重復(fù)利用的查詢語(yǔ)言信息。如果)元數(shù)據(jù)提供已有的可重復(fù)利用的查詢語(yǔ)言信息。如果某個(gè)查詢能夠滿足他們的需求,或者與他們的愿望相似,他們某個(gè)查詢能夠滿足他們的需求,或者與他們的愿望相似,他們就可以再次使用那些查詢而不必從頭開(kāi)始編程。就可以再次使用那些查詢而不必

19、從頭開(kāi)始編程。 關(guān)于數(shù)據(jù)倉(cāng)庫(kù)使用的元數(shù)據(jù)能幫助用戶到數(shù)據(jù)倉(cāng)庫(kù)查詢所關(guān)于數(shù)據(jù)倉(cāng)庫(kù)使用的元數(shù)據(jù)能幫助用戶到數(shù)據(jù)倉(cāng)庫(kù)查詢所需要的信息,用于解決企業(yè)問(wèn)題。需要的信息,用于解決企業(yè)問(wèn)題。5 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織模式數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)組織模式n星型模式(star schema)n雪花模式(snowflake schema) n混合模式事實(shí)表事實(shí)表維維量量維表維表中間有一個(gè)單一表,沿半徑向外連接到多個(gè)表是星型模式的擴(kuò)展,每一個(gè)點(diǎn)都沿半徑向外連接到多個(gè)點(diǎn)星型模式星型模式產(chǎn)品標(biāo)識(shí)符類(lèi)標(biāo)識(shí)符大類(lèi)標(biāo)識(shí)符產(chǎn)品名類(lèi)名大類(lèi)名現(xiàn)貨存量銷(xiāo)售表產(chǎn)品標(biāo)識(shí)符商店標(biāo)識(shí)符日期標(biāo)識(shí)符單 價(jià)銷(xiāo)售金額日期表日期標(biāo)識(shí)符日月季年商店標(biāo)識(shí)符市名省名國(guó)名

20、洲名商店表產(chǎn)品表雪雪花花模模式式銷(xiāo)售表產(chǎn)品標(biāo)識(shí)符產(chǎn)品標(biāo)識(shí)符商店標(biāo)識(shí)符商店標(biāo)識(shí)符日期標(biāo)識(shí)符日期標(biāo)識(shí)符單 價(jià)銷(xiāo)售金額日期表日期標(biāo)識(shí)符日月月月季月表季年季表產(chǎn)品表產(chǎn)品標(biāo)識(shí)符類(lèi)標(biāo)識(shí)符產(chǎn)品名現(xiàn)貨存量類(lèi)表類(lèi)標(biāo)識(shí)符大類(lèi)標(biāo)識(shí)符類(lèi)名大類(lèi)表大類(lèi)標(biāo)識(shí)符大類(lèi)名商店表商店標(biāo)識(shí)符市名市名市名省名市表省名國(guó)名省表國(guó)名洲名國(guó)表6 數(shù)據(jù)追加n時(shí)標(biāo)方法時(shí)標(biāo)方法 對(duì)新插入或更新的數(shù)據(jù)記錄,加入更新時(shí)的時(shí)標(biāo),掃描整個(gè)數(shù)據(jù)庫(kù)。nDELTA文件文件 由應(yīng)用生成的,記錄了應(yīng)用所改變的所有內(nèi)容。DELTA文件的應(yīng)用并不普遍。n前后映象文件對(duì)比前后映象文件對(duì)比 占用大量資源。n日志文件日志文件 是DB的固有機(jī)制,不會(huì)影響到OLTP的性能。數(shù)據(jù)

21、冗余。數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)初裝完成后,再向數(shù)據(jù)倉(cāng)庫(kù)輸入數(shù)據(jù)的過(guò)程。n數(shù)據(jù)倉(cāng)庫(kù)工作范圍和成本常常是巨大的。開(kāi)發(fā)數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)工作范圍和成本常常是巨大的。開(kāi)發(fā)數(shù)據(jù)庫(kù)是代價(jià)很高、時(shí)間較長(zhǎng)的大項(xiàng)目。庫(kù)是代價(jià)很高、時(shí)間較長(zhǎng)的大項(xiàng)目。n提供更緊密集成的數(shù)據(jù)集市就應(yīng)運(yùn)產(chǎn)生。提供更緊密集成的數(shù)據(jù)集市就應(yīng)運(yùn)產(chǎn)生。n目前,全世界對(duì)數(shù)據(jù)倉(cāng)庫(kù)總投資的一半以上均集中目前,全世界對(duì)數(shù)據(jù)倉(cāng)庫(kù)總投資的一半以上均集中在數(shù)據(jù)集市上。在數(shù)據(jù)集市上。n數(shù)據(jù)集市(數(shù)據(jù)集市(Data MartsData Marts)是一種更小、更集)是一種更小、更集中的數(shù)據(jù)倉(cāng)庫(kù),為公司提供分析商業(yè)數(shù)據(jù)的中的數(shù)據(jù)倉(cāng)庫(kù),為公司提供分析商業(yè)數(shù)據(jù)的一條廉價(jià)途徑。一條廉

22、價(jià)途徑。nData MartsData Marts是指具有特定應(yīng)用的數(shù)據(jù)倉(cāng)庫(kù),是指具有特定應(yīng)用的數(shù)據(jù)倉(cāng)庫(kù),主要針對(duì)某個(gè)應(yīng)用或者具體部門(mén)級(jí)的應(yīng)用,主要針對(duì)某個(gè)應(yīng)用或者具體部門(mén)級(jí)的應(yīng)用,支持用戶獲得競(jìng)爭(zhēng)優(yōu)勢(shì)或者找到進(jìn)入新市場(chǎng)支持用戶獲得競(jìng)爭(zhēng)優(yōu)勢(shì)或者找到進(jìn)入新市場(chǎng)的具體解決方案。的具體解決方案。獨(dú)立數(shù)據(jù)集市獨(dú)立數(shù)據(jù)集市(Independent (Independent Data Mart)Data Mart)從屬數(shù)據(jù)集市從屬數(shù)據(jù)集市(Dependent (Dependent Data Mart)Data Mart)數(shù)據(jù)源數(shù)據(jù)源分析工具分析工具獨(dú)立數(shù)據(jù)集市兩種數(shù)據(jù)集市兩種數(shù)據(jù)集市分析工具中央數(shù)據(jù)倉(cāng)庫(kù)數(shù)

23、據(jù)源數(shù)據(jù)源從屬數(shù)據(jù)集市分析工具分析工具 1 1、規(guī)模是小的、規(guī)模是小的2 2、特定的應(yīng)用、特定的應(yīng)用3 3、面向部門(mén)、面向部門(mén)4 4、由業(yè)務(wù)部門(mén)定義,設(shè)計(jì)和開(kāi)發(fā)、由業(yè)務(wù)部門(mén)定義,設(shè)計(jì)和開(kāi)發(fā)5 5、由業(yè)務(wù)部門(mén)管理和維護(hù)、由業(yè)務(wù)部門(mén)管理和維護(hù)6 6、快速實(shí)現(xiàn)、快速實(shí)現(xiàn)7 7、購(gòu)買(mǎi)較便宜、購(gòu)買(mǎi)較便宜8 8、投資快速回收、投資快速回收9 9、工具集的緊密集成、工具集的緊密集成1010、更詳細(xì)的、預(yù)先存在的數(shù)據(jù)倉(cāng)庫(kù)的摘要子集、更詳細(xì)的、預(yù)先存在的數(shù)據(jù)倉(cāng)庫(kù)的摘要子集1111、可升級(jí)到完整的數(shù)據(jù)倉(cāng)庫(kù)、可升級(jí)到完整的數(shù)據(jù)倉(cāng)庫(kù) (1 1)數(shù)據(jù)倉(cāng)庫(kù)是基于整個(gè)企業(yè)的數(shù)據(jù)模)數(shù)據(jù)倉(cāng)庫(kù)是基于整個(gè)企業(yè)的數(shù)據(jù)模型建立的,是

24、面向企業(yè)范圍內(nèi)的主題;而數(shù)型建立的,是面向企業(yè)范圍內(nèi)的主題;而數(shù)據(jù)集市是按照某一特定部門(mén)的數(shù)據(jù)模型建立據(jù)集市是按照某一特定部門(mén)的數(shù)據(jù)模型建立的;的; (2 2)部門(mén)的主題與企業(yè)的主題之間可能)部門(mén)的主題與企業(yè)的主題之間可能存在關(guān)聯(lián),可能無(wú)關(guān)聯(lián);存在關(guān)聯(lián),可能無(wú)關(guān)聯(lián); (3 3) 數(shù)據(jù)集市的數(shù)據(jù)組織一般采用星型數(shù)據(jù)集市的數(shù)據(jù)組織一般采用星型模型,而大型數(shù)據(jù)倉(cāng)庫(kù)的組織采用第三范式。模型,而大型數(shù)據(jù)倉(cāng)庫(kù)的組織采用第三范式。 5.2.1數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)構(gòu)數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)結(jié)構(gòu) 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)由數(shù)據(jù)倉(cāng)庫(kù)(數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)由數(shù)據(jù)倉(cāng)庫(kù)(DWDW)、倉(cāng)庫(kù)管理和分析工)、倉(cāng)庫(kù)管理和分析工具三部分組成。具三部分組成。(1 1)

25、定義部分)定義部分 用于定義和建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。它包括:用于定義和建立數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。它包括: (1)(1)設(shè)計(jì)和定義數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù)設(shè)計(jì)和定義數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)庫(kù) (2)(2)定義數(shù)據(jù)來(lái)源定義數(shù)據(jù)來(lái)源 (3)(3)確定從源數(shù)據(jù)向數(shù)據(jù)倉(cāng)庫(kù)復(fù)制數(shù)據(jù)時(shí)的清理確定從源數(shù)據(jù)向數(shù)據(jù)倉(cāng)庫(kù)復(fù)制數(shù)據(jù)時(shí)的清理和增強(qiáng)規(guī)則和增強(qiáng)規(guī)則(2 2)數(shù)據(jù)獲取部分)數(shù)據(jù)獲取部分 該部件把數(shù)據(jù)從源數(shù)據(jù)中提取出來(lái),依定義部該部件把數(shù)據(jù)從源數(shù)據(jù)中提取出來(lái),依定義部件的規(guī)則,抽取、轉(zhuǎn)化和裝載數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)。件的規(guī)則,抽取、轉(zhuǎn)化和裝載數(shù)據(jù)進(jìn)入數(shù)據(jù)倉(cāng)庫(kù)。 (3 3)管理部分)管理部分 它用于管理數(shù)據(jù)倉(cāng)庫(kù)的工作,包括:它用于管理數(shù)據(jù)倉(cāng)庫(kù)的工作

26、,包括: (1 1)對(duì)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的維護(hù))對(duì)數(shù)據(jù)倉(cāng)庫(kù)中數(shù)據(jù)的維護(hù) (2 2)把倉(cāng)庫(kù)數(shù)據(jù)送出給分散的倉(cāng)庫(kù)服務(wù)器或)把倉(cāng)庫(kù)數(shù)據(jù)送出給分散的倉(cāng)庫(kù)服務(wù)器或DSSDSS用戶用戶 (3 3)對(duì)倉(cāng)庫(kù)數(shù)據(jù)的安全、歸檔、備份、恢復(fù))對(duì)倉(cāng)庫(kù)數(shù)據(jù)的安全、歸檔、備份、恢復(fù)等處理工作等處理工作(4 4)信息目錄部件(元數(shù)據(jù))信息目錄部件(元數(shù)據(jù)) 數(shù)據(jù)倉(cāng)庫(kù)的目錄數(shù)據(jù)是元數(shù)據(jù),由三部分組成:數(shù)據(jù)倉(cāng)庫(kù)的目錄數(shù)據(jù)是元數(shù)據(jù),由三部分組成: 技術(shù)目錄:技術(shù)目錄:由定義部件生成,關(guān)于數(shù)據(jù)源、目標(biāo)、清理規(guī)則、由定義部件生成,關(guān)于數(shù)據(jù)源、目標(biāo)、清理規(guī)則、變換規(guī)則以及數(shù)據(jù)源和倉(cāng)庫(kù)之間的映象信息。變換規(guī)則以及數(shù)據(jù)源和倉(cāng)庫(kù)之間的映象信息。

27、 業(yè)務(wù)目錄:業(yè)務(wù)目錄:由倉(cāng)庫(kù)管理員生成,關(guān)于倉(cāng)庫(kù)數(shù)據(jù)的來(lái)源及當(dāng)前由倉(cāng)庫(kù)管理員生成,關(guān)于倉(cāng)庫(kù)數(shù)據(jù)的來(lái)源及當(dāng)前值;預(yù)定義的查詢和報(bào)表細(xì)節(jié);合法性要求等。值;預(yù)定義的查詢和報(bào)表細(xì)節(jié);合法性要求等。 信息引導(dǎo)器:信息引導(dǎo)器:使用戶容易訪問(wèn)倉(cāng)庫(kù)數(shù)據(jù)。利用固定查詢或建使用戶容易訪問(wèn)倉(cāng)庫(kù)數(shù)據(jù)。利用固定查詢或建立新的查詢,生成暫時(shí)的或永久的倉(cāng)庫(kù)數(shù)據(jù)集合的能力等。立新的查詢,生成暫時(shí)的或永久的倉(cāng)庫(kù)數(shù)據(jù)集合的能力等。(5)DBMS部件部件 數(shù)據(jù)倉(cāng)庫(kù)的存儲(chǔ)形式仍為關(guān)系型數(shù)據(jù)庫(kù),因此需要利用數(shù)據(jù)倉(cāng)庫(kù)的存儲(chǔ)形式仍為關(guān)系型數(shù)據(jù)庫(kù),因此需要利用DBMS。 分析工具集分兩類(lèi)工具:分析工具集分兩類(lèi)工具:(1 1)查詢工具)查詢

28、工具 數(shù)據(jù)倉(cāng)庫(kù)的查詢不是指對(duì)記錄級(jí)數(shù)據(jù)的查數(shù)據(jù)倉(cāng)庫(kù)的查詢不是指對(duì)記錄級(jí)數(shù)據(jù)的查詢,而是指對(duì)分析要求的查詢。詢,而是指對(duì)分析要求的查詢。 一般包含:一般包含: 可視化工具:可視化工具:以圖形化方式展示數(shù)據(jù),可以圖形化方式展示數(shù)據(jù),可以幫助了解數(shù)據(jù)的結(jié)構(gòu),關(guān)系以及動(dòng)態(tài)性。以幫助了解數(shù)據(jù)的結(jié)構(gòu),關(guān)系以及動(dòng)態(tài)性。 多維分析工具(多維分析工具(OLAPOLAP工具)工具): : 通過(guò)對(duì)信息的多種可能的觀察形式進(jìn)行快通過(guò)對(duì)信息的多種可能的觀察形式進(jìn)行快速、一致和交互性的存取,這樣便利用戶對(duì)數(shù)速、一致和交互性的存取,這樣便利用戶對(duì)數(shù)據(jù)進(jìn)行深入的分析和觀察。據(jù)進(jìn)行深入的分析和觀察。 多維數(shù)據(jù)的每一維代表對(duì)數(shù)據(jù)

29、的一個(gè)特定多維數(shù)據(jù)的每一維代表對(duì)數(shù)據(jù)的一個(gè)特定的觀察視角,如時(shí)間、地域、業(yè)務(wù)等。的觀察視角,如時(shí)間、地域、業(yè)務(wù)等。(2 2)數(shù)據(jù)挖掘工具)數(shù)據(jù)挖掘工具 從大量數(shù)據(jù)中挖掘具有規(guī)律性知識(shí),從大量數(shù)據(jù)中挖掘具有規(guī)律性知識(shí),需要利用數(shù)據(jù)挖掘(需要利用數(shù)據(jù)挖掘(Data MiningData Mining)工)工具。具。 數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用是一個(gè)典型的客戶數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用是一個(gè)典型的客戶/ /服務(wù)器(服務(wù)器(C/SC/S)結(jié)構(gòu)形)結(jié)構(gòu)形式。式。 數(shù)據(jù)倉(cāng)庫(kù)采用服務(wù)器結(jié)構(gòu),客戶端所做的工作有:客戶數(shù)據(jù)倉(cāng)庫(kù)采用服務(wù)器結(jié)構(gòu),客戶端所做的工作有:客戶交互、格式化查詢、結(jié)果顯示、報(bào)表生成等。交互、格式化查詢、結(jié)果顯示、報(bào)表生

30、成等。 服務(wù)器端完成各種輔助決策的服務(wù)器端完成各種輔助決策的SQLSQL查詢、復(fù)雜的計(jì)算和各查詢、復(fù)雜的計(jì)算和各類(lèi)綜合功能等。類(lèi)綜合功能等。 現(xiàn)在,越來(lái)越普通的一種形式是三層現(xiàn)在,越來(lái)越普通的一種形式是三層C/SC/S結(jié)構(gòu)形式,即在結(jié)構(gòu)形式,即在客戶與數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器之間增加一個(gè)多維數(shù)據(jù)分析(客戶與數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器之間增加一個(gè)多維數(shù)據(jù)分析(OLAPOLAP)服務(wù)器。服務(wù)器。客 戶 端OLAP 服 務(wù) 器數(shù) 據(jù) 倉(cāng) 庫(kù)服 務(wù) 器 OLAPOLAP服務(wù)器將加強(qiáng)和規(guī)范化決策支持的服務(wù)工服務(wù)器將加強(qiáng)和規(guī)范化決策支持的服務(wù)工作,集中和簡(jiǎn)化了原客戶端和數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器的部作,集中和簡(jiǎn)化了原客戶端和數(shù)據(jù)倉(cāng)庫(kù)服務(wù)器

31、的部分工作,降低了系統(tǒng)數(shù)據(jù)傳輸量。分工作,降低了系統(tǒng)數(shù)據(jù)傳輸量。 這種結(jié)構(gòu)形式工作效率更高。這種結(jié)構(gòu)形式工作效率更高。 數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)采用多維數(shù)據(jù)模型。數(shù)據(jù)倉(cāng)庫(kù)存儲(chǔ)采用多維數(shù)據(jù)模型。 維就是相同類(lèi)數(shù)據(jù)的集合,商店、時(shí)間和產(chǎn)品都是維。維就是相同類(lèi)數(shù)據(jù)的集合,商店、時(shí)間和產(chǎn)品都是維。各個(gè)商店的集合是一維,時(shí)間的集合是一維,商品的集合是各個(gè)商店的集合是一維,時(shí)間的集合是一維,商品的集合是一維。每一個(gè)商店、每一段時(shí)間、每一種商品就是某一維的一維。每一個(gè)商店、每一段時(shí)間、每一種商品就是某一維的一個(gè)成員。一個(gè)成員。 每一個(gè)銷(xiāo)售事實(shí)由一個(gè)特定的商品、一個(gè)特定的時(shí)間、每一個(gè)銷(xiāo)售事實(shí)由一個(gè)特定的商品、一個(gè)特定的時(shí)

32、間、一個(gè)特定的商品組成。一個(gè)特定的商品組成。 兩維表,如通常的電子表格。三維構(gòu)成立方體,若再增兩維表,如通常的電子表格。三維構(gòu)成立方體,若再增加一維,則圖形很難想象,也不容易在屏幕上畫(huà)出來(lái)。加一維,則圖形很難想象,也不容易在屏幕上畫(huà)出來(lái)。 聯(lián)機(jī)分析處理聯(lián)機(jī)分析處理(On Line Analytical On Line Analytical ProcessingProcessing,OLAPOLAP)的概念最早是由關(guān)系數(shù)據(jù)庫(kù)之的概念最早是由關(guān)系數(shù)據(jù)庫(kù)之父父E.F.CoddE.F.Codd于于19931993年提出的。年提出的。 在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,聯(lián)機(jī)分析處理是重要的數(shù)在數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)中,聯(lián)機(jī)分析處

33、理是重要的數(shù)據(jù)分析工具據(jù)分析工具。 OLAPOLAP的基本思想是從多方面和多角度以多維的的基本思想是從多方面和多角度以多維的形式來(lái)觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。形式來(lái)觀察企業(yè)的狀態(tài)和了解企業(yè)的變化。5.3.1 基本概念基本概念 OLAP是在是在OLTP的基礎(chǔ)上發(fā)展起來(lái)的。的基礎(chǔ)上發(fā)展起來(lái)的。 OLTP是以數(shù)據(jù)庫(kù)為基礎(chǔ)的,面對(duì)的是操作人員是以數(shù)據(jù)庫(kù)為基礎(chǔ)的,面對(duì)的是操作人員和低層管理人員,對(duì)基本數(shù)據(jù)的查詢和增、刪、改等和低層管理人員,對(duì)基本數(shù)據(jù)的查詢和增、刪、改等進(jìn)行處理。進(jìn)行處理。 OLAP是以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的數(shù)據(jù)分析處理。它是以數(shù)據(jù)倉(cāng)庫(kù)為基礎(chǔ)的數(shù)據(jù)分析處理。它有兩個(gè)特點(diǎn):有兩個(gè)特點(diǎn): 一是

34、在線性(一是在線性(On Line),由客戶機(jī)),由客戶機(jī)/服務(wù)器這種服務(wù)器這種體系結(jié)構(gòu)來(lái)完成的;體系結(jié)構(gòu)來(lái)完成的; 二是多維分析,這也是二是多維分析,這也是OLAP的核心所在。的核心所在。n聯(lián)機(jī)分析處理是是一種軟件技術(shù),他使分析人員能夠迅速、一致、交互地從各個(gè)方面觀察信息,以達(dá)到深入理解數(shù)據(jù)的目的。n聯(lián)機(jī)分析技術(shù)是共享多維信息的快速分析。一個(gè)3維的模型,3個(gè)維為:部門(mén),時(shí)間,銷(xiāo)售。三維立方體,三維表OLAP實(shí)例時(shí)間時(shí)間部門(mén)部門(mén)銷(xiāo)售銷(xiāo)售1998 1999汽車(chē)家具服裝 銷(xiāo)售量利潤(rùn)增長(zhǎng)% 它體現(xiàn)了四個(gè)特征:它體現(xiàn)了四個(gè)特征: (1)快速性)快速性:用戶對(duì)用戶對(duì)OLAP的快速反應(yīng)能力有很高的要的快速

35、反應(yīng)能力有很高的要求。求。 (2)可分析性)可分析性:OLAP系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)系統(tǒng)應(yīng)能處理任何邏輯分析和統(tǒng)計(jì)分析。計(jì)分析。 (3)多維性)多維性:系統(tǒng)必須提供對(duì)數(shù)據(jù)分析的多維視圖和分系統(tǒng)必須提供對(duì)數(shù)據(jù)分析的多維視圖和分析。析。 (4 4)信息性)信息性:OLAPOLAP系統(tǒng)應(yīng)能及時(shí)獲得信息,并且管理大系統(tǒng)應(yīng)能及時(shí)獲得信息,并且管理大容量的信息。容量的信息。 19931993年,年,E.F.CoddE.F.Codd提出提出OLAPOLAP的的1212條準(zhǔn)則,其主條準(zhǔn)則,其主要的準(zhǔn)則有:多維數(shù)據(jù)分析;客戶要的準(zhǔn)則有:多維數(shù)據(jù)分析;客戶/ /服務(wù)器結(jié)構(gòu);服務(wù)器結(jié)構(gòu);多用戶支持;一致的報(bào)表

36、性能等。多用戶支持;一致的報(bào)表性能等。 1.1.多維概念視圖多維概念視圖n企業(yè)的數(shù)據(jù)空間本身就是多維的。因此企業(yè)的數(shù)據(jù)空間本身就是多維的。因此OLAP的概念模型也應(yīng)是多維的。的概念模型也應(yīng)是多維的。n用戶可以對(duì)多維數(shù)據(jù)模型進(jìn)行切片、切用戶可以對(duì)多維數(shù)據(jù)模型進(jìn)行切片、切塊、旋轉(zhuǎn)坐標(biāo)或進(jìn)行多維的聯(lián)合(概括塊、旋轉(zhuǎn)坐標(biāo)或進(jìn)行多維的聯(lián)合(概括和聚集)分析。和聚集)分析。4.4.穩(wěn)定的報(bào)表性能穩(wěn)定的報(bào)表性能 報(bào)表操作不應(yīng)隨維數(shù)增加而削弱,報(bào)表操作不應(yīng)隨維數(shù)增加而削弱,即當(dāng)數(shù)據(jù)維數(shù)和數(shù)據(jù)的綜合層次增即當(dāng)數(shù)據(jù)維數(shù)和數(shù)據(jù)的綜合層次增加時(shí),提供的報(bào)表能力和響應(yīng)速度加時(shí),提供的報(bào)表能力和響應(yīng)速度不應(yīng)該有明顯的降低

37、。不應(yīng)該有明顯的降低。 5客戶/服務(wù)器體系結(jié)構(gòu) OLAP是建立在客戶是建立在客戶/ 服務(wù)器體系結(jié)構(gòu)上服務(wù)器體系結(jié)構(gòu)上的。的。 要求多維數(shù)據(jù)庫(kù)服務(wù)器能夠被不同的應(yīng)用要求多維數(shù)據(jù)庫(kù)服務(wù)器能夠被不同的應(yīng)用和工具所訪問(wèn)。和工具所訪問(wèn)。 8多用戶支持多用戶支持 當(dāng)多個(gè)用戶要在同一分析模式上并行工作,當(dāng)多個(gè)用戶要在同一分析模式上并行工作,需要這些功能的支持。需要這些功能的支持。 11靈活的報(bào)表生成靈活的報(bào)表生成 報(bào)表必須報(bào)表必須充分反映數(shù)據(jù)分析模型的多維充分反映數(shù)據(jù)分析模型的多維特征,并可按用戶需要的方式來(lái)顯示它。特征,并可按用戶需要的方式來(lái)顯示它。 OLAP OLAP是針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析。

38、是針對(duì)特定問(wèn)題的聯(lián)機(jī)數(shù)據(jù)訪問(wèn)和分析。 (1 1)變量)變量 :變量是數(shù)據(jù)的實(shí)際意義,即描述數(shù)據(jù)變量是數(shù)據(jù)的實(shí)際意義,即描述數(shù)據(jù)“是什么是什么”。 (2 2)維)維:維是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品:維是人們觀察數(shù)據(jù)的特定角度。如產(chǎn)品維、顧客維、時(shí)間維等。維、顧客維、時(shí)間維等。 (3 3)維的層次)維的層次:數(shù)據(jù)的細(xì)節(jié)不同程度為維的層次:數(shù)據(jù)的細(xì)節(jié)不同程度為維的層次。如日、月、季、年是時(shí)間維的層次。如日、月、季、年是時(shí)間維的層次。 (4 4)維成員)維成員:維的一個(gè)取值稱為該維的一個(gè)維成:維的一個(gè)取值稱為該維的一個(gè)維成員。如員。如“某年某月某日某年某月某日”是時(shí)間維的一個(gè)成員。是時(shí)間維的一個(gè)成

39、員。 (5 5)多維數(shù)組)多維數(shù)組:一個(gè)多維數(shù)組可以表示為:一個(gè)多維數(shù)組可以表示為:(維(維1 1,維,維2 2,維,維n n,變量),變量) 一個(gè)一個(gè)5 5維的結(jié)構(gòu),即(產(chǎn)品,地區(qū),時(shí)間,銷(xiāo)售維的結(jié)構(gòu),即(產(chǎn)品,地區(qū),時(shí)間,銷(xiāo)售渠道,銷(xiāo)售額)。渠道,銷(xiāo)售額)。(6 6)數(shù)據(jù)單元(單元格)數(shù)據(jù)單元(單元格): 多維數(shù)組的取值稱為數(shù)據(jù)單元。多維數(shù)組的取值稱為數(shù)據(jù)單元。 如:如:5 5維數(shù)據(jù)單元(牙膏,上海,維數(shù)據(jù)單元(牙膏,上海,19981998年年1212月,月,批發(fā),銷(xiāo)售額為批發(fā),銷(xiāo)售額為100000100000)。)。 (1 1)OLTPOLTPOLTPOLTP是低層人員利用計(jì)算機(jī)網(wǎng)絡(luò)對(duì)數(shù)

40、據(jù)庫(kù)中的數(shù)據(jù)是低層人員利用計(jì)算機(jī)網(wǎng)絡(luò)對(duì)數(shù)據(jù)庫(kù)中的數(shù)據(jù)進(jìn)行查詢、增、刪、改等操作,以完成事務(wù)處理工進(jìn)行查詢、增、刪、改等操作,以完成事務(wù)處理工作。作。OLTP利用數(shù)據(jù)庫(kù)快速地處理具體業(yè)務(wù)。利用數(shù)據(jù)庫(kù)快速地處理具體業(yè)務(wù)。OLTP應(yīng)用應(yīng)用要求多個(gè)查詢并行。要求多個(gè)查詢并行。 (2 2)OLAPOLAPOLAPOLAP是高層人員對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行信息分析處理。是高層人員對(duì)數(shù)據(jù)倉(cāng)庫(kù)進(jìn)行信息分析處理。 存取大量的數(shù)據(jù)存取大量的數(shù)據(jù) 包含聚集的數(shù)據(jù)包含聚集的數(shù)據(jù) 按層次對(duì)比不同時(shí)間周期的聚集數(shù)據(jù)按層次對(duì)比不同時(shí)間周期的聚集數(shù)據(jù) 以不同的方式來(lái)表現(xiàn)數(shù)據(jù)以不同的方式來(lái)表現(xiàn)數(shù)據(jù) 要包含數(shù)據(jù)元素之間的復(fù)雜的計(jì)算要包含數(shù)

41、據(jù)元素之間的復(fù)雜的計(jì)算 能夠快速的響應(yīng)用戶的查詢能夠快速的響應(yīng)用戶的查詢 (3 3)OLAPOLAP與與OLTPOLTP對(duì)比(對(duì)比表)對(duì)比(對(duì)比表)OLTPOLAP數(shù)據(jù)庫(kù)數(shù)據(jù)數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)細(xì)節(jié)性數(shù)據(jù)綜合性數(shù)據(jù)當(dāng)前數(shù)據(jù)歷史數(shù)據(jù)一次性處理的數(shù)據(jù)量小一次處理的數(shù)據(jù)量大對(duì)響應(yīng)時(shí)間要求高響應(yīng)時(shí)間合理用戶數(shù)量大用戶相對(duì)較少面向應(yīng)用,事務(wù)驅(qū)動(dòng)面向分析,分析驅(qū)動(dòng) MOLAPMOLAP和和ROLAPROLAP是是OLAPOLAP的兩種具體形式:的兩種具體形式: ROLAPROLAP是基于關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)方式建立是基于關(guān)系數(shù)據(jù)庫(kù)存儲(chǔ)方式建立的的OLAPOLAP。 多維數(shù)據(jù)映射成平面型的關(guān)系表。采用多維數(shù)據(jù)映射成平面型

42、的關(guān)系表。采用星型模型。星型模型。 MOLAP MOLAP是基于多維數(shù)據(jù)庫(kù)存儲(chǔ)方式建是基于多維數(shù)據(jù)庫(kù)存儲(chǔ)方式建立的立的OLAPOLAP;表現(xiàn)為;表現(xiàn)為“超立方超立方”結(jié)構(gòu),類(lèi)結(jié)構(gòu),類(lèi)似于多維數(shù)組的結(jié)構(gòu)。似于多維數(shù)組的結(jié)構(gòu)。 在分析中,需要在分析中,需要“旋轉(zhuǎn)旋轉(zhuǎn)”數(shù)據(jù)立方體數(shù)據(jù)立方體以及以及“切片切片” ” 、“切塊切塊”等操作。等操作。MOLAPMOLAP和和ROLAPROLAP的對(duì)比表的對(duì)比表MOLAPMOLAPROLAPROLAP固定維固定維可變維可變維維交叉計(jì)算維交叉計(jì)算多維視圖多維視圖行級(jí)計(jì)算行級(jí)計(jì)算超大型數(shù)據(jù)庫(kù)超大型數(shù)據(jù)庫(kù)讀讀- -寫(xiě)應(yīng)用寫(xiě)應(yīng)用維數(shù)據(jù)變化速度快維數(shù)據(jù)變化速度快數(shù)據(jù)集

43、市數(shù)據(jù)集市數(shù)據(jù)倉(cāng)庫(kù)數(shù)據(jù)倉(cāng)庫(kù)例如,以例如,以“產(chǎn)品、城市、時(shí)間產(chǎn)品、城市、時(shí)間”三維數(shù)據(jù),如三維數(shù)據(jù),如圖圖時(shí)間城市產(chǎn)品電視機(jī)電冰箱廣州上海9596 對(duì)三維數(shù)據(jù),通過(guò)對(duì)三維數(shù)據(jù),通過(guò)“切片切片” ” ,分別從城市和產(chǎn),分別從城市和產(chǎn)品等不同的角度觀察銷(xiāo)售情況:品等不同的角度觀察銷(xiāo)售情況: 電視機(jī)電冰箱廣州上海鉆取鉆取:例如,:例如,19951995年各部門(mén)銷(xiāo)售收入表如下:年各部門(mén)銷(xiāo)售收入表如下:對(duì)時(shí)間維進(jìn)行下鉆操作,獲得新表如下:對(duì)時(shí)間維進(jìn)行下鉆操作,獲得新表如下:1995年1996年部 門(mén)1季 度 2季 度 3季 度 4季 度 1季 度 2季 度 3季 度 4季 度部 門(mén)12002003501

44、50120200250140部 門(mén)225050150150200180230120部 門(mén)3200150180270180200170250旋轉(zhuǎn)前的數(shù)據(jù)旋轉(zhuǎn)前的數(shù)據(jù)1季度2季度3季度4季度部門(mén)95年96年95年96年95年96年95年96年部門(mén)1200120200200350250150140部門(mén)225020050180150230150120部門(mén)3200180150200180170270250旋轉(zhuǎn)后的數(shù)據(jù)旋轉(zhuǎn)后的數(shù)據(jù)OLAP的旋轉(zhuǎn)功能平面數(shù)據(jù)的坐標(biāo)軸轉(zhuǎn)換。12.78.5-4.38.9差量%-4432225402-299531102差量35000030000069000350000計(jì)劃3066

45、7732540266005381102現(xiàn)有其它汽車(chē)家具服裝銷(xiāo)售量199912.7-44322350000306677所有其他8.525402300000325402汽車(chē)-4.3-29956900066005家具8.931102350000381102服裝差量%差量計(jì)劃現(xiàn)有銷(xiāo)售量19991季度2季度3季度4季度年齡95年96年95年96年95年96年95年96年2010060805010050504050 x2030023011025027033020022050250210210280310270320250旋轉(zhuǎn)后再切片旋轉(zhuǎn)后再切片 1 1、基本代理操作、基本代理操作 “代理代理”是一些智能性

46、代理,當(dāng)系統(tǒng)處于某種特殊狀是一些智能性代理,當(dāng)系統(tǒng)處于某種特殊狀態(tài)時(shí)提醒分析員。態(tài)時(shí)提醒分析員。 (1 1)示警報(bào)告)示警報(bào)告 定義一些條件,一但條件滿足,系統(tǒng)會(huì)提醒分析員去定義一些條件,一但條件滿足,系統(tǒng)會(huì)提醒分析員去做分析。如每日?qǐng)?bào)告完成或月定貨完成等通知分析員作分做分析。如每日?qǐng)?bào)告完成或月定貨完成等通知分析員作分析。析。 (2 2)異常報(bào)告)異常報(bào)告 當(dāng)超出邊界條件時(shí)提醒分析員。如銷(xiāo)售情況已超出預(yù)當(dāng)超出邊界條件時(shí)提醒分析員。如銷(xiāo)售情況已超出預(yù)定義閾值的上限或下限時(shí)提醒分析員。定義閾值的上限或下限時(shí)提醒分析員。 2 2、計(jì)算能力、計(jì)算能力 計(jì)算引擎用于特定需求的計(jì)算或某種復(fù)雜計(jì)計(jì)算引擎用于

47、特定需求的計(jì)算或某種復(fù)雜計(jì)算。算。 3 3、模型計(jì)算、模型計(jì)算 增加模型,如增加系統(tǒng)優(yōu)化、統(tǒng)計(jì)分析、趨增加模型,如增加系統(tǒng)優(yōu)化、統(tǒng)計(jì)分析、趨勢(shì)分析等模型,以提高決策分析能力。勢(shì)分析等模型,以提高決策分析能力。 假設(shè)有一個(gè)假設(shè)有一個(gè)5 5維數(shù)據(jù)模型,維數(shù)據(jù)模型,5 5個(gè)維分別為:商個(gè)維分別為:商店,方案,部門(mén),時(shí)間,銷(xiāo)售。店,方案,部門(mén),時(shí)間,銷(xiāo)售。 1 1三維表查詢?nèi)S表查詢 在指定在指定“商店商店=ALL=ALL,方案,方案= =現(xiàn)有現(xiàn)有”情況的三維情況的三維表(行為部門(mén),列為時(shí)間和銷(xiāo)售量)表(行為部門(mén),列為時(shí)間和銷(xiāo)售量) 19941995%增長(zhǎng)率銷(xiāo)售量利潤(rùn)增長(zhǎng)%銷(xiāo)售量利潤(rùn)增長(zhǎng)%銷(xiāo)售量利潤(rùn)增

48、長(zhǎng)服裝234,67027.2381,10221.562.4(20.0)家具62,54833.866,00531.15.6(8.0)汽車(chē)375,09822.4325,40227.2(13.2)21.4所有其它202,38821.3306,67721.750.71.9 19941995%增長(zhǎng)率增長(zhǎng)率銷(xiāo)售銷(xiāo)售利潤(rùn)增利潤(rùn)增長(zhǎng)長(zhǎng)%銷(xiāo)售銷(xiāo)售利潤(rùn)增利潤(rùn)增長(zhǎng)長(zhǎng)%銷(xiāo)售銷(xiāo)售利潤(rùn)增利潤(rùn)增長(zhǎng)長(zhǎng)汽車(chē)汽車(chē)375,09822.4325,40227.2(13.2)21.4維修維修195,05114.2180,78615.0(7.3)5.6附件附件116,28043.9122,54547.55.38.2音樂(lè)音樂(lè)63,7678.

49、222,07114.2(63.4)7.3 對(duì)汽車(chē)部門(mén)向下鉆取出具體項(xiàng)目的銷(xiāo)售情況和對(duì)汽車(chē)部門(mén)向下鉆取出具體項(xiàng)目的銷(xiāo)售情況和利潤(rùn)增長(zhǎng)情況。利潤(rùn)增長(zhǎng)情況。 1995Sales服裝服裝381,102家具家具66,005汽車(chē)汽車(chē)325,402所有其它所有其它306,677 切片(切片(SliceSlice)操作是除去一些列或行不顯示)操作是除去一些列或行不顯示 1995銷(xiāo)售量銷(xiāo)售量現(xiàn)有現(xiàn)有計(jì)劃計(jì)劃差量差量差量差量%服裝服裝381,102350,00031.18.9家具家具66,00569,000(2,995)(4.3)汽車(chē)汽車(chē)325,402300,00025,4028.5所有其它所有其它306,677

50、350,000(44,322)12.7 這次旋轉(zhuǎn)操作得到這次旋轉(zhuǎn)操作得到19951995年的交叉表方案為:現(xiàn)年的交叉表方案為:現(xiàn)有有、計(jì)劃、計(jì)劃、 差量差量、差量差量% %。 5.4.1 5.4.1 數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā)數(shù)據(jù)倉(cāng)庫(kù)的開(kāi)發(fā) 1 1、數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃、數(shù)據(jù)倉(cāng)庫(kù)規(guī)劃 數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)的范圍怎樣數(shù)據(jù)倉(cāng)庫(kù)開(kāi)發(fā)的范圍怎樣? ? 要解決的業(yè)務(wù)問(wèn)題是什么?要解決的業(yè)務(wù)問(wèn)題是什么? 開(kāi)發(fā)的數(shù)據(jù)倉(cāng)庫(kù)的決策支持能力是什么?開(kāi)發(fā)的數(shù)據(jù)倉(cāng)庫(kù)的決策支持能力是什么? 決策者的需求決策者的需求: : 對(duì)信息的需求對(duì)信息的需求 對(duì)業(yè)務(wù)過(guò)程的需求對(duì)業(yè)務(wù)過(guò)程的需求 對(duì)數(shù)據(jù)訪問(wèn)的需求對(duì)數(shù)據(jù)訪問(wèn)的需求確定體系結(jié)構(gòu)確定體系結(jié)構(gòu) (1)來(lái)

51、源:數(shù)據(jù)應(yīng)該來(lái)自于什么)來(lái)源:數(shù)據(jù)應(yīng)該來(lái)自于什么DBMS的源數(shù)據(jù)?的源數(shù)據(jù)?(2)傳輸:數(shù)據(jù)通過(guò)什么樣的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)傳送過(guò)來(lái)?)傳輸:數(shù)據(jù)通過(guò)什么樣的網(wǎng)絡(luò)拓?fù)浣Y(jié)構(gòu)傳送過(guò)來(lái)?(3)目的地:數(shù)據(jù)發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)的什么硬件環(huán)境?)目的地:數(shù)據(jù)發(fā)送到數(shù)據(jù)倉(cāng)庫(kù)的什么硬件環(huán)境?(4)元數(shù)據(jù):確定存儲(chǔ)和訪問(wèn)數(shù)據(jù)的元數(shù)據(jù)。)元數(shù)據(jù):確定存儲(chǔ)和訪問(wèn)數(shù)據(jù)的元數(shù)據(jù)。(5)變換:編制數(shù)據(jù)抽取、變換、裝載的程序)變換:編制數(shù)據(jù)抽取、變換、裝載的程序。(6)訪問(wèn):最終用戶怎樣才能查詢數(shù)據(jù)?)訪問(wèn):最終用戶怎樣才能查詢數(shù)據(jù)? (1 1)主題域分析)主題域分析 確定所需數(shù)據(jù)的范圍和內(nèi)容。并確定所需數(shù)據(jù)的范圍和內(nèi)容。并建立建立數(shù)

52、據(jù)數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型:倉(cāng)庫(kù)的數(shù)據(jù)模型: 主題域范圍主題域范圍 數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型數(shù)據(jù)倉(cāng)庫(kù)的數(shù)據(jù)模型(2 2)物理數(shù)據(jù)庫(kù)設(shè)計(jì))物理數(shù)據(jù)庫(kù)設(shè)計(jì) 數(shù)據(jù)的實(shí)際存儲(chǔ)設(shè)計(jì)數(shù)據(jù)的實(shí)際存儲(chǔ)設(shè)計(jì) (1 1)確定源數(shù)據(jù)、檢查其完整性,)確定源數(shù)據(jù)、檢查其完整性,進(jìn)行評(píng)價(jià)。進(jìn)行評(píng)價(jià)。 (2 2)完成源數(shù)據(jù)變換到目標(biāo)數(shù)據(jù)倉(cāng))完成源數(shù)據(jù)變換到目標(biāo)數(shù)據(jù)倉(cāng)庫(kù)中去。庫(kù)中去。 完成數(shù)據(jù)加載;評(píng)審;元數(shù)據(jù)加載;完成數(shù)據(jù)加載;評(píng)審;元數(shù)據(jù)加載;系統(tǒng)測(cè)試系統(tǒng)測(cè)試 提供給用戶訪問(wèn)的形式:提供給用戶訪問(wèn)的形式:(1 1)使用現(xiàn)有的特定工具;)使用現(xiàn)有的特定工具;(2 2)開(kāi)發(fā)一個(gè)最終用戶訪問(wèn)程序。)開(kāi)發(fā)一個(gè)最終用戶訪問(wèn)程序。 美國(guó)著名的

53、美國(guó)著名的NCRNCR數(shù)據(jù)倉(cāng)庫(kù)公司對(duì)數(shù)據(jù)倉(cāng)庫(kù)總結(jié)數(shù)據(jù)倉(cāng)庫(kù)公司對(duì)數(shù)據(jù)倉(cāng)庫(kù)總結(jié)5 5種種決策支持能力。決策支持能力。 1 1、報(bào)表、報(bào)表 2 2、隨機(jī)分析、隨機(jī)分析 3 3、預(yù)測(cè)、預(yù)測(cè) 4 4、實(shí)時(shí)決策、實(shí)時(shí)決策 5 5、事件觸發(fā)的自動(dòng)決策、事件觸發(fā)的自動(dòng)決策 數(shù)據(jù)倉(cāng)庫(kù)所面臨的最大挑戰(zhàn)是數(shù)據(jù)集成。數(shù)據(jù)倉(cāng)庫(kù)所面臨的最大挑戰(zhàn)是數(shù)據(jù)集成。傳統(tǒng)的環(huán)境經(jīng)常有上百個(gè)數(shù)據(jù)源,每一數(shù)據(jù)源傳統(tǒng)的環(huán)境經(jīng)常有上百個(gè)數(shù)據(jù)源,每一數(shù)據(jù)源都有各自定義的標(biāo)準(zhǔn)和實(shí)施技術(shù)。都有各自定義的標(biāo)準(zhǔn)和實(shí)施技術(shù)。 建立的數(shù)據(jù)倉(cāng)庫(kù)是通過(guò)收集各種來(lái)源的數(shù)建立的數(shù)據(jù)倉(cāng)庫(kù)是通過(guò)收集各種來(lái)源的數(shù)據(jù),來(lái)回答預(yù)先設(shè)置的一些問(wèn)題,告訴決策者據(jù),來(lái)回答預(yù)先設(shè)

54、置的一些問(wèn)題,告訴決策者“發(fā)生了什么發(fā)生了什么”。它為以后數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展奠。它為以后數(shù)據(jù)倉(cāng)庫(kù)的發(fā)展奠定了基礎(chǔ)。定了基礎(chǔ)。 數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的第二種決策支持是,從數(shù)據(jù)倉(cāng)庫(kù)應(yīng)用的第二種決策支持是,從“發(fā)生了什么發(fā)生了什么”轉(zhuǎn)向轉(zhuǎn)向“為什么會(huì)發(fā)生為什么會(huì)發(fā)生”。分析。分析活動(dòng)就是了解報(bào)表數(shù)據(jù)的涵義,需要更多更詳活動(dòng)就是了解報(bào)表數(shù)據(jù)的涵義,需要更多更詳細(xì)的數(shù)據(jù)進(jìn)行各種角度的分析。在第二階段的細(xì)的數(shù)據(jù)進(jìn)行各種角度的分析。在第二階段的數(shù)據(jù)倉(cāng)庫(kù)主要用于隨機(jī)分析。數(shù)據(jù)倉(cāng)庫(kù)主要用于隨機(jī)分析。 數(shù)據(jù)倉(cāng)庫(kù)的第三種決策支持是幫助決策者數(shù)據(jù)倉(cāng)庫(kù)的第三種決策支持是幫助決策者來(lái)預(yù)測(cè)未來(lái),回答來(lái)預(yù)測(cè)未來(lái),回答“將要發(fā)生什么將要發(fā)

55、生什么”。 數(shù)據(jù)倉(cāng)庫(kù)需要利用歷史資料創(chuàng)建預(yù)測(cè)模型。數(shù)據(jù)倉(cāng)庫(kù)需要利用歷史資料創(chuàng)建預(yù)測(cè)模型。 數(shù)據(jù)倉(cāng)庫(kù)的第數(shù)據(jù)倉(cāng)庫(kù)的第4 4種決策支持是企業(yè)需要準(zhǔn)確了解種決策支持是企業(yè)需要準(zhǔn)確了解“正在發(fā)生什么正在發(fā)生什么”,從而需要建立動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)(實(shí),從而需要建立動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)(實(shí)時(shí)數(shù)據(jù)庫(kù)),用于支持戰(zhàn)術(shù)型決策,即實(shí)時(shí)決策。有時(shí)數(shù)據(jù)庫(kù)),用于支持戰(zhàn)術(shù)型決策,即實(shí)時(shí)決策。有效地解決當(dāng)前的實(shí)際問(wèn)題。效地解決當(dāng)前的實(shí)際問(wèn)題。 第第1 1到第到第3 3種決策支持的數(shù)據(jù)倉(cāng)庫(kù)都以支持企業(yè)內(nèi)種決策支持的數(shù)據(jù)倉(cāng)庫(kù)都以支持企業(yè)內(nèi)部戰(zhàn)略性決策為重點(diǎn),幫助企業(yè)制定發(fā)展戰(zhàn)略。部戰(zhàn)略性決策為重點(diǎn),幫助企業(yè)制定發(fā)展戰(zhàn)略。 第第4 4種決策

56、支持側(cè)重在戰(zhàn)術(shù)性決策支持。種決策支持側(cè)重在戰(zhàn)術(shù)性決策支持。 動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)能夠逐項(xiàng)產(chǎn)品、逐個(gè)店鋪、逐秒地動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù)能夠逐項(xiàng)產(chǎn)品、逐個(gè)店鋪、逐秒地作出最佳決策支持。作出最佳決策支持。 數(shù)據(jù)倉(cāng)庫(kù)的第數(shù)據(jù)倉(cāng)庫(kù)的第5 5種決策支持是由事件觸發(fā),種決策支持是由事件觸發(fā),利用動(dòng)態(tài)數(shù)據(jù)庫(kù)自動(dòng)決策,達(dá)到利用動(dòng)態(tài)數(shù)據(jù)庫(kù)自動(dòng)決策,達(dá)到“希望發(fā)生什希望發(fā)生什么么”。 例如,電子貨架標(biāo)簽技術(shù)結(jié)合動(dòng)態(tài)數(shù)據(jù)倉(cāng)例如,電子貨架標(biāo)簽技術(shù)結(jié)合動(dòng)態(tài)數(shù)據(jù)倉(cāng)庫(kù),可以幫助企業(yè)按照自己的意愿實(shí)現(xiàn)復(fù)雜的庫(kù),可以幫助企業(yè)按照自己的意愿實(shí)現(xiàn)復(fù)雜的價(jià)格管理自動(dòng)化,以便以最低的損耗售出最多價(jià)格管理自動(dòng)化,以便以最低的損耗售出最多的存貨。的存貨。 N

57、CRNCR公司成功地開(kāi)發(fā)了很多實(shí)際數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),在此公司成功地開(kāi)發(fā)了很多實(shí)際數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng),在此介紹一例典型的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。介紹一例典型的數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)。 實(shí)例:金融業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案實(shí)例:金融業(yè)數(shù)據(jù)倉(cāng)庫(kù)解決方案 數(shù) 據(jù) 倉(cāng) 庫(kù) 是 金 融 銀 行 機(jī) 構(gòu) 實(shí) 現(xiàn) 客 戶 關(guān) 系 管 理數(shù) 據(jù) 倉(cāng) 庫(kù) 是 金 融 銀 行 機(jī) 構(gòu) 實(shí) 現(xiàn) 客 戶 關(guān) 系 管 理(Customer Relationship ManagementCustomer Relationship Management)的核心技術(shù),也)的核心技術(shù),也是金融銀行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)的來(lái)源,主要的應(yīng)用業(yè)務(wù)部門(mén)為信是金融銀行業(yè)競(jìng)爭(zhēng)優(yōu)勢(shì)的來(lái)源,主

58、要的應(yīng)用業(yè)務(wù)部門(mén)為信用卡部、信貸部、市場(chǎng)部和零售業(yè)務(wù)部等,應(yīng)用領(lǐng)域是以用卡部、信貸部、市場(chǎng)部和零售業(yè)務(wù)部等,應(yīng)用領(lǐng)域是以客戶為中心的的分銷(xiāo)渠道管理、客戶利潤(rùn)分析、客戶關(guān)系客戶為中心的的分銷(xiāo)渠道管理、客戶利潤(rùn)分析、客戶關(guān)系優(yōu)化、風(fēng)險(xiǎn)評(píng)估和管理。優(yōu)化、風(fēng)險(xiǎn)評(píng)估和管理。 銀行只有通過(guò)以客戶為中心(銀行只有通過(guò)以客戶為中心(Customer CentricCustomer Centric)的)的數(shù)據(jù)倉(cāng)庫(kù)決策支持系統(tǒng),才能使用科學(xué)的方法實(shí)現(xiàn)個(gè)性化數(shù)據(jù)倉(cāng)庫(kù)決策支持系統(tǒng),才能使用科學(xué)的方法實(shí)現(xiàn)個(gè)性化服務(wù)。服務(wù)。 數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)存放每一位客戶同銀行往來(lái)的詳細(xì)的歷數(shù)據(jù)倉(cāng)庫(kù)系統(tǒng)存放每一位客戶同銀行往來(lái)的詳細(xì)的歷史交

59、易明細(xì)數(shù)據(jù),對(duì)客戶有統(tǒng)一的視圖。史交易明細(xì)數(shù)據(jù),對(duì)客戶有統(tǒng)一的視圖。 能幫助銀行業(yè)務(wù)用戶以科學(xué)的手段快速地分析、模擬能幫助銀行業(yè)務(wù)用戶以科學(xué)的手段快速地分析、模擬和預(yù)測(cè)客戶的個(gè)性化需求,進(jìn)而設(shè)計(jì)符合客戶需求的產(chǎn)品和預(yù)測(cè)客戶的個(gè)性化需求,進(jìn)而設(shè)計(jì)符合客戶需求的產(chǎn)品或服務(wù)。或服務(wù)。 通過(guò)客戶喜好的渠道完成交易,是增強(qiáng)商業(yè)銀行競(jìng)爭(zhēng)通過(guò)客戶喜好的渠道完成交易,是增強(qiáng)商業(yè)銀行競(jìng)爭(zhēng)能力最有效的手段。能力最有效的手段。 什么是個(gè)性化服務(wù)呢?可以從客戶和銀行什么是個(gè)性化服務(wù)呢?可以從客戶和銀行的觀點(diǎn)來(lái)看。的觀點(diǎn)來(lái)看。 客戶認(rèn)為個(gè)性化服務(wù)是客戶認(rèn)為個(gè)性化服務(wù)是:銀行知道我(:銀行知道我(WhoWho)在什么時(shí)間

60、(在什么時(shí)間(WhenWhen)、需要什么產(chǎn)品或服務(wù))、需要什么產(chǎn)品或服務(wù)(WhatWhat)、以我可以接受的價(jià)格()、以我可以接受的價(jià)格(How MuchHow Much)、)、經(jīng)由我喜好的分銷(xiāo)渠道(經(jīng)由我喜好的分銷(xiāo)渠道(WhereWhere),對(duì)我提供銷(xiāo)),對(duì)我提供銷(xiāo)售。售。 銀行的定義銀行的定義是:以有競(jìng)爭(zhēng)性的產(chǎn)品或服務(wù)是:以有競(jìng)爭(zhēng)性的產(chǎn)品或服務(wù)(WhatWhat)、在適當(dāng)?shù)臅r(shí)間()、在適當(dāng)?shù)臅r(shí)間(WhenWhen)、通過(guò)適當(dāng))、通過(guò)適當(dāng)?shù)姆咒N(xiāo)渠道(的分銷(xiāo)渠道(WhereWhere)、對(duì)信用好風(fēng)險(xiǎn)低的客戶)、對(duì)信用好風(fēng)險(xiǎn)低的客戶(WhoWho)、以合理的價(jià)格()、以合理的價(jià)格(How M

溫馨提示

  • 1. 本站所有資源如無(wú)特殊說(shuō)明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請(qǐng)下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請(qǐng)聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁(yè)內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒(méi)有圖紙預(yù)覽就沒(méi)有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫(kù)網(wǎng)僅提供信息存儲(chǔ)空間,僅對(duì)用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對(duì)用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對(duì)任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請(qǐng)與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對(duì)自己和他人造成任何形式的傷害或損失。

最新文檔

評(píng)論

0/150

提交評(píng)論