




版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)
文檔簡介
數(shù)據(jù)倉庫維度建模演示文稿目前一頁\總數(shù)十八頁\編于十四點(diǎn)
目錄 1.基礎(chǔ)術(shù)語 2.維度建模中的兩種模型 3.星形模型設(shè)計(jì) 4.雪花模型設(shè)計(jì) 5.星形模型的優(yōu)勢 6.雪花模型的優(yōu)勢與劣勢目前二頁\總數(shù)十八頁\編于十四點(diǎn)1、基礎(chǔ)術(shù)語
事實(shí)表(FactTable)每個(gè)數(shù)據(jù)倉庫都包含一個(gè)或者多個(gè)事實(shí)數(shù)據(jù)表。事實(shí)數(shù)據(jù)表可能包含業(yè)務(wù)銷售數(shù)據(jù),如現(xiàn)金登記事務(wù)所產(chǎn)生的數(shù)據(jù),事實(shí)數(shù)據(jù)表通常包含大量的行主要包含了描述特定商業(yè)事件的數(shù)據(jù),即某些特定商業(yè)事件的度量值。一般事實(shí)表中只存放數(shù)字或者一些Flag用來統(tǒng)計(jì),如數(shù)量、支出等一般情況下,事實(shí)表中的數(shù)據(jù)不允許修改,新的數(shù)據(jù)只是簡單地添加進(jìn)事實(shí)表中事實(shí)就是需要分析的目標(biāo)數(shù)據(jù)目前三頁\總數(shù)十八頁\編于十四點(diǎn)1、基礎(chǔ)術(shù)語
維度表(DimensionTable)維度表可以看作是用戶來分析數(shù)據(jù)的窗口,維度表中包含事實(shí)數(shù)據(jù)表中事實(shí)記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實(shí)數(shù)據(jù)表數(shù)據(jù),以便為分析者提供有用的信息,維度表包含幫助匯總數(shù)據(jù)的特性的層次結(jié)構(gòu)。每一個(gè)維度表利用維度關(guān)鍵字通過事實(shí)表中的外鍵約束于事實(shí)表中的某一行維度表示的是事實(shí)信息的屬性目前四頁\總數(shù)十八頁\編于十四點(diǎn)1、基礎(chǔ)術(shù)語
粒度(Grain)粒度表示的是事實(shí)表中細(xì)節(jié)數(shù)據(jù)的詳細(xì)程度最低粒度事實(shí)表的基本層次是所有相應(yīng)維度自然的最低層次。例:產(chǎn)品、日期、客戶、銷售員為4個(gè)維度,則:事實(shí)表一條記錄中必須有:單獨(dú)的產(chǎn)品、特定的日期、特定的銷售員和特定客戶使用最低粒度的好處可以頻繁容易的從操作型系統(tǒng)抽取數(shù)據(jù)很多數(shù)據(jù)挖掘需要最低層次便于向下鉆取使用最低粒度的缺點(diǎn)存儲和維護(hù)的代價(jià)實(shí)際處理中,我們構(gòu)建匯總事實(shí)表來支持匯總數(shù)據(jù)查詢目前五頁\總數(shù)十八頁\編于十四點(diǎn)2、維度的兩種模型星形模型(StarSchema)雪花模型(SnowflakeSchema)目前六頁\總數(shù)十八頁\編于十四點(diǎn)星形模型(StarSchema)事實(shí)被維度所包圍,且維度沒有被新的表連接目前七頁\總數(shù)十八頁\編于十四點(diǎn)雪花模型(SnowflakeSchema)事實(shí)表被多個(gè)維表或一個(gè)或多個(gè)層次所包圍目前八頁\總數(shù)十八頁\編于十四點(diǎn)3.星形模型設(shè)計(jì)(1)正確區(qū)分事實(shí)、屬性和維度。維度模型需要對事實(shí)和屬性進(jìn)行區(qū)分,業(yè)務(wù)層的很多事實(shí)都是數(shù)值型的,特別是該數(shù)值是浮點(diǎn)數(shù)時(shí),他很可能是一個(gè)事實(shí),而不是屬性。例如“標(biāo)準(zhǔn)價(jià)格”,好像是產(chǎn)品維度的一個(gè)屬性,似乎是事先一致的常量,但每年對標(biāo)準(zhǔn)價(jià)格進(jìn)行一、兩次調(diào)整,因此應(yīng)該設(shè)計(jì)成事實(shí)。屬性通常指文本字段,例如產(chǎn)品描述。維度是類似于文本形式的屬性組合,固定的數(shù)值型屬性應(yīng)放在維表中。例如,零售數(shù)據(jù)倉庫中,至少應(yīng)有一個(gè)產(chǎn)品維度,一個(gè)商店維度,一個(gè)客戶維,一個(gè)時(shí)間維,一個(gè)促銷維。目前九頁\總數(shù)十八頁\編于十四點(diǎn)3.星形模型設(shè)計(jì)(2)事實(shí)表的設(shè)計(jì)方法。事實(shí)表是數(shù)據(jù)倉庫中最大的表,在設(shè)計(jì)時(shí),一定注意使事實(shí)表盡可能的小,因?yàn)檫^大的事實(shí)表在表的處理、備份和恢復(fù)、用戶查詢等方面要用較長的時(shí)間。具體方法主要有:減少列的數(shù)量;降低每列的大小;把歷史數(shù)據(jù)存檔;例如,零售營銷事實(shí)表設(shè)計(jì)如下:目前十頁\總數(shù)十八頁\編于十四點(diǎn)3.星形模型設(shè)計(jì)(3)維表的設(shè)計(jì)。維表的屬性必須具有以下特征:可用文字描述;離散值;有規(guī)定的約束;在分析時(shí)可提供行標(biāo)題。目前十一頁\總數(shù)十八頁\編于十四點(diǎn)3.星形模型設(shè)計(jì)例:零售業(yè)營銷分析的星型模型圖。目前十二頁\總數(shù)十八頁\編于十四點(diǎn)4.雪花模型設(shè)計(jì)雪花模型是對星形模型的擴(kuò)展,每一個(gè)維度都可以向外連接多個(gè)詳細(xì)類別表。在這種模式中,維度表除了具有星形模型中維度表的功能外,還連接對事實(shí)表進(jìn)行詳細(xì)描述的詳細(xì)類別表,詳細(xì)類別表通過對事實(shí)表在有關(guān)維上的詳細(xì)描述達(dá)到了縮小事實(shí)表和提高查詢效率的目的。目前十三頁\總數(shù)十八頁\編于十四點(diǎn)4.基本雪花模型設(shè)計(jì)在該模型中,將地理層次國家、區(qū)域和分區(qū)域嵌入到銷售員維度,這樣,公司的管理者想按照國家、區(qū)域、分區(qū)域和分區(qū)域內(nèi)的銷售員的層次關(guān)系來查看公司的銷售情況。目前十四頁\總數(shù)十八頁\編于十四點(diǎn)4.基本雪花模型設(shè)計(jì)目前十五頁\總數(shù)十八頁\編于十四點(diǎn)5.星形模型的優(yōu)勢用戶容易理解優(yōu)化瀏覽在數(shù)據(jù)庫模式中,表與表連接的目的在于尋找到需要的數(shù)據(jù)如果連接的路徑復(fù)雜,那么在數(shù)據(jù)庫中瀏覽數(shù)據(jù)將是緩慢而艱難的如果連接路徑簡單、直接,則瀏覽數(shù)據(jù)會(huì)更快星型模型的優(yōu)勢之一在于它優(yōu)化對數(shù)據(jù)庫的瀏覽目前十六頁\總數(shù)十八頁\編于十四點(diǎn)5.星形模型的優(yōu)勢最適于查詢處理星型模型是一種以查詢?yōu)橹行牡慕Y(jié)構(gòu)簡單、清洗的連接路徑以及星星模型本身的結(jié)構(gòu)使得查詢在維度表和事實(shí)表之間順利、流暢、高效星型連接和星型索引星型連接是一種高速、并行、單獨(dú)操作的多表的連接,可顯著的提高查詢性能星型索引是一種專門的索引(建立在事實(shí)表的一個(gè)或多個(gè)外鍵上),提高維度表與事實(shí)表的連接速度目前十七頁\總數(shù)十八頁\編于十四點(diǎn)6.雪花模型的優(yōu)勢與劣勢優(yōu)
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
- 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
- 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
- 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
- 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- T/CMMA 4-2017鎂質(zhì)膠凝材料制品建筑用輕質(zhì)條板
- T/CIMA 0003-2018電動(dòng)汽車非車載充電機(jī)現(xiàn)場檢測儀
- T/CHTS 10116-2023雄安新區(qū)高速公路高性能路基技術(shù)指南
- T/CHIA 28.3-2022兒童營養(yǎng)與健康評價(jià)指標(biāo)第3部分:6~17歲
- T/CECS 10298-2023二階反應(yīng)型水性環(huán)氧瀝青防水粘結(jié)料
- T/CECS 10083-2020增強(qiáng)豎絲巖棉復(fù)合板
- T/CDSA 305.16-2018盾構(gòu)維護(hù)高氣壓作業(yè)規(guī)程
- T/CCSAS 050-2024化學(xué)化工實(shí)驗(yàn)室化學(xué)品安全操作規(guī)程編寫指南
- T/CCMA 0108-2020預(yù)制混凝土構(gòu)件振動(dòng)成型平臺
- T/CCAS 014.6-2022水泥企業(yè)安全管理導(dǎo)則第6部分:水泥工廠危險(xiǎn)能量隔離管理
- 匯率風(fēng)險(xiǎn)管理案例分析-深度研究
- 統(tǒng)編版(2024)七年級下冊《道德與法治》課本“活動(dòng)課”參考答案
- 2025年呼吸內(nèi)鏡考試試題及答案
- 林海雪原考試題和答案
- T-ZSA 232-2024 特種巡邏機(jī)器人通.用技術(shù)要求
- 工貿(mào)企業(yè)安全生產(chǎn)臺賬資料
- 2025年浙江名校協(xié)作體高三語文2月聯(lián)考作文題目解析及范文:“向往”的“苦處”與“樂處”
- epc亮化合同范本
- 《ESD基礎(chǔ)知識培訓(xùn)》課件
- 1《學(xué)會(huì)尊重》(說課稿)統(tǒng)編版道德與法治四年級下冊
- 英語青藍(lán)工程徒弟心得體會(huì)
評論
0/150
提交評論