SQL_Server數據倉庫相關概念-維度表和事實表概述_第1頁
SQL_Server數據倉庫相關概念-維度表和事實表概述_第2頁
SQL_Server數據倉庫相關概念-維度表和事實表概述_第3頁
SQL_Server數據倉庫相關概念-維度表和事實表概述_第4頁
SQL_Server數據倉庫相關概念-維度表和事實表概述_第5頁
已閱讀5頁,還剩1頁未讀 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、SQL_Server數據倉庫相關概念-維度表和事實表概述基本概念:1.多維數據集:多維數據集是聯機分析處理 (OLAP) 中的主要對象,是一項可對數據倉庫中的數據進行快速訪問的技術。多維數據集是一個數據集合,通常從數據倉庫的子集構造,并組織和匯總成一個由一組維度和度量值定義的多維結構。2.維度:是多維數據集的結構性特性。它們是事實數據表中用來描述數據的分類的有組織層次結構(級別)。這些分類和級別描述了一些相似的成員集合,用戶將基于這些成員集合進行分析。3.度量值:在多維數據集中,度量值是一組值,這些值基于多維數據集的事實數據表中的一列,而且通常為數字。此外,度量值是所分析的多維數據集的中心值。

2、即,度量值是最終用戶瀏覽多維數據集時重點查看的數字數據。您所選擇的度量值取決于最終用戶所請求的信息類型。一些常見的度量值有 sales、cost、expenditures 和 production count 等。4.元數據:不同 OLAP 組件中的數據和應用程序的結構模型。元數據描述 OLTP 數據庫中的表、數據倉庫和數據集市中的多維數據集這類對象,還記錄哪些應用程序引用不同的記錄塊。5.級別:級別是維度層次結構的一個元素。級別描述了數據的層次結構,從數據的最高(匯總程度最大)級別直到最低(最詳細)級別。6.數據挖掘:數據挖掘使您得以定義包含分組和預測規則的模型,以便應用于關系數據庫或多維

3、OLAP 數據集中的數據。之后,這些預測模型便可用于自動執行復雜的數據分析,以找出幫助識別新機會并選擇有獲勝把握的機會的趨勢。7.多維 OLAP (MOLAP):MOLAP 存儲模式使得分區的聚合和其源數據的復本以多維結構存儲在分析服務器計算機上。根據分區聚合的百分比和設計,MOLAP 存儲模式為達到最快查詢響應時間提供了潛在可能性。總而言之,MOLAP 更加適合于頻繁使用的多維數據集中的分區和對快速查詢響應的需要。8.關系 OLAP (ROLAP):ROLAP 存儲模式使得分區的聚合存儲在關系數據庫的表(在分區數據源中指定)中。但是,可為分區數據使用 ROLAP 存儲模式,而不在關系數據庫中

4、創建聚合。9.混合 OLAP (HOLAP):HOLAP 存儲模式結合了 MOLAP 和 ROLAP 二者的特性。10.粒度:數據匯總的層次或深度。11.聚合聚集:聚合是預先計算好的數據匯總,由于在問題提出之前已經準備了答案,聚合可以改進查詢響應時間。12.切塊:由多個維的多個成員限定的分區數據,稱為一個切塊。13.切片:由一個維的一個成員限定的分區數據,稱為一個切片。14.數據鉆取:最終用戶從常規多維數據集、虛擬多維數據集或鏈接多維數據集中選擇單個單元,并從該單元的源數據中檢索結果集以獲得更詳細的信息,這個操作過程就是數據鉆取。15.數據挖掘模型:數據挖掘使您得以定義包含分組和預測規則的模型

5、,以便應用于關系數據庫或多維 OLAP 數據集中的數據。之后,這些預測模型便可用于自動執行復雜的數據分析,以找出幫助識別新機會并選擇有獲勝把握的機會的趨勢。數據庫維度 (Database dimension)“數據庫維度”是與某個鍵屬性相關的維度屬性的集合,而該鍵屬性又與度量值維度中的事實數據相關。維度屬性 (Dimension attribute)“維度屬性”被綁定到維度表中的一個或多個列并包含成員。維度屬性可以包含客戶名稱、月份名稱和產品名稱。成員 (Member)“成員”是維度屬性(包括度量值維度)的值。層次結構中的成員可以是葉成員、父成員、數據成員或“(全部)”成員。度量值 (Meas

6、ure)“度量值”是來自事實數據表的值,也稱為“事實數據”。度量值維度的值有時也通稱為“成員”。度量值通常是數值,但也可以是字符串值。Measures 維度 (Measures dimension)“度量值維度”是包含多維數據集中所有度量值的維度。度量值維度是一種特殊的維度,其中的成員通常是根據各個維度屬性(存在指定的度量值)的當前成員(通常采用求和或計數方式)進行聚合。度量值組 (Measure Group)“度量值組”是 SQL Server 2005 Analysis Services 多維數據集中的相關度量值集合(通常是來自同一事實數據表的度量值)。在 SQL Server 2005

7、Analysis Services 中,一個多維數據集可包含多個度量值組。“(全部)”成員 (All) member)“(全部)”成員是屬性層次結構或用戶定義的層次結構中的所有成員的計算值。計算成員 (Calculated member)“計算成員”是在查詢時定義和計算的維度成員。可以在用戶查詢或 MDX 計算腳本中定義計算成員,并將其存儲在服務器上。 一個計算成員對應于定義它們的維度中的多個維度表行。數據成員 (Data member)“數據成員”是在父子層次結構中與父成員相關聯的子成員。數據成員包含其父成員的數據值,而不是該父成員的子級的聚合值。父成員 (Parent member)“父成

8、員”是父子層次結構中的成員,包含其子級的聚合值。葉成員 (leaf member)“葉成員”是層次結構中不包含子級的成員。子成員 (Child member)“子成員”是層次結構中位于頂層下面的成員。鍵屬性 (Key attribute)數據庫維度的“鍵屬性”是維度中的所有非鍵屬性(以直接或間接方式)所鏈接到的屬性。鍵屬性通常也是粒度屬性。粒度屬性 (Granularity attribute)多維數據集維度的屬性,它將維度鏈接到度量值維度內度量值組中的事實數據。如果粒度屬性和鍵屬性為不同的屬性,則非鍵屬性必須直接或間接地鏈接到粒度屬性。在多維數據集中,粒度屬性定義維度的粒度。多維數據集維度

9、(Cube dimension)“多維數據集維度”是多維數據集中的數據庫維度實例。屬性層次結構 (Attribute hierarchy)“屬性層次結構”是包含以下級別的屬性成員層次結構:包含所有非重復屬性成員的葉級別,葉級別的各個成員也稱為“葉成員”。中間級別(如果屬性層次結構為父子層次結構)。可選的“(全部)”級別 (IsAggregatable=True),它包含屬性層次結構的葉成員的聚合值。“(全部)”級別的成員也稱為“(全部)”成員。默認情況下,將為每個維度屬性定義屬性層次結構 (AttributeHierarchyEnabled=True)。屬性層次結構默認為可見 (Attribu

10、teHierarchyVisible=True)。均衡層次結構 (Balanced hierarchy)“均衡層次結構”是頂級成員與任何葉成員之間存在相同級別數的層次結構。不齊整層次結構 (Ragged hierarchy)請參見“非均衡層次結構 (Unbalanced hierarchy)”。非均衡層次結構 (Unbalanced hierarchy)“非均衡層次結構”是頂級與葉級之間存在不同級別數的層次結構。父子層次結構即是不齊整層次結構的一個例子。非均衡層次結構也稱為“不齊整層次結構”。父子層次結構 (Parent-child hierarchy)“父子層次結構”是一種將維度屬性設置為

11、parent 類型的特殊的屬性層次結構。父子層次結構是由子成員和父成員構成的非均衡層次結構。父子層次結構包含以下級別:包含父成員子級的子級別。父成員的子級包含聚合到父成員的屬性成員(包括數據成員)。包含父成員的中間級別。可選的“(全部)”級別 (IsAggregatable=True),它包含父子層次結構葉成員的聚合值,“(全部)”級別的成員也稱為“(全部)”成員。每個維度中只能存在一個父子層次結構,并且必須與鍵屬性相關。用戶定義的層次結構 (User-defined hierarchy)“用戶定義的層次結構”是屬性層次結構的均衡層次結構,旨在幫助用戶瀏覽多維數據集數據。用戶定義的層次結構不添

12、加到多維數據集空間。在某些情況下可以隱藏用戶定義的層次結構中的級別并使其以非均衡的形式顯示。屬性關系 (Attribute relationship)“屬性關系”是屬性間的一對多關系,例如州省市自治區和城市維度屬性間的關系。成員屬性 (Member property)成員屬性 是特性成員的屬性,例如客戶的性別或產品的顏色。單元 (Cell)多維數據集中的“單元”是度量值維度成員的成員與多維數據集中各個屬性層次結構的成員相交處所在的空間。度量值維度的成員可以是葉成員(單個事實數據)或聚合成員(例如,特定年份聚合的銷售額)。維度的成員可以是葉成員、數據成員、父成員或“(全部)”成員。多維數據集空間

13、 (Cube space)“多維數據集空間”是多維數據集屬性層次結構的成員與多維數據集的度量值的交集。子多維數據集 (Subcube)“子多維數據集”是表示多維數據集的篩選視圖的多維數據集子集。可以使用 MDX 計算腳本中的 Scope 語句或 MDX 查詢中的嵌套 select 語句定義子多維數據集。帶有嵌套 select 語句的子多維數據集 (Subcube with Subselect)用 MDX 查詢中的嵌套 select 語句定義的子多維數據集包含符合子多維數據集定義的所有成員,其結果如下:包含層次結構的“(全部)”成員與包含層次結構的每個葉成員的結果是相同的。包含任何成員將包括其祖

14、先和后代。包含用戶定義的層次結構中某級別的每個成員將包含該用戶定義的層次結構中的所有成員,但可排除不與此級別成員共存的其他層次結構的成員(例如不包含客戶的城市)。多維數據集中的每個“(全部)”成員始終存在于從該多維數據集創建的子多維數據集中。子多維數據集中的聚合值將進行直接求和。SQL Server數據庫維度表和事實表概述事實表每個數據倉庫都包含一個或者多個事實數據表。事實數據表可能包含業務銷售數據,如現金登記事務所產生的數據,事實數據表通常包含大量的行。事實數據表的主要特點是包含數字數據(事實),并且這些數字信息可以匯總,以提供有關單位作為歷史的數據,每個事實數據表包含一個由多個部分組成的索

15、引,該索引包含作為外鍵的相關性緯度表的主鍵,而維度表包含事實記錄的特性。事實數據表不應該包含描述性的信息,也不應該包含除數字度量字段及使事實與緯度表中對應項的相關索引字段之外的任何數據。包含在事實數據表中的“度量值”有兩中:一種是可以累計的度量值,另一種是非累計的度量值。最有用的度量值是可累計的度量值,其累計起來的數字是非常有意義的。用戶可以通過累計度量值獲得匯總信息,例如。可以匯總具體時間段內一組商店的特定商品的銷售情況。非累計的度量值也可以用于事實數據表,單匯總結果一般是沒有意義的,例如,在一座大廈的不同位置測量溫度時,如果將大廈中所有不同位置的溫度累加是沒有意義的,但是求平均值是有意義的。一般來說,一個事實數據表都要和一個或多個緯度表相關聯,用戶在利用事實數據表創建多維數據集時,可以使用一個或多個維度表。維度表維度表可以看作是用戶來分析數據的窗口,緯度表中包含事實數據表中事實記錄的特性,有些特性提供描述性信息,有些特性指定如何匯總事實數據表數據,以便為分析者提供有用的信息,維度表包含幫助匯總數

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論