




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、BI數據中心整體建設方案BI數據中心整體建設方案 BI系統 整體建設解決方案建議書BI數據中心整體解決方案目 錄目 錄 TOC o 1-4 h z u HYPERLINK l _Toc521442026 第1章客戶需求概述 PAGEREF _Toc521442026 h 1 HYPERLINK l _Toc521442027 1.1項目建設背景 PAGEREF _Toc521442027 h 1 HYPERLINK l _Toc521442028 1.2需求分析 PAGEREF _Toc521442028 h 1 HYPERLINK l _Toc521442029 第2章項目建設目標 PAGE
2、REF _Toc521442029 h 2 HYPERLINK l _Toc521442030 2.1架構 PAGEREF _Toc521442030 h 2 HYPERLINK l _Toc521442031 2.2業務應用 PAGEREF _Toc521442031 h 2 HYPERLINK l _Toc521442032 第3章XXX建議整體建設解決方案 PAGEREF _Toc521442032 h 3 HYPERLINK l _Toc521442033 3.1解決方案系統架構 PAGEREF _Toc521442033 h 3 HYPERLINK l _Toc521442034 3
3、.2解決方案組成 PAGEREF _Toc521442034 h 4 HYPERLINK l _Toc521442035 3.2.1數據倉庫(InfoSphere Warehouse Layer) PAGEREF _Toc521442035 h 5 HYPERLINK l _Toc521442036 3.2.2數據集市(Data Mart Layer) PAGEREF _Toc521442036 h 5 HYPERLINK l _Toc521442037 3.2.3數據ETL處理系統 PAGEREF _Toc521442037 h 5 HYPERLINK l _Toc521442038 3.2
4、.4業務應用 PAGEREF _Toc521442038 h 6 HYPERLINK l _Toc521442039 3.2.4.1Cognos客戶洞察分析報表 PAGEREF _Toc521442039 h 6 HYPERLINK l _Toc521442040 3.2.4.2報表門戶 PAGEREF _Toc521442040 h 6 HYPERLINK l _Toc521442041 3.2.4.3多維數據集 PAGEREF _Toc521442041 h 12 HYPERLINK l _Toc521442042 3.3配置建議 PAGEREF _Toc521442042 h 16 HY
5、PERLINK l _Toc521442043 3.4整體解決方案優勢 PAGEREF _Toc521442043 h 18 HYPERLINK l _Toc521442044 第4章XXX數據倉庫方案 PAGEREF _Toc521442044 h 21 HYPERLINK l _Toc521442045 4.1XXX 數據倉庫方案概述 PAGEREF _Toc521442045 h 21 HYPERLINK l _Toc521442046 4.2XXX數據倉庫解決方案帶來的價值 PAGEREF _Toc521442046 h 22 HYPERLINK l _Toc521442047 4.3
6、XXX數據倉庫方案功能特點 PAGEREF _Toc521442047 h 22 HYPERLINK l _Toc521442048 4.3.1數據分區技術 (DPF, Database Partitioning Feature) PAGEREF _Toc521442048 h 23 HYPERLINK l _Toc521442049 4.3.2深度壓縮技術 PAGEREF _Toc521442049 h 25 HYPERLINK l _Toc521442050 4.3.3極限工作負載管理 PAGEREF _Toc521442050 h 26 HYPERLINK l _Toc521442051
7、 4.3.4嵌入式分析 PAGEREF _Toc521442051 h 27 HYPERLINK l _Toc521442052 4.3.5數據挖掘、建模和打分 PAGEREF _Toc521442052 h 27 HYPERLINK l _Toc521442053 4.3.6非結構化信息分析 PAGEREF _Toc521442053 h 29 BI系統 整體建設解決方案建議書BI數據中心整體解決方案目 錄 HYPERLINK l _Toc521442054 4.3.7OLAP Cubing 服務 PAGEREF _Toc521442054 h 30 HYPERLINK l _Toc5214
8、42055 4.3.8靈活包裝和許可選項 PAGEREF _Toc521442055 h 31 HYPERLINK l _Toc521442056 4.4為什么選擇Information Management軟件 PAGEREF _Toc521442056 h 33 HYPERLINK l _Toc521442057 第5章XXX客戶分析應用方案 PAGEREF _Toc521442057 h 36 HYPERLINK l _Toc521442058 5.1InfoSphere DW Pack for Customer Insight 方案概述 PAGEREF _Toc521442058 h
9、36 HYPERLINK l _Toc521442059 5.2解決方案帶來價值 PAGEREF _Toc521442059 h 38 HYPERLINK l _Toc521442060 5.3InfoSphere DW Pack for Customer Insight功能特點 PAGEREF _Toc521442060 h 39 HYPERLINK l _Toc521442061 5.3.1物理數據模型 PAGEREF _Toc521442061 h 39 HYPERLINK l _Toc521442062 5.3.2Cognos 應用報表 PAGEREF _Toc521442062 h
10、43 HYPERLINK l _Toc521442063 5.4為什么選擇 InfoSphere DW Pack for Customer Insight PAGEREF _Toc521442063 h 46 HYPERLINK l _Toc521442064 第6章數據抽取、轉換和加載方案 PAGEREF _Toc521442064 h 48 HYPERLINK l _Toc521442065 6.1InfoSphere DataStage 方案概述 PAGEREF _Toc521442065 h 48 HYPERLINK l _Toc521442066 6.2InfoSphere Data
11、Stage ETL方案帶來價值 PAGEREF _Toc521442066 h 50 HYPERLINK l _Toc521442067 6.3InfoSphere DataStage 軟件功能特點 PAGEREF _Toc521442067 h 52 HYPERLINK l _Toc521442068 6.3.1DataStage基于Information Server的架構 PAGEREF _Toc521442068 h 52 HYPERLINK l _Toc521442069 6.3.1.1通用用戶界面 PAGEREF _Toc521442069 h 53 HYPERLINK l _To
12、c521442070 6.3.1.2通用服務 PAGEREF _Toc521442070 h 54 HYPERLINK l _Toc521442071 6.3.1.3通用知識庫 PAGEREF _Toc521442071 h 54 HYPERLINK l _Toc521442072 6.3.1.4通用并行處理引擎 PAGEREF _Toc521442072 h 55 HYPERLINK l _Toc521442073 6.3.1.5通用連接器 PAGEREF _Toc521442073 h 55 HYPERLINK l _Toc521442074 6.3.2直觀易用的開發和維護環境 PAGER
13、EF _Toc521442074 h 56 HYPERLINK l _Toc521442075 6.3.3企業級實施和管理 PAGEREF _Toc521442075 h 58 HYPERLINK l _Toc521442076 6.3.3.1作業順序器 PAGEREF _Toc521442076 h 58 HYPERLINK l _Toc521442077 6.3.3.2任務資源使用預估 PAGEREF _Toc521442077 h 60 HYPERLINK l _Toc521442078 6.3.3.3圖形化監控工具 PAGEREF _Toc521442078 h 61 HYPERLIN
14、K l _Toc521442079 6.3.4高擴展的體系架構 PAGEREF _Toc521442079 h 63 HYPERLINK l _Toc521442080 6.3.5具備線性擴充能力 PAGEREF _Toc521442080 h 66 HYPERLINK l _Toc521442081 6.3.6ETL元數據管理 PAGEREF _Toc521442081 h 67 BI系統 整體建設解決方案建議書BI數據中心整體解決方案目 錄 HYPERLINK l _Toc521442082 6.4為什么選擇 InfoSphere DataStage軟件 PAGEREF _Toc52144
15、2082 h 69 HYPERLINK l _Toc521442083 第7章Cognos PAGEREF _Toc521442083 h 72 HYPERLINK l _Toc521442084 7.1Cognos 方案概述 PAGEREF _Toc521442084 h 72 HYPERLINK l _Toc521442085 7.2Cognos方案帶來價值 PAGEREF _Toc521442085 h 74 HYPERLINK l _Toc521442086 7.3Cognos 軟件功能特點 PAGEREF _Toc521442086 h 76 HYPERLINK l _Toc5214
16、42087 7.4為什么選擇 Cognos軟件 PAGEREF _Toc521442087 h 83 HYPERLINK l _Toc521442088 第8章SPSS 數據挖掘 工具 PAGEREF _Toc521442088 h 87 HYPERLINK l _Toc521442089 8.1SPSS數據挖掘方案概述 PAGEREF _Toc521442089 h 87 HYPERLINK l _Toc521442090 8.1.1數據分析應用主題 PAGEREF _Toc521442090 h 87 HYPERLINK l _Toc521442091 8.1.2應用系統架構 PAGERE
17、F _Toc521442091 h 89 HYPERLINK l _Toc521442092 8.2SPSS方案帶來價值 PAGEREF _Toc521442092 h 91 HYPERLINK l _Toc521442093 8.3SPSS 軟件功能特點 PAGEREF _Toc521442093 h 97 HYPERLINK l _Toc521442094 8.3.1數據挖掘軟件及技術服務的技術標準 PAGEREF _Toc521442094 h 97 HYPERLINK l _Toc521442095 8.3.2軟件支持算法和模型 PAGEREF _Toc521442095 h 98 H
18、YPERLINK l _Toc521442096 8.3.2.1支持算法的廣度和深度 PAGEREF _Toc521442096 h 98 HYPERLINK l _Toc521442097 8.3.2.2軟件界面易用性 PAGEREF _Toc521442097 h 101 HYPERLINK l _Toc521442098 8.3.2.3軟件運行性能 PAGEREF _Toc521442098 h 106 HYPERLINK l _Toc521442099 8.3.2.4數據挖掘軟件與現有系統的集成要求 PAGEREF _Toc521442099 h 109 HYPERLINK l _To
19、c521442100 8.4為什么選擇 SPSS軟件 PAGEREF _Toc521442100 h 111 HYPERLINK l _Toc521442101 第9章專業化服務 PAGEREF _Toc521442101 h 113 HYPERLINK l _Toc521442102 9.1業務需求分析 PAGEREF _Toc521442102 h 113 HYPERLINK l _Toc521442103 9.2系統架構設計 PAGEREF _Toc521442103 h 113 HYPERLINK l _Toc521442104 9.3客戶化工作 PAGEREF _Toc5214421
20、04 h 113 HYPERLINK l _Toc521442105 9.3.1業務需求定義 PAGEREF _Toc521442105 h 113 HYPERLINK l _Toc521442106 9.3.2多緯度模型設計 PAGEREF _Toc521442106 h 114 HYPERLINK l _Toc521442107 9.3.3數據模型修改 PAGEREF _Toc521442107 h 114 HYPERLINK l _Toc521442108 9.3.4ETL設計和開發 PAGEREF _Toc521442108 h 114 HYPERLINK l _Toc52144210
21、9 9.3.5Cognos報表開發 PAGEREF _Toc521442109 h 117 HYPERLINK l _Toc521442110 9.4技術支持 PAGEREF _Toc521442110 h 117 BI系統 整體建設解決方案建議書BI數據中心整體解決方案目 錄 HYPERLINK l _Toc521442111 9.5培訓 PAGEREF _Toc521442111 h 117 HYPERLINK l _Toc521442112 第10章XX公司簡介 PAGEREF _Toc521442112 h 119 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE
22、2頁客戶需求概述項目建設背景(根據客戶提供的材料,簡要地說明申銀萬國證劵建設BI系統的背景。)需求分析需求 - 1: 建立數據中心,實現業務數據統一管治。需求 -2 :把 Data Warehouse Pack for Customer Insight 報表集成到業務系統 PORT。需求 3:通過建立數據中心,獲取可幫助業務優化的分析型報表,并實現操作型CRM的業務運營模式。(根據客戶提供的需求文檔資料,詳細地說明目前申銀萬國證劵的需求。) BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 2頁項目建設目標架構(根據客戶提供的材料,簡要地說明申銀萬國證劵建設BI系統的背景。
23、)業務應用 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 3頁XXX建議整體建設解決方案當客戶提出要建設BI系統以優化業務后,XXX公司建議使用 整體建設的解決方案,詳細說明如下。解決方案系統架構 XXX公司建設BI系統的整體解決方案的系統架構說明如下。XXX BI整體解決方案系統架構建立企業級的中央數據倉庫InfoSpere Warehouse,形成統一的業務數據管理平臺,為企業各個業務部門提供業務層面上的數據分析結果,以實現業務優化的目標。基于InfoSpere Warehouse基礎上,建立面向部門級應用的數據集市,通過InfoSphere Data Wareho
24、use Pack for Customer Insight 產品方案,物理數據模型和Cognos 8 BI BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 4頁系統提供樣本報表,可幫助客戶快速地建立針對客戶資料和交易行為分析的應用系統。基于InfoSpere Warehouse和部門級應用的數據集市的基礎,針對特殊和關鍵的業務需求,通過XXX SPSS數據挖掘軟件工具,根據各項業務指標要求對挖掘模型進行訓練,以挖掘出解決指定業務問題的答案,并持續支持業務發展。XXX Information Server 提供了數據集成的解決方案,其中 DataStage軟件工具實現了從各
25、個生產業務系統抽取出數據,并按業務規則進行轉換,最后把處理結果加載入數據倉庫平臺。解決方案組成整個解決方案涉及的軟件產品具體說明如下。XXX BI整體解決方案系統組成部分 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 5頁數據倉庫(InfoSphere Warehouse Layer)物理模型提供InfoSphere Warehouse Sample DB DDL InfoSphere Warehouse Design Studio 數據模型,含蓋數據倉庫的原子表和面向報表應用的事實表。數據從數據倉庫更新到事實表的邏輯說明和指引說明文檔。數據集市(Data Mart L
26、ayer)InfoSphere Warehouse Cubing Services Cube 建立一個Star SchemaCognos Framework Manager Model 建立全部 Star Schema從數據倉庫和 Cognos 元數據遷移到 Metadata Server的說明和指引文檔資料。數據ETL處理系統InfoSphere Information Server DataStage ver.8.1 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 6頁業務應用Cognos客戶洞察分析報表Cognos ReportStudio Reports for
27、Customer InsightCognos AnalysisStudio Reports for Customer Insight備注:有關報表的詳細內容,請參閱第四章節。報表門戶1.1 管理駕駛艙管理駕駛艙以儀表盤、趨勢圖等方式展現業務績效的關鍵指標,包括開銷戶、轉為有效戶、資產、交易量、傭金及凈傭金率等。圖1 管理駕駛艙儀表盤 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 8頁儀表盤常用于同時展現絕對指標和相對指標。圖2中儀表盤的外圈刻度表示開銷戶、交易量等指標的絕對值,不同區域的顏色表示此指標值的健康程度;內圈刻度表示相對占比(如在公司或市場占比)。圖2 交易量
28、儀表盤雙軸柱線圖圖3為交易量趨勢圖,其中左軸是成交量,右軸是市場占比。柱狀代表成交量的變化趨勢,折線是成交量市場占比的變化情況。此圖可以很好的表達公司自身的成交量趨勢以及在同業中所處的水平。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 8頁圖3 交易量趨勢三維餅圖圖 4的餅圖直觀的揭示了特定時間段內的交易量構成,顯示各證券類別的交易量占比。圖4 交易量構成1.2 客戶分析多角度展示客戶總體的特征分布(資金量、活躍度、年齡等其他人口統計學特征、凈傭金等),摒棄簡單的“大中散”客戶分類方式,深層剖析客戶盈利的關鍵因素。分析流失客戶的行為特征,為客戶挽留提供數據依據。開銷戶
29、和資產報表:按時間段、按分公司(營業部)統計客戶的開戶數、銷戶數、轉有效戶數及其均值等,以及客戶保證金、市值、資產及新增和流失的保證金、市值和資產。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 9頁堆積柱狀圖圖5以堆積柱狀圖展示了不同年齡段客戶群對不同證券交易品種的偏好。圖5 不同年齡段交易量結構圖6 開銷戶明細報表1.3 綜合排名 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 10頁各營業部按新增開銷戶、有效戶、客戶資產、傭金等指標在公司、分公司的排名及排名的變化。圖7 本月營業部新增有效戶排名1.4 營業部報表1)營業部的開銷戶、有效戶、交
30、易量及傭金等指標的歷史變化趨勢圖2)不同營業部之間多指標對比分析(雷達圖)3)交易量等指標的構成(按證券類別、委托方式等)雷達圖圖8用雷達圖可以對營業部進行直觀的綜合能力分析及對比。可以選取多個關鍵性指標進行量化后作為雷達圖的各個軸,每個軸分為十個刻度,值越大代表越好。這樣的話面積越大代表該營業部綜合能力越強。據圖6所示,綠色營業部的綜合實力明顯強于紅色營業部。紅色營業部雖然在期末資產和總成交金額勝于對方,但并未帶來更多的凈傭金收入,而綠色所代表的營業部在新增客戶方面更強,且有更高的凈傭金。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 11頁圖8 營業部間多指標綜合對
31、比1.5 存管銀行報表1)不同時段內,單個指標在存管銀行間占比分析(餅圖、堆積圖等)2)兩個或多個存管銀行之間多指標對比(氣泡圖、雷達圖)3)指定存管銀行,多指標變化趨勢氣泡圖圖9用氣泡圖在平面圖對各個存管銀行的交易量、月末資產和新增開戶數進行比較。橫軸代表交易量,縱軸代表月末資產。圖中的每個氣泡代表一個存管銀行,氣泡的大小表示開戶數。圖8以堆積柱形圖展示存管銀行交易量中各個證券類別的占比。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 12頁圖9 存管銀行客戶持倉率、資產及開戶數比較多維數據集根據多維業務模型建立的多維數據集,作為一個統一的數據平臺,不僅作為前臺門戶報
32、表的數據源,同時支持業務分析人員從多角度(客戶、時間、證券產品、委托方式等)及多層次(如時間的日、月、季度、年等),通過上卷、下鉆等操作,快速靈活的分析客戶的交易、持倉、盈虧等數據,使他們快速準確的掌握當前的運營狀況,驗證復雜假設、預測趨勢并制定營銷策略。圖10顯示了從資產區間、客戶貢獻度級別和活躍度等角度試探分析客戶數及其保證金、市值和資產的分布。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 13頁圖10 客戶數據的OLAP分析2.1 維度客戶營業部證券類型委托方式時間是否信托渠道經紀人交易市場貨幣類型存管銀行場內場外 BI系統 整體建設解決方案建議書BI數據中心整
33、體解決方案第 PAGE 14頁賬戶變動2.2 度量值組2.2.1 證券交易成交金額發生金額發生數量凈傭金實收傭金平均傭金率日均交易量日均凈傭金2.2.2 基金銷售手續費銷售金額銷售數量日均開放式基金銷售量2.2.3 開戶銷統計開戶計數銷戶計數流失保證金流失市值 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 15頁流失資產正常戶數有效戶數無效戶數空戶數轉有效戶數2.2.4 資產匯總日均保證金HK日均保證金RMB日均保證金USD日均場外基金市值日均市值HK日均市值RMB日均市值USD日均總資產月末A股市值月末B股市值月末保證金HK月末保證金RMB月末保證金USD月末場內基金
34、市值月末場外基金市值月末創業板市值 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 16頁月末封閉式基金市值月末其它市值月末權證市值月末市值HK月末市值RMB月末市值USD月末特別轉讓市值月末債券市值月末總資產配置建議類別配置描述數量備注硬件部分ACRM數據庫服務器XXX P550 baseXXX P550 mes (4 cores, 32GB RAM, 4 HBA and 4*1 Gb Ethernet)1磁盤陣列器XXX DS5300 (16GBCache, 10*300GB FC HDD)1ETL服務器 XXX System x3850 x5 1 BI系統 整體建設
35、解決方案建議書BI數據中心整體解決方案第 PAGE 17頁(4 x CPU (8core), L3 24MB Cache, 32GB RAM, 4 X 300GB RAID 5 HardDisk)軟件部分XXX P5505662-SEP XXX Systems Director Standard Edition for Power Systems SW Maint 3 Yr Reg1XXX P550750 Per Proc Small 3 Year SWMA Reg2Data Warehouse S/WInfoSphere Warehouse Departmental Base Edition
36、 V9.71CognosXXX Cognos 8 Business Intelligence V8.4.11Application Warehouse Pack for Customer Insight Insight1ETL ToolInfoSphere Information Server DataStage V8.11Data ModelInfoSphere Data Architect V7.5.21 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 18頁 ToolData Mining ToolSPSS - Clementine Server2 CPUData
37、Mining ToolSPSS - Clementine Client3并發用戶Data Mining ToolSPSS - Clementine Batch2 CPU備注:有關上述配置的明細項,請參閱系統配置/報價表。整體解決方案優勢系統高度集成 Warehouse和InfoSphere Warehouse Pack for Customer Insight 建立了業務必要的基礎架構,分析來自不同IT系統的數據源數據,提供了橫跨客戶、產品和渠道等方面的準確分析,以及有關客戶的檔案信息和利潤貢獻度的可視化分析結果。 InfoSphere Warehouse內嵌有對OLAP、文本和數據挖掘功能支
38、持,經過調優后得以發揮其優勢。結合 InfoSphere Information Server 的數據集成處理,提供可信賴信息以更清晰地理解業務狀況。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 20頁 Warehouse、InfoSphere Warehouse Pack for Customer Insight、InfoSphere Information Server和 XXX SPSS等軟件產品易于集成,針對客戶的業務需求提供了整體解決方案。面向業務應用整體解決方案中包括InfoSphere Warehouse Pack for Customer Insigh
39、t應用軟件,和數據模型以及對業務內容的定義,為客戶加速地實施終點對終點的解決方案,為機構快速地搶占市場份額創造優勢,并減低業務經營的風險。最終,幫助業務部門的用戶充分地發揮數據倉庫和分析系統帶來的優勢:獲取整體和它們之間互有聯系的信息;通過數據分析結果洞察業務商機,識別其發展趨勢和暗藏關系;為機構的各個部門人員提供共享的信息,以作出更快、更準確和更有信心的商業策略決定。單一廠商為客戶,提供硬件、軟件、服務與支持的全能冠軍。快速產生價值使系統運行 & 產生利潤 成本核算 同一個廠商、同一種價格算法、成本核算更準確; BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 20頁充分
40、發揮技術優勢 XXX延續收購尖端技術策略 規避系統集成上風險 XXX 負責產品/方案最佳地集成,并降低實施風險。 避免系統集成困擾 XXX 專著于平臺,你可專著于解決方案。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 21頁XXX數據倉庫方案XXX 數據倉庫方案概述XXX數據倉庫平臺方案是以XXX DB2 9.7 為核心基礎,為企業提供一個完整的、多用途的數據倉庫平臺環境。它允許用戶訪問、分析和操作任何類型的信息(包括結構化數據和非結構化數據),更深入地挖掘隱含的關系、模式和趨勢,并通過可靠的、實時的深入理解做出迅速響應。此方案為企業提供了數據倉庫所需的必要功能:提供
41、了一組創新型功能,這些功能結合起來能夠提供無與倫比的數據集群性能和存儲空間的壓縮,從而為很多類型的數據倉庫查詢帶來好處。這些功能包括:根據多個數據屬性進行可靠的數據集群、消除數據碎片、通過范圍分區技術實現高效的數據窗口、高效的數據壓縮、高度并行的可伸縮處理以及自動化的設計工具,它們使數據庫設計者能夠輕松地利用這些功能來滿足性能需求。 創新的功能組合能夠互相協作,從而滿足日益增長的動態和苛刻的數據倉庫需求。這些功能包括:支持多種查詢類型的高性能、高選擇性數據訪問,支持實時數據倉庫的低延遲數據輸入,以及用來降低運營成本的存儲優化。這些特性提供了增強的性能,直接提高了DB2企業的業務價值,同時借助獨
42、特的、創新型數據庫設計方案組合,DB2為眾多常見且復雜的商業智能需求提供了更好的選擇。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 22頁簡而言之,XXX數據倉庫解決方案有助于解決當今企業面臨的雙重挑戰,即提高日常處理產生的數據的價值,同時降低企業運營成本。XXX數據倉庫解決方案帶來的價值XXX數據倉庫解決方案有助于提高日常業務處理產生的數據價值,幫助您獲得最大的信息投資回報,同時還可以幫助您實現:降低數據分析人員工作的復雜度,提高系統的數據挖掘和分析能力,為管理層提供及時、精確、有效的營銷和輔助決策分析;提高數據倉庫的可擴展性與可維護性,降低IT運營成本,提高信息投
43、資回報;高效率的數據壓縮和數據備份技術,不僅降低數據的存儲成本,并有效提高數據的安全性與可用性;更為靈活的數據架構和模型,構建統一的企業業務運營數據模型。XXX數據倉庫方案功能特點 Warehouse 數據倉庫平臺解決方案是以XXX DB2 9.7為核心基礎,利用其具有強大可伸縮性和非共享的分布式架構,提供了高性能的混合工作負載查詢處理能力(既可以高效處理交易(OLTP),又可以高效進行在線數據分析(OLAP)),滿足現代動態數據倉庫實時數據更新的同時進行深入數據統計、分析和挖掘的需要。大量高級特性使 DB2 9.7 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 23頁
44、成為一個功能強大的動態數據倉庫引擎,這些特性包括數據分區、行級別壓縮、多維集群(MDC)以及物化查詢表(MQT),其中MQT 和多維集群也有助于提高性能。數據分區技術 (DPF, Database Partitioning Feature)DB2 9.7 數據分區技術 DPF,允許 InfoSphere Warehouse數據倉庫用戶在單個服務器或一群服務器中對數據庫進行分區。企業可以靈活地利用 DB2 數據分區,來支持數據倉庫環境中常見的特大型數據庫以及復雜的工作負荷和更多的并行查詢任務。對 DB2 數據服務器進行分區需要 DB2 數據分區功能。DB2提供了先進的“哈希(HASH)算法”映射
45、數據庫的每一條記錄到特定的數據庫分區中。“哈希算法”使用表中的一列(或一組列)作為分區關鍵字,得到0至65535的數值。分區圖定義了為65536個值中的每一個值分配的特定的數據庫分區。DB2為數據存儲提供了靈活的拓撲結構以達到高性能及高并行。每個數據庫由一些數據庫分區組成,每個數據庫分區實際上是數據庫的一個子集,它包含自己的用戶數據,索引,交易日志及配置文件。在數據庫中,管理員需要定義節點組(Node BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 25頁 Group)數據庫分區所分布的節點集合。節點組能夠跨越為該數據庫設置的數據庫分區的一部分或全部。在節點組中,還要定義
46、表空間,以說明用來存儲表數據及索引的容器(Container)(文件或設備)。在數據庫分區中,如果為每個表空間定義多個容器,則數據庫管理系統可以利用I/O的并行機制提高性能。DB2數據庫分區的體系結構具有很多優勢:一張數據庫表被分布在多個數據庫分區上,因此一張大規模數據庫表可以大到TB級。DB2在數據定義語言(DDL),數據操作SQL,以及運行時都引用了分區的模式。其分區方法還可以看作為裝載平衡的工具(通過修改分區關鍵字及分區圖,各分區中的記錄數可以調整)。DB2優化器利用分區的知識來估價不同操作的耗費,從而為每個SQL語句選擇最優的執行策略。數據的分布通過對分區關鍵字進行哈希算法完成,分區圖
47、中提供了每條記錄的存放位置。如果在初次分布數據之后,出現了數據存放不均的現象,DB2能夠自動分析并更正。DB2可以通過修改分區的分布自動創建一個新的分區圖來平均分布當前不均的數據。其中涉及到的數據記錄自動移到它新被分到的數據分區。對于不斷增長的數據庫,我們可以增加分區(同時增加處理能力),修改分區圖來包含這些新的數據庫分區,而后系統能夠自動的重新分布數據,以達到新的平衡。DB2 UDB提供了這一功能,使得系統具有非常好的擴展性。處理能力較強的數據庫分區可以存放較多的數據,從而在一切非共享的體系架構下可以充分利用各節點的處理能力使其負載均衡。DB2可以用來按比例的將更多的數據分布在具有更強處理能
48、力的數據庫分區上。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 25頁應用可以調用API找到記錄的存放位置,然后將交易送到記錄所在的節點。該API也可以直接被交易處理應用來調用,如XXX CICS,Encina,將交易送到適當的節點而提高性能。XXX DB2支持在多個小型數據庫表上增加一個UNION ALL VIEW,從而建立一個邏輯上的大表。如果由于硬件等原因,使得對一張大數據表的存儲處理變得困難時,我們可以支持將數據分布在多個較小型的數據表中,然后使用UNION ALL VIEW技術來實現一個邏輯大表的組織和訪問。透過UNION ALL VIEW,用戶可以透明地對
49、View中的多個較小規模的表實現Update、Delete、Insert、Select操作。深度壓縮技術使用 InfoSphere Warehouse,用戶可以充分利用 DB2 9.7 中獨創的存儲優化技術,它不僅能夠極大減少存儲關系數據所需的空間和成本,而且還能夠提高查詢性能。壓縮能夠節省可觀的空間:行業標準 TPC-H 數據倉庫基準測試表明,可節省 45% 69% 的磁盤空間。現在,壓縮功能更易于使用。InfoSphere Warehouse 支持用戶在將數據裝入數據倉庫時對數據進行自動壓縮,這有助于降低維護成本。除了減少存儲的使用,降低成本之外,壓縮功能還能夠顯著的提高性能。使用行數據壓
50、縮技術減少了讀取數據時的I/O操作,從而降低了相對緩慢的I/O操作對系統性能的影響,提高了整體的性能。甚至對于消耗CPU較多的操作,使用行數據壓縮技術仍能夠提高性能。DB2的壓縮解技術是將數據行中重復的數據模式映射到一個占用空間較少的符號,從而減少表格數據的總大小。此解決方案采用了一種靜態的基于字典的壓縮算法,并按行進行壓縮。存儲優化的優點包括: BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 26頁大幅減少磁盤的使用,降低總體成本;減小表、索引和交易日志的大小,便于分布和存放數據;節省備份所需磁盤空間,便于管理;提高系統的整體性能;通過最小化I/O,并提高DB2緩沖池的
51、命中率來加強性能;包含壓縮評估功能來幫助計算使用數據壓縮帶來的節省;降低對內存的需求(或者更有效的使用存在的內存);在數據倉庫環境下帶來更大的節省。極限工作負載管理InfoSphere Warehouse 提供了一組獨具特色的極限工作負載管理功能,支持實時交付對業務狀況的深入理解,同時繼續支持所有傳統的信息訪問、分析和報告需求,而不會影響性能。使用傳統的數據服務器解決方案很難將信息實時交付給所有用戶和應用程序,因為過多的用戶運行查詢會給底層基礎設施施加技術上的限制。此外,面向大型批處理的數據加載或報表作業,以及由戰略和戰術規劃工作驅動的密集分析處理可能對那些需要快速響應的請求(例如用戶與客戶進
52、行交互的請求)造成影響。利用InfoSphere Warehouse 中提供的高級工作負載管理功能,用戶可以為來自不同用戶和應用程序的查詢劃分優先級,并控制分配給這些工作的底層資源總量,從而幫助確保滿足關鍵部門、客戶和用戶的服務水平協議。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 27頁嵌入式分析作為 Warehouse 軟件的一部分,XXX 嵌入式分析功能提供了復雜但易于使用的工具集,這些工具被嵌入到數據倉庫中。在 InfoSphere Warehouse 中,XXX 已經替您完成了集成工作,因此實現和維護變得更簡單,并且提高了用戶采用率和您的投資回報。聯機分析處
53、理(OLAP)的高級立方體分析、非結構化分析、嵌入式分析以及數據挖掘和可視化功能讓您能夠充分利用以前未被有效利用的業務信息資源,這些功能緊密協作,構成一個健壯的端到端分析解決方案,為所有用戶提供高價值的商業智能。數據挖掘、建模和打分過去,當要在某個數據集上執行數據挖掘時,必須先從數據倉庫中提取數據,然后對其進行單獨分析并將結果發回數據倉庫。InfoSphere Warehouse 提供了嵌入式數據挖掘、建模和計分功能,允許您直接在數據庫中執行分段分析和預測性分析。這意味著您可以使用最新的數據,并實時交付分析結果。InfoSphere Warehouse 支持標準的數據挖掘模型算法,例如集群、關
54、聯、分類和預測,來自第三方建模工具的其他算法可以以行業標準的“預測模型標記語言”(Predictive Model Markup Language)格式導入到數據倉庫中。借助InfoSphere Warehouse數據挖掘功能,您可以發現數據中隱藏的關系,而不必將數據導入特殊的數據挖掘計算機或使用小數據樣本。具有以下特性:支持以符合預測模型標記語言 (PMML) 2.1 版和 2.0 版行業標準的格式開發數據挖掘模型; BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 28頁可以從其它工具(如 SPSS Clementine、SAS Enterprise Miner、Ang
55、oss KnowledgeSTUDIO 等等)中導入數據挖掘模型;通過可視化數據挖掘功能(基于 Java 的結果瀏覽器),可以進行數據挖掘模型分析。它甚至允許非專家用戶查看和評估數據挖掘進程的結果。允許用戶實時進行數據挖掘分析。您可以將這些功能應用到業務智能和操作應用中,從而更好地為企業和消費用戶提供服務 通過為企業和用戶提供更明智的建議、更個性化的待遇或針對特定情況不斷改進業務模型。通過使用并行化和緩存技術來提供無以倫比的數據庫性能實時評價。通過簡單的開發接口即可使用 DB2數據倉庫版數據挖掘功能。InfoSphere Warehouse Design Studio提供了一個無需編碼的圖形數
56、據挖掘開發環境。 BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 29頁數據挖掘分析的結果是業務規則。例如:購買產品 X 的客戶有 15% 可能會購買產品 Y。這些業務規則存儲在稱為模型的對象中。 DB2數據倉庫版的數據挖掘功能可以在各種不同的環境下使用。例如,可以對 UNIX、Linux 或 system i5、system z9 以及 system p5 操作系統中的其它數據庫進行數據挖掘。非結構化信息分析InfoSphere Warehouse 現在提供了分析非結構化數據并從先前未充分利用的信息中提取知識的能力。非結構化數據現在可以像結構化數據一樣進行訪問,從而提供
57、了對客戶和產品問題的更深層次的理解。提供的非結構化信息分析功能可以提升客戶服務水平,為產品提供早期的問題偵測。例如,我們不僅可以從一些結構化數據中分析客戶關心的某些事件發生的概率,也可以從郵件、聲音、聊天的通訊記錄等數據中抽取相關的信息。利用非結構化和結構化信息新的洞察力,來提升客戶服務的質量和滿意度:利用所有可以利用到的信息,提高業務決定的抉擇; BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 30頁增強客戶的理解、滿意度、凝聚力和忠誠度;偵測和預防客戶服務問題的升級;流線型的內容分析可以加速處理流程,提高可靠性;客戶流動和忠誠度分析,欺詐分析。InfoSphere W
58、arehouse還提供了基于文本的分析引擎,遵循UIMA非結構化信息管理架構的標準。利用文本分析引擎可以把文本信息轉換成可在DB2數據庫中可執行的SQL,把文本轉換到一些數據庫結構化字段和關系型表中。我們在抽取和轉換這些文本的時候要設計相應的流程,主要包括兩部分的設計:需要一個工作平來配置文本分析引擎,UIMA的術語叫注釋器。我們需要一個基于規則的注釋器,基于業務面臨的問題和文本資料指定相應的規則。如果是一個基于字典的注釋器的話,我們還需要為字典配置一組詞。另一部分是配置分析的引擎,用來定義轉換的流程。配置要被進行分析的表,指定要用到的文本分析引擎,把分析結果映射到數據庫表中的字段中。文本分析
59、轉換完成后,即可利用一些報表和分析工具,例如Alphablox或者Cognos來進行分析應用。OLAP Cubing 服務OLAP Cubing 服務允許您在同一臺數據庫服務器上內存中創建遵循 MDX(多維查詢的實際標準)的多維數據集。在同一臺服務器上創建多維數據集節約了網絡帶寬并消除了對第二臺服務器的需求。在許多情況中,常駐內存的多維數據集會產生極大的性能提升。XXX Alphablox、Cognos 或任何符合 MDX BI系統 整體建設解決方案建議書BI數據中心整體解決方案第 PAGE 31頁 的產品都可以用來報告多維數據集中的數據;可以選擇通過 MDX 查詢語言直接訪問這些多維數據集而
60、無需通過前端工具。 使用許多 OLAP 產品(例如 Cognos)的內建多維數據集功能有許多優勢;但是,Cubing 服務在許多環境中都能產生價值。此外,Cubing服務現在包含 CubeViews,CubeViews 使用物化查詢表來優化(如有需要可以通過創建向導功能協助創建)、管理、部署和更新倉庫摘要表的數據。下圖顯示 Cubing 服務為各種前端工具提供數據。 圖 Cubing 服務為各種前端工具提供數據靈活包裝和許可選項數據倉庫客戶在尋求能支付得起的、組件很好集成的、相對容易管理的和全面的解決方案。 Warehouse提供許多選項,從原先的軟件到各種解決方案,包括硬件、操作系統、軟件和
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 自動化施工方案
- 幼兒園大班《滑梯的回憶》教案
- 建筑施工特種作業-高處作業吊籃安裝拆卸工真題庫-2
- 容錯性定義題目及答案
- 1 1 集合-2026版53高考數學總復習A版精煉
- 2023-2024學年云南省保山市高二下學期期末質量檢測數學試題(解析版)
- 2023-2024學年山東省青島市萊西市高二下學期期末考試數學試題(解析版)
- 新疆盛鼎龍新材料科技有限責任公司2500噸-年高效偶聯劑5000噸-年甲基苯基硅油及3萬噸-年硅酮膠項目環評報告
- 2025年秋三年級上冊語文同步教案 8 總也倒不了的老屋
- 物流公司和客戶合作協議
- 房租代收款合同模板
- 2024屆涿鹿縣小升初全真數學模擬預測卷含解析
- 醫療機構審核管理制度
- 華南理工綜評機測試題(一)
- 浙江省杭州市臨平區2023-2024學年五年級下學期期末語文試卷
- 智能倉庫與倉儲管理自動化
- 2024-2025部編人教版2二年級語文下冊全冊測試卷【共10套附答案】
- 第一課能源史簡介
- 醫療器械倉庫管理課件
- 2024年火電電力職業技能鑒定考試-600MW超臨界機組運行筆試參考題庫含答案
- 2024年全國工會財務知識大賽備賽試題庫500(含答案)
評論
0/150
提交評論