




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、IBM 公司數據倉庫/商業智能解決方案目目 錄錄第一章第一章 概述概述 .1第二章第二章 商業智能綜述商業智能綜述 .22.1 商業智能基本結構.22.1.1 IBM數據倉庫架構.32.1.2 數據倉庫:用于抽取、整合、分布、存儲有用的信息.42.1.3 多維分析:全方位了解現狀.42.1.4 前臺分析工具.52.1.5 數據挖掘.52.2 商業智能方案實施原則.52.2.1 分階段、循序漸進的原則.52.2.2 實用原則.62.2.3 知識原則.6第三章第三章 XXX 公司公司 BI 系統方案系統方案 .73.1 XXX 公司 BI 系統的需求分析.73.2 IBM 的解決方案.73.3 建
2、議架構.9第四章第四章 所選所選 IBM 產品簡介產品簡介 .114.1 DB2 UDB .114.1.1 概述:DB2家族(Family)與DB2通用數據庫(UDB) V.2 DB2通用數據庫(UDB) V7.2的特色.124.1.3 DB2通用數據庫(UDB)的其他先進功能.224.2 DB2 WAREHOUSE MANAGER (數據倉庫管理器).264.2.1 DB2 Warehouse Manager的主要部件.264.2.2 數據抽取、轉換和加載(ETL)功能.274.2.3 元數據(Meta Data)管理.314.2.4 DB2 Warehouse Manag
3、er的其它技術特點.314.3 IBM OLAP SERVER(多維數據庫服務器) .334.3.1 DB2 OLAP Server引擎.334.3.2 DB2 OLAP Server各個附件.344.3.3 DB2 OLAP Server與DB2 Warehouse Manager集成.364.3.4 DB2 OLAP Server支持的前端工具.364.4 DB2 OLAP ANALYZER.374.5 數據挖掘工具(IBM INTELLIGENT MINER).374.5.1 數據挖掘的實現方法.38IBM 公司數據倉庫/商業智能解決方案4.5.2 數據挖掘基本方法.394.5.3 數據
4、挖掘與多維分析相結合.40第五章第五章 工程服務和售后服務工程服務和售后服務 .415.1 工程服務.415.2 售后服務.415.2.1 IBM數據倉庫的安裝及配置服務.415.2.2 IBM數據倉庫的維護服務.415.2.3 IBM數據倉庫的顧問服務.425.2.4 IBM培訓服務.425.3 技術文檔.42IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 1 頁第一章第一章 概述概述隨著市場競爭的日益激烈,各家公司紛紛把提高決策的科學性、合理性提高到一個新的認識高度。在此背景下,利用信息技術的最新手段,利用業務數據進行面向決策的分析這一方法紛紛被國內外許多
5、公司所采用。通過有目的、有選擇地采集業務數據,并將其轉換為對決策有用的信息,用于智能化的分析、預測和模擬等目的,這樣的應用被稱為商業智能應用。從國內外各行各業的發展經驗看,實施商業智能是提高企業進行高效的業務分析和科學決策的有效手段。作為一個具有八十多年歷史,以開發信息技術和商業應用而聞名的“藍色巨人” ,IBM 在這一領域進行了多年的研究,發展出完備的商業智能技術,為商業數據自動轉化為商業知識提供了現實的方案。商業智能的本質,是提取收集到的數據,進行智能化的分析,揭示企業運作和市場情況,幫助管理層做出正確明智的經營決定。一般現代化的業務操作,通常都會產生大量的數據,如話單、賬單以及客戶資料等
6、,其中一部分是決策關鍵數據,但并不是所有的數據都對決策有決定意義。商業智能包括收集、清理、管理和分析這些數據,將數據轉化為有用的信息,然后及時分發到企業各處,用于改善業務決策。企業可以利用它的信息和結論進行更加靈活的階段性的決策:如采用什么產品、針對哪類客戶、如何選擇和有效地推出服務等等,也可以實現高效的財務分析、銷售分析、風險管理、分銷和后勤管理等等。這一切都是為了降低成本、提高利潤率和擴大市場分額。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 2 頁第二章第二章 商業智能綜述商業智能綜述2.1 商業智能基本結構商業智能基本結構當今,許多企業認識到只有靠充
7、分利用,發掘其現有數據,才能實現更大的商業效益。日常的商務應用生成了大量的數據,這些數據若用于決策支持則會帶來顯著的附加值。若再加上市場分析報告、獨立的市場調查、質量評測結果和顧問評估等外來數據時,上述處理過程產生的效益可進一步增強。而數據倉庫正是匯總這些商用信息后,進而支持數據發掘、多維數據分析等當今尖端技術和傳統的查詢及表報功能,這些對于在當今激烈的商業競爭中保持領先是至關重要的。那么怎樣把這樣大量的數據轉換成可靠的、商用的信息以便于決策支持呢?建立數據倉庫正被廣泛地公認為最好的轉換手段。圖 1數據倉庫建立過程根據 IDC 的調查,使用數據倉庫的投資回報率平均超過 400,尤其是從小型數據
8、倉庫開始實施的平均超過 500。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 3 頁2.1.1 IBM 數據倉庫架構IBM 早在 90 年代初期,就投入大量優秀技術人員和資金開始了數據倉庫的研究,并啟動了 Star-Burst 大型科研項目。該項目主要就是為了攻克數據倉庫領域的一些技術難題,例如優化星型連接(Star-join),實現多維分析。因此,IBM現在發布的數據倉庫產品都是經過反復推敲和久經考驗的,真正做到讓用戶買起來放心,用起來舒心。基于對數據倉庫結構的深刻理解和多年積累的經驗,IBM設計了自己的數據倉庫結構,見下圖:數據倉庫的組成。作為一個開發式
9、結構,它方便了用戶的產品選擇、實施和今后的擴展。圖 2IBM 數據倉庫架構上圖為 IBM 三層次數據倉庫結構:從第一層 OLTP 業務系統到第二層數據倉庫為建倉過程,從第二層到第三層數據集市為按主題分類建立應用的過程。第一步包括數據抽取、數據轉換、數據分布等步驟,按照統一的數據格式標準進行統一的數據轉換,建立可被企業各部門充分共享的數據倉庫。其中,數據抽取階段完成對各種數據源的訪問,數據轉換階段完成對數據的清洗、匯總和整合等,數據分布階段完成對結果數據存儲的分配。這三個階段通常緊密結合在一起,由一個產品或幾個產品配合實現。例如,DB2 Warehouse Manager 既可獨立完成,又可結合
10、 DataJoiner、DataPropagator 實現對異構數據和數據復制的處理。DB2 Warehouse Manager 可進行數據映射的定義,以定期地抽取、轉換和分布數據;IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 4 頁DataJoiner 可訪問的各種關系型數據庫包括 DB2 數據庫家族、ORACLE、SYBASE、INFORMIX 和 MS SQL Server 等;DataPropagator 主要用于數據復制,采用數據復制的方式可對業務數據倉庫進行增量數據更新,避免對作業系統事物處理性能的影響和大量重復抽取數據。數據的存儲由 DB2 家
11、族產品來完成,以保證數據倉庫始終高性能地運轉,提供完整、準確的數據,便于將來的升級和擴展。第二步,在按主題分類建立應用時,若既想擁有多維數據庫的獨特功能,又要把數據存放在關系型數據庫中以便管理,則 DB2 OLAP Server 是用戶的最佳選擇。DB2 Warehouse Manager 中提供的 Information Catalog 通過描述性數據幫助用戶查找和理解數據倉庫中的數據,Intelligent Miner 用于數據挖掘以便幫助決策者預測或發現隱藏的關系。最后,我們以報表或圖形的方式將結果數據呈現給用戶,這通常由第三方產品來實現,它們包括:Hyperion Analyzer,
12、Cognos,Brio,Business Objects 等。商業智能的實現方式多種多樣,其規模和特點由用戶的需求來決定。但萬變不離其宗,其基本體系結構往往包括三個部分。2.1.2 數據倉庫:用于抽取、整合、分布、存儲有用的信息一個企業的信息往往分布在不同的部門和分支機構,管理者要綜觀全局、運籌帷幄,必須能迅速地找到能反映真實情況的數據,這些數據也許是當前的現實數據,也可能是過去的歷史數據。因此,有必要把各個區域的數據集合起來,去其糟粕、取其精華,將真實的、對決策有用的數據保留下來,隨時準備管理人員使用。因此,數據倉庫不僅僅是個數據的儲存倉庫,更重要的是它提供了豐富的工具來清洗、轉換和從各地提
13、取數據,使得放在倉庫里的數據有條有理,易于使用。2.1.3 多維分析:全方位了解現狀管理人員往往希望從不同的角度來審視業務數值,比如從時間、地域、產品來看同一類業務的總額。每一個分析的角度可以叫作一個維,因此,我們把多角度分析方式稱為多維分析。以前,每一個分析的角度需要制作一張報表。由此產生了在線多維分析工具,它的主要功能,是根據用戶常用的多種分析角度,事先計算好一些輔助結構,以便在查詢時能盡快抽取到所要的記錄,并快速地從一維轉變到另一維,將不同角度的信息以數字、直方圖、餅圖、曲線等等方式展現在您面前。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 5 頁2.
14、1.4 前臺分析工具提供簡單易用的圖形化界面給管理人員,由他們自由選擇要分析的數據、定義分析角度、顯示分析結果。往往與多維分析工具配合,作為多維分析服務器的前臺界面。以上三部分是商業智能的基礎。它完成的是對用戶數據的整理和觀察,可以說,它的工作是總結過去。在此基礎結構之上,商業智能可以發揮更進一步的作用,利用數據挖掘技術,發現問題、找出規律,達到真正的智能效果:預測將來。2.1.5 數據挖掘正如在礦井中可以挖掘出珍貴的礦石,在數據倉庫的數據里也常常可以挖掘出業務人員意想不到的信息。它比多維分析更進一步。例如,如果管理人員要求比較各個區域某類業務在過去一年的情況,可以從多維分析中找答案。但是,如
15、果管理人員要問為何一種業務在某地區的情況突然變得特別好或是不好,或者問該業務在另一地區將會怎么樣,這時數據挖掘工具可以作出回答。簡單的說,數據挖掘使用統計、分析等數學方法、以及電腦學習和神經網絡等人工智能方式,從大量的數據中,找尋數據與數據之間的關系。這種關系,一般顯示數據組之間相似或相反的行為或變化。一個細心的分析者,往往能從這些發掘出來的關系得到啟示。而這種啟示又很可能使得到它的業者,獲得其他競爭者所沒有的先機 。數據挖掘要求有數據倉庫作基礎,并要求數據倉庫里已經存有豐富的數據。因此,在實施商業智能方案時,一般分兩步走:第一步實現數據倉庫和多維分析,構造商業智能的基礎,實現分析應用;第二步
16、實現數據挖掘,發揮商業智能的特色。2.2 商業智能方案實施原則商業智能方案實施原則實施商業智能方案項目工程,與實施傳統的應用系統有很大的不同。其中最重要的是,商業智能的實施是不斷的交流過程,只有雙方緊密的合作才能取得實施的成功。 我們建議,工程實施上采取以下原則:IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 6 頁2.2.1 分階段、循序漸進的原則任何一個項目的實施都是一個發現問題,解決問題,積累經驗,又遇到新問題,再解決,再積累的循序漸進的過程。我們建議 XXX 公司 應根據現有的資源以及今后發展的方向,分階段、循序漸進的實施商業智能方案。2.2.2 實用
17、原則在第一步實現數據倉庫時,盡量針對當前電信最關心的主題,并將該主題進行細致分析,盡可能用簡單、統一、易于使用的方式來實現,避免追求片面的復雜和完美。2.2.3 知識原則普遍說來,由于商業智能技術相對而言比較新,企業的信息技術人員對數據倉庫、多維分析、數據挖掘等系統涉及的知識往往存在著不足或偏差,實際應用經驗也很欠缺。因此,我們建議在實施過程中結合專家培訓和服務,在商業智能系統的設計、開發、實施當中,逐步培養出企業自己的系統管理、維護和開發人員。當系統投入使用時,這些人員可以對系統進行維護和管理,并負責對最終用戶進行培訓。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公
18、司機密第 7 頁第三章第三章 XXX 公司公司 BI 系統方案系統方案 3.1 XXX 公司公司 BI 系統的需求分析系統的需求分析在 XXX 公司 的 BI 系統中,可以實現如下一系列經營過程中的分析和決策支持:除了以上列出的一系列分析和預測外,利用 BI 系統,還應該能夠根據XXX 公司 的需求很方便地擴展其功能。3.2 IBM 的解決方案的解決方案基于 XXX 公司 BI 系統的需求,以及 IBM 公司在數據倉庫領域的經驗,我們提出以下解決方案:采用一個企業級的數據倉庫,實現各分行業務數據的自動采集、清洗、匯總,并且通過多維分析工具,讓用戶能夠有效的將數據轉化為靈活的報表和決策支持信息,
19、最終滿足用戶的信息需求。該方案的實現方式如下:首先,在數據主要來源于兩個方面:綜合業務系統和新錄入的數據。綜合業務系統中的數據通過數據倉庫工具進行自動采集、清洗、整理,而需要新錄入的數據則通過瀏覽器方式錄入。在構造數據倉庫的過程中,我們采取以點帶面的做法,采用小步長、逐步地建立數據倉庫的策略。以 XXX 公司 報表系統為開端,分階段地實現商業智能應用。小的項目可以立即顯示數據倉庫的價值,同時也提供了更快的投資回報。而且,先在只有少量的數據和用戶的小系統上進行學習和實踐,對技術人員來說會學得更快。我們希望首先在需求較為迫切的領域,選擇一些比較有意義的主題;基于這些主題,我們將建立一個數據集市,待
20、用戶能夠對數據倉庫的概念和一些技術有了比較深刻的認識之后,再綜觀全局,構建起企業級的數據倉庫。數據錄入可以采用數據文件快速裝入的方式,也可以采用專門應用的方式。如果采用后者,我們可以考慮使用 IBM 的 WebSphere 和 VisualAge for Java 進行開發,它們產品是 IBM 電子商務應用的重要部件。利用這兩個工具,我們可以方便地建立 Web 頁面,生成 Java 程序,包括 Applet、Servlet 和 Application 等等。并且系統的維護工作也比較方便,當需要修改應用時,只需要修改服務器上的程IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有
21、限公司機密第 8 頁序就可以了,不需要在客戶端做工作。另外,這種結構對客戶機的配置要求也不太高。在建造數據倉庫的過程中,我們推薦使用 IBM 的 Warehouse Manager,該產品是 IBM 用來建立數據倉庫的工具,利用該工具,我們可以方便、快捷地構造起數據倉庫來,因為我們應該認識到數據倉庫必須建立在一個開放的、可更改的結構上,以便能夠處理數據和需求的不斷膨脹。Warehouse Manager 正是這樣的一個工具。提供一個開放的,從數據源到數據倉庫的一致的解決方案。在 XXX 公司 的 BI 系統中,通過 Warehouse Manager 管理器可以方便地建立數據加工的流程(pro
22、cess)和步驟(step),這些步驟反映了 XXX 公司 具體業務數據的流程、規則。在各步驟中可以定義代理(agent)來自動運行數據傳遞、清洗和匯總功能,這些步驟可以按時間、事件運行,或由其它步驟觸發。代理可以運行在 Warehouse Manager 服務器上,也可以運行在遠程的業務主機上,并且可以有多個代理運行以提高效率。可以以非常直觀的圖形化方式管理數據倉庫,當報表系統的業務需求發生變化時,可以非常方便地修改步驟,滿足變化多端的商業競爭環境。Warehouse Manager 是專門為商業應用設計的,它可以自動在網絡上進行數據的傳送,不需要人為干預,并且利用它的日志功能可以對系統運行
23、很好地監控。在 DB2 Warehouse Manager(DWM)中含有 Warehouse Agent 部件,它可以用來在位于數據倉庫的目標數據庫 DB2 UDB 中執行直接執行數據倉庫的數據加工。另外,在數據倉庫服務器于業務系統之間的文件數據 FTP 傳輸以及從表中抽取少量數據也可以通過 Agent 直接執行。建立數據倉庫之后,選擇一些有意義的主題,抽取相關的數據到 DB2 OLAP Server 中,利用 DB2 OLAP Server 的強大分析功能,給最終用戶提供在線多維分析的功能,能夠讓最終用戶充分挖掘出數據中包含的信息。DWM 在執行完數據的提取任務后,自動觸發預先定義好的 O
24、LAP 操作,將數據經過匯總計算后加載至 DB2 OLAP Server 中。最終用戶工具我們選用 DB2 OLAP Analyzer,這個產品是一個數據倉庫的前端分析工具,利用這個工具用戶可以很容易地訪問 OLAP Server 中經過處理的數據,制作各種形式、風格的報表,報表內容可以包括數字、圖像、曲線等,使得管理層可以直接、直觀地查看企業的經營情況。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 9 頁3.3 建議架構建議架構生產系統1生產系統2生產系統3 Intranet/InternetBrowserWindows 2000Meta Data管理/數
25、據倉庫控制DB2/Warehouse Control CenterDB2 Warehouse ServerDB2 OLAP Server Application ManagerDB2 Intelligent Miner ClientWindows 2000查詢分析WEB應用服務器DB2 OLAP Analysis ServerHTTP ServerDB2 UDB EEDB2 Warehouse ManagerDB2 Intelligent Miner for DataDB2 Intelligent Miner ScoringOLAP DataWarehouseDataRS/6000DB2 OL
26、AP Server圖 3XXX 公司 BI 系統軟硬件配置示意圖在此方案中,采用 RS/6000 服務器作為運行數據倉庫目標數據庫的服務器,其上安裝 DB2 UDB EE、DB2 Warehouse Manager,用來從生產系統抽取對決策有用的業務數據,經過加工后存放在數據倉庫中。在海量數據倉庫基礎上針對每一類具體業務問題建立數據集市。由于 XXX公司 BI 系統中的業務問題大多是多維分析問題,故利用另外一臺 RS/6000 服務器運行 IBM 公司專門的多維分析服務器產品 DB2 OLAP Server,以極大地加快多維分析的速度。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IB
27、M 中國有限公司機密第 10 頁在數據倉庫服務器上同時安裝 DB2 Intelligent Miner for Data,從數據倉庫服務器中抽取數據進行智能挖掘;此外,在數據倉庫上安裝 DB2 Intelligent Miner Scoring,用來將數據挖掘的結果作用到數據倉庫中,實現打分功能。所有客戶端以瀏覽器方式,通過查詢和多維分析的 WEB 應用服務器訪問數據倉庫和多維分析服務器中的數據。整個系統需要在一臺運行 Windows 2000 的PC 服務器上安裝 DB2 OLAP Analyzer Analysis Server 以及 HTTP Server,作為為前端瀏覽器客戶提供統一入
28、口的應用服務器。為提高系統響應時間及提供負載均衡能力,可以配合 WebSphere Application Server 共同使用。另外,需要配置一臺 PC 服務器運行 Windows 2000 作為整個系統的控制服務器,安裝 DB2 Warehouse Control Server、DB2 Control Center、OLAP Server 控制臺 OLAP Server Application Manager 以及挖掘服務器前端 DB2 Intelligent Miner for Data Client。此方案的優點:基于公司的業務需求。各業務部門可以根據自己的需要定義數據集市的內容,并
29、進行各種指標的多維分析,在實際應用中不斷擴展系統,為決策者提供必要的信息。高性能、高效率。數據都在本地運行,數據量相對較小,因此對服務器計算能力的要求相對較低。同時由于在局域網上運行,對網絡帶寬基本不會有壓力,并且用戶響應時間可以得到保障。最大限度地減少網絡負荷。各客戶端通過瀏覽器方式從中心數據倉庫中獲取數據,只有需要的數據被傳輸。滿足 XXX 公司 未來發展的需要。此方案具有很好的可擴展性,隨著 XXX公司 業務量的增加,業務數據的增多,各種業務系統的建立,此方案可以容易的適應這些變化,滿足業務的需求。一次性投資,長期受益。此方案不僅可以滿足 XXX 公司 目前 BI 系統的需要,更為重要的
30、是為 XXX 公司 商業智能應用打下了一個堅實的基礎。XXX 公司 可以在此基礎上開發各種商業智能應用,輔助決策者制定業務計劃和措施,在激烈的競爭中保持良好的勢頭。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 11 頁第四章第四章 所選所選 IBM 產品簡介產品簡介在這次的商業智能解決方案中,采用的產品包括數據庫 DB2 UDB、數據倉庫(DB2 Warehouse Manager)、多維數據庫(OLAP Server)、前臺分析工具(DB2 OLAP Analyzer)及智能數據挖掘服務器(DB2 Intelligent Miner for Data)。以
31、下是各個產品的描述說明。4.1 DB2 UDB4.1.1 概述:DB2 家族(Family)與 DB2 通用數據庫(UDB) V7.2IBM DB2 家族的各種關系數據庫管理系統適用于各種硬件平臺,其中包括基于 Intel 的微機、IBM 的或非 IBM 的各種 RISC 服務器和工作站、大型并行處理機、AS/400 中型計算機系統以及運行 VM、VSE 和 MVS、OS/390 操作系統的主機系統。各種平臺上的 DB2 有共同的應用程序接口,因此運行在一種平臺上的程序可以很容易地移植到其他的平臺。DB2 家族產品能夠滿足不同用戶的需求,它包含了從單用戶的微機系統到支持 80 萬用戶的主機系統
32、。DB2 家族除了包含在各種平臺上運行的數據庫管理系統內核之外,產品包中還包括了數據復制、數據庫系統管理、環球網(Internet)網關支持、在線分析處理、多媒體支持和各種并行處理能力,免費提供免費提供 DB2 UDB V7.2 在在 PC 和和 UNIX 平臺上的客戶機端平臺上的客戶機端產品產品(DB2 CAE),并為所有平臺上的異構數據庫訪問提供“中介件”(Middleware)解決方案。可運行在基于 Intel 的微機及各種 RISC 服務器(UNIX 平臺)上的 DB2 UDB V7.2 包括:DB2 for AIX,DB2 for HP-UX,DB2 for SUN Solaris,
33、DB2 for OS/2,DB2 for Windows NT,DB2 for Win95,DB2 for Win98,DB2 for Linux,DB2 for SCO,DB2 for Sinix,DB2 for NUMA-Q 等等。這些產品是全功能、具有工業強度的關系數據庫管理系統,分別用于服務器和工作站平臺。可以把它們配置到單個的系統上,或者配置到支持客戶機工作站的 LAN 服務器上,還可以把它們配置為環球網(Internet)上的數據庫服務器。如果使用服務器配置,那就允許DOS、Windows、OS/2、Win95、Win98、Macintosh 或 UNIX 客戶機去訪問 DB2服務
34、器,可以使用 TCP/IP、IPX/SPX、NetBIOS 或 APPC 等網絡協議;如果作為環球網上的數據庫服務器,則可由一臺瀏覽器(Web Browser)作為客戶機訪問。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 12 頁DB2 通用數據庫(UDB) V7.2 產品建立在一個共同代碼的基礎之上,依據多進程/多線索結構進行設計,其數據庫引擎的核心技術來自 Starburst 研究項目以及 DB2 for OS/390 等主機產品,而且它們在數據和應用的可移植性兩個方面與DB2 家族中的其他成員完全兼容。因而任何受過一種平臺上的 DB2 培訓的人員能夠很
35、容易地使用其他平臺的 DB2 產品。在保持這種外在的兼容性以及具備DB2 家族成員所必需具備的可靠性和可管理性的同時,實際上它們每個產品還針對各自的平臺環境作了調整和優化以達到業界領先的性能/價格比。DB2 產品家族提供了完整的中文支持,對中文的支持貫穿于從微機到主機的所有平臺,這是任何其他數據庫廠家做不到的。圖 4DB2 家族產品4.1.2 DB2 通用數據庫(UDB) V7.2 的特色DB2 通用數據庫(UDB) V7.2 無論在網絡計算方面還是在線分析、多媒體處理,都能給你全面、滿意的支持,而且集成了豐富的數據庫管理工具,把原來復雜的管理工作變得非常簡單。DB2 V7.2 致力于商業智能
36、和數據倉庫方面的改進,包括自動觸發器,多分區和多表的自動總計表格,優化星式結構的連接方法,使查詢和整個系統的反應速度大大提高。同時也增加了在裝載和在線重組時對索引的維護。在 DB2 中還新增了統計、線性回歸等功能,直接支持進一步深入分析,以便利用 DB2 的查詢處理實用程序,而以往只能在應用程序級上做到這一點。另外,在支持 16 和IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 13 頁32KB Pages、多個緩沖池(multiple buffer pool)的優化、更快的完整性約束處理、處理更多查詢的星式連接等方面,做了一系列的改進。應一些 IBM 合作伙
37、伴軟件提供商的要求,DB2 UDB V7.2 包含以下擴充性能:表/視圖/別名的命名長度限制由原來的 18 個字符擴充為 128 個字符。列命名長度限制由原來的 18 個字符擴充為 30 個字符。SQL 語句的最大長度由原來的 32KB 增大到 64KB。頁大小從 16KB 增大到 32KB。最大變量字符為 32KB,取決于頁大小。最大表/表空間的大小從 128GB 擴大到 512GB,取決于頁大小。索引關鍵字長度從 255 字符擴大到 1,024 個字符。嵌入式 SQL 編程支持宏。DB2 V7.2 對統一代碼(Unicode)的支持:16-Bit 固定長度的 Unicode 包含所有通用文
38、本字符,容許定長字符序列(以便分析)和設定含義的字符。對 UCS-2和 UTF-8 格式的支持,允許用戶用各種主要語言創建數據庫和存取數據。DB2支持 wchar_t 數據類型,使得用戶在單字節環境(如英語環境)下開發的應用在其他環境(日語)下也可照常運行。DB2 UDB V7.2 增強面向對象的 SQL 和 SQL 擴展,集成 Windows 平臺,打包新增免費軟件。產品集成改變主要包括通用數據支持,免費新增數據倉庫中心和 DB2 OLAP starter kit。用戶可以使用 DB2 的數據連接器(DataJoiner),象訪問DB2 數據資源一樣,訪問 Oracle, Sybase, I
39、nformix, SQL Server 等數據庫。用戶只需熟悉 DB2 語法即可在跨平臺的復雜環境中輕松獲取非 DB2 數據。DB2 UDB V7.2 選件中針對 Oracle 的關系連接部件可以使用戶通過標準 SQL 查詢同時訪問DB2 和 Oracle 的數據資源。DB2 UDB V7.2 的用戶現在可以跨越 DB2 數據庫、Oracle 數據庫或者一個OLE DB 資源進行分布式的查詢,也就是可以通過使用 DB2 通用數據庫的 SQL句法和 API 在一個工作單元的查詢內實現訪問和操作保存在異構數據資源中的數據。DB2 Relational Connect 加強了分散查詢功能,使 DB2
40、 用戶可以通過一個簡單的查詢來訪問 DB2 數據和存儲在 Oracle 數據庫中的數據。DB2 UDB V7.2 免費包含的數據倉庫中心把可視化倉庫的強大功能和 DB2控制中心的便捷特點結合起來,為需要商業智能的用戶提供友好的用戶界面。用戶可以使用數據倉庫中心對數據進行定義、自動取樣、轉換、發布、以及為數據倉庫加載數據。這種新功能可以為一個部門或單位配置一個獨立的簡單數據中心。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 14 頁除數據倉庫中心之外,DB2 還在 Wizards,模式名模型(Schema Modeler)、元數據交換(Metadata Int
41、erchange)等方面做了改進。DB2 UDB V7.2 數據倉庫中心使用了更便捷的新界面,用于創建、設計、儲存以及維護數據倉庫以及 OLAP 表。DB2 數據倉庫管理器產品在大量數據傳遞、元數據管理以及查詢管理方面做了改進。DB2 UDB V7 中包含了一些先進的高級面向對象 SQL 功能,對開發人員和分析員都非常有用。這些聚合功能用于 OLAP 應用計算,這是在 SQL-99 中很難或根本無法實現的,其符合 SQL-99 OLAP 附錄中建議的標準。DB2 現在可以提供臨時表格支持,應用存儲點(saving point),標識欄(ID Column),嵌套存儲過程。SQL 過程語言( S
42、QL Procedure Language)支持創建DB2 存儲過程,符合 ANSI SQL99 中的存儲過程模型標準。DB2 UDB 存儲過程創建工具(SPB)是一個圖形應用工具,支持 DB2 存儲過程的快速開發。通過使用SPB,用戶可以在本地和遠程 DB2 服務器上創建、修改、運行、測試和調試存儲過程。SPB 提供 Windows、AIX 和 Solaris 下的開發環境,支持 DB2 系列產品,用戶可以從 DB2 UDB 程序組啟動 SPB,也可以從 MS VC+,MS VB,IBM VisualAge for Java,DB2 控制中心啟動 SPB。DB2 UDB V7.2 創建用戶定
43、義功能,表功能和行功能時允許包含一條 SQL 語句,這就減少了使用外部高級語言書寫這些功能的需要。DB2 UDB V7.2 推出了結構數據類型(或者叫做抽象數據類型),這可以讓用戶和開發商們創建帶有結構的表格。DB2 UDB V7.2 版本中包括了許多可以提高系統性能和改善系統管理的功能:能夠把 ODBC/CLI 應用程序包含的動態 SQL 語句轉換為靜態 SQL 并執行;活動日志最大可為 32GB;支持多個 TCP/IP 收聽者(listener) 。DB2 UDB 7 提供三個新的擴展器:(1) 空間擴展器(Spatial Extender):DB2 提出了空間 SQL 查詢概念(Spat
44、ially Enabled SQL Queries),使用戶可以在關系型數據庫中集成空間數據(通過坐標確定位置)和普通的 SQL 數據。這兩種技術的結合使用戶可以進行新型查詢。新的空間擴展器將能夠存儲和索引空間數據(坐標信息),并使用戶通過特定的空間數據查詢對其進行訪問。(2) DB2 XML 擴展器:IBM DB2 XML Extender 體現了 IBM 全面的 XML技術策略,在電子商務領域居業界領導地位。XML 擴展器是 IBM B2B服務器的組成部分,使 DB2 服務器可以支持 XML。IBM 曾為早期XML 技術被采用和發展起到了關鍵作用,此次該擴展器又提供了 XML存儲和數據交換
45、的新技術。通過存儲,XML 擴展器提供了 XML 文檔在DB2 中的存儲和恢復機制,并可高效地查詢 XML 內容。通過數據交換,XML 擴展器提供新的和已存在的 DB2 相關表格和 XML 格式文檔之間的映射。DB2 用戶可以在任何地方通過 XML 擴展器進行電子商務,實IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 15 頁現企業之間(B2B)和企業與消費者之間(B2C)的應用。本產品是免費的。A 支持先進的面向對象和多媒體應用自從 70 年代 IBM 發明關系數據庫以來,在數據庫市場上,關系型數據庫管理系統(RDBMS)得到極其廣泛的運用。關鍵任務的應用在
46、很大程度上依賴于RDBMS 的使用。然而,目前很多 RDBMS 用戶正轉向非傳統的、面向對象的應用,需要對更廣泛的形形色色的現實世界數據予以支持。比如,需要更有效地處理在 RDBMS 中的文本、聲音、視頻、映象等數據。DB2 通用數據庫(UDB)能夠支持這些先進的應用。DB2 把對傳統應用與非傳統應用的支持與數據庫體系結構集成在一起,對關系型數據庫進行面向對象擴展,形成新一代對象關系型數據庫系統(Object Relational DBMS)。DB2 UDB V7.2 提供了許多對面向對象及多媒體應用的支持。(1) 用戶定義類型(UDT)DB2 允許用戶定義新的數據類型,稱為用戶自定義類型(U
47、ser Defined Type)。例如,一個用戶可以定義兩種幣值類型:用 CDOLLAR 表示加拿大元,用USDOLLAR 表示美元。這兩種類型在內部可以用 decimal (十進制)類型來表示,但在意義上是有顯著差別的。它們彼此間不應也不能直接進行比較,也不可直接與 decimal 類型進行比較。這是通過 DB2 的面向對象強類型(strong typing)機制來保證的。象內設(built-in)類型一樣,UDT 可以用來定義表列的數據類型和用戶定義函數(UDF)的參數。例如,用戶可以定義一個類型:多邊形 Polygons,這個用戶自定義類型可有構造函數,還可有一組用戶定義的函數作用于它
48、,如求面積,求角度,以及旋轉多邊形等等。(2) 用戶定義函數(UDF)DB2 允許用戶用 C,C+等編譯語言定義新的函數,稱為用戶自定義函數(User Defined Function)。UDF 允許在查詢中包含強有力的計算過程和檢索判定,以便濾除在數據源附近無關的數據。UDF 使用戶有能力提供一組函數,它們作用于用戶定義的類型,形成面向對象的封裝,從而定義該 UDT 的行為語義。SQL 優化器考慮到 UDF 的語義和執行成本,這使得對待用戶定義的函數就完全象對待內設函數(如 SUBSTR 和 LENGTH)一樣。開發應用程序所用的語言環境可以不同,如 C、C+、COBOL、FORTRAN 和
49、 PL/I 等,借助于 SQL,應用程序共享一組 UDT 和 UDF。IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 16 頁把用戶定義的類型和函數組合在一起使用,就能把數據的表示和解釋該數據的一組函數定義都隱藏起來。利用它們能創建函數庫,這些函數庫可以是 IBM開發的,也可以是第三方經銷商或客戶自行開發的,然后直接把它們集成在數據庫中。(3) 大對象(LOB)LOB 允許用戶在一個數據庫中存儲特大(若干個 GB)對象。在 DB2 中有二進制 LOB(BLOB),字符 LOB(CLOB),雙字節字符 LOB(DBCLOB)等幾種類型。用 LOB 可以存儲多媒體
50、對象,如文檔資料、視頻信號、映象和聲音等。它也可存儲由 UDT 和 UDF 定義其語義的小型結構。DB2 支持一組用于 LOB 的功能強大的內設函數,如查找、子串和連接等。利用 UDF 方式用戶可隨時定義附加函數。另外,在一個表中可以定義多個 LOB 列。對 LOB 實現支持時要考慮到客戶對性能的需求,為此允許數據庫用戶或管理員執行如下操作:僅訪問應用程序需要的那部分 LOB,不必訪問整個 LOB。延遲或取消 LOB 的求值過程。在定義一個 LOB 列時,能做出選擇-對該 LOB 列是否作日志。把 LOB 數據存儲在不連續的數據庫分區中,這些分區是專為 LOB 管理而構造的。(4) 關系數據庫
51、擴展器(Relational Extenders)關系數據庫擴展器是一個預先包裝的用戶定義類型、用戶定義函數、觸發器、約束以及存貯過程的集合。利用 DB2 提供的對象關系型特征,把 DB2 的基于內容的搜索能力擴展到諸如文本、圖像、視頻、音頻之類的新的數據類型。使用關系擴展程序,只需簡單地添加由關系擴展程序提供的相應數據類型的列(如文本或圖像列),用戶就可以把文本文檔、圖像、視頻、音頻等連同常規企業數據一起存貯在 DB2 的表中,對這些表的結構或主關鍵列并沒有任何特殊要求。關系擴展程序還提供了一組用戶定義函數,用于對新數據類型的管理、索引和搜索。(5) 集成內容搜索集成內容搜索由 Relati
52、onal Extenders 通過用戶定義函數來支持。例如:DB2 Image Extender 提供了一組函數來支持關于圖像的、基于內容的搜索。一個用戶可以在一個 SQL 查詢中使用一個 Image Extender 函數來請求那些與一個現有圖像相似的圖像。并且,其實現對用戶是透明的,用戶只需簡單地把他的搜索請求表示為 SQL 查詢即可,該 SQL 查詢將自動地調用由擴展程序提供的函數。DB2IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 17 頁的基于 SQL 的、支持集成內容搜索的方法的另一個重要的優點是既可以在多種非常規的數據類型上搜索給定的查詢,又可
53、以在常規的數據上搜索給定的查詢。B 強勁的在線分析處理(OLAP)支持DB2 優化器能夠使用動態位圖索引(Dynamic Bit-Map Index Anding)即根據需要在相應字段上自動地動態生成位圖索引,從維數表格(Dimension table)中調選出符合條件的記錄,再和事實表格(Fact table)連接,提高了訪問多維數據的性能;而不是執行 Cartesian 的維數表格連接,避免了大量中間數據的生成,中間數據已實現了理論上的最小值。當連接所涉及的表達到三個或三個以上,DB2 可自動判斷是否使用星型連接技術(Star Join)和動態位圖索引進行優化。DB2 在 SQL 中新增加
54、了 ROLLUP 和 CUBE 功能,ROLLUP 功能通過在常規組的行中增加“小計”和“總計”行來提供擴展的組(GROUP),CUBE 功能增加了“cross-tabulation”行。它們通過星型連接(Star join)方式在關系型數據庫中支持在線分析處理(OLAP),使用立體的結構查看和歸納數據而不是傳統的平面結構。DB2 的優化器一向是值得 IBM 驕傲的,它提供了領先于其它數據庫廠商的基于成本優化技術,它在優化時考慮了 CPU 速度、磁盤 I/O 率、表格尺寸、有效訪問路徑,并且如果可能的話可以重寫查詢,以得到更高的性能。這更使得 DB2的在線分析處理(OLAP)功能如虎添翼。C
55、卓越的并行處理能力(1) 并行優化技術DB2 UDB V7.2 無論在 SMP 還是在 MPP 環境下,甚至在 SMP 節點組成的MPP 環境下,都可充分發揮其并行處理能力。查詢執行時被透明地分開后并行執行(稱作內部查詢并行性:Intra-query parallelism),過去需要數小時的查詢現在只需幾分鐘就可以完成。過去不能執行的查詢現在不僅可行,而且還能從中獲益。在 SMP 環境下處理并行,DB2 UDB 采用的是吸管模型(Straw model)。此時被執行的 SQL 相當于杯子中的水,而每個 CPU 相當于一根吸水的吸管,這樣被執行的 SQL 很快就被 CPU“吸干”了。在 MPP
56、 環境下處理并行,則相當于把杯子中的水先智能地分配給多個小水杯(參與 SQL 執行的節點機),這樣小水杯中的水就分別被每個節點機“吸干”了。有了好的模型僅僅是開了個好頭,DB2 UDB V7.2 中融入的最先進的技術才是成功的關鍵。(1) 并行優化:并行優化:從很多系統中抽取非常多的數據,這會耗費大量的時間,如果效率不高,還會浪費大量寶貴的處理能力。從串行數據庫中抽取數據有很多方IBM 公司數據倉庫/商業智能解決方案XXX 公司 /IBM 中國有限公司機密第 18 頁法,它們沒有必要象并行數據庫那樣運作。DB2 UDB V7.2 有一個查詢優化器,是由 IBM 研究機構開發的,它是專為提高并行
57、抽取數據的效率而設計的。這樣就可獲得高品質的查詢性能,特別是對特大型數據庫。(2) 全面并行全面并行(Parallel Everything):DB2 首先把數據分配到數據庫中的多個分區或子集中,這些數據庫位于多個 SP 站點或 SMP 服務器內。接著,DB2自動創建一個并行處理訪問計劃。數據掃描、合并、分類、負載平衡、表格重組、數據調用、創建索引、索引訪問、備份與恢復等一系列工作都是在所有不同的節點里同時完成的。DB2 UDB V7.2 以并行方式執行全部數據庫功能,這包括全部SQL 語句(Select、Insert、Update 和 Delete)、實用程序(backup,restore,
58、reorg,load)和數據存取方法(連接、表掃描和索引掃描)等,而且無需任何額外的編程。這不僅提供了更好的性能和可伸縮性,而且也提供了更佳的管理性有能力利用全部處理機去執行數據庫管理任務。進一步說,DB2 UDB V7.2 既可用于聯機事務處理(OLTP),又可用于決策支持查詢工作。(3) 管理工具在并行環境同樣適用:管理工具在并行環境同樣適用:Governor 幫助您控制每個用戶及應用程序的資源利用率,可自動調整查詢的優先級。從而,在線平衡負載,簡化系統管理,減少關機時間。通過并行在線備份功能可顯著減少備份及恢復所需的時間。(4) 并行環境下功能不受任何限制:并行環境下功能不受任何限制:D
59、B2 UDB V7.2 對多媒體數據的支持、支持的客戶端平臺、支持的應用開發接口和開發工具以及動態位圖索引等多維分析功能、對 WEB 和 Java 的支持均不受限制。(2) 對MPP結構計算機的獨特支持當企業的業務系統或數據倉庫系統的數據量不斷增大、并發用戶量不斷增大時,依靠單一的數據庫服務器往往難以獲得比較好的性能和處理能力。此時,由多臺服務器協同工作成為解決這一問題的有效手段。多臺服務器協同工作的手段主要有共享硬盤的集群式計算機,以及不共享任何資源而自以高速網絡相連的海量并行處理計算機兩種方式。隨著計算機科學的不斷發展,無論是科學計算領域還是在數據庫領域都已經備計算機科學家證明,海量并行處
60、理是目前解決大數據量、最大限度里并行處理能力的最佳手段。運行在 MPP 體系結構計算機上的 DB2 UDB V7.2 企業擴展版(Enterprise Extended Edition),作為并行關系數據庫它允許把單個數據庫映象散布到多個系統上,從而能利用所有系統的處理能力以滿足用戶對數據的需求。DB2 可以在并行處理的多個節點上同時運行某一查詢,從而提高查詢性能,必要時它可以重新編寫查詢以優化性能。然后,它自動生成用于并行處理的訪問方案。它包括以下針對 MPP 體系結構的特性:(1) 無共享無共享(Shared-Nothing)結構:結構:DB2 UDB V7.2 企業擴展版的體系結構設計為
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 設計文件會簽管理制度
- 評估公司內控管理制度
- 診所院內感染管理制度
- 調研活動備案管理制度
- 財務項目融資管理制度
- 財政系統合同管理制度
- 貨場門衛安全管理制度
- 貨車司機疫情管理制度
- 幼兒園活動《船》中班教案5篇
- 鉆孔承包協議書范本
- 不同產地西紅花的質量評價研究
- 人教版小學四年級下冊體育期末復習計劃
- 老年人攝影知識培訓課件
- 2025石獅市國企招聘考試題目及答案
- GB/T 16262.2-2025信息技術抽象語法記法一(ASN.1)第2部分:信息客體規范
- 豐田公司5s管理制度
- 審核技巧培訓
- 2025-2030中國煤炭行業深度調研及投資前景預測研究報告
- 鐵路施工高空作業安全教育
- TCPSS 1011-2024 直流散熱風扇運行壽命測試方法
- 人防門二次澆筑施工方案
評論
0/150
提交評論