




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
數據庫與數據倉庫第1頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫:構造企業商務智能P51商務智能關系數據庫模型數據庫管理系統工具數據倉庫與數據挖掘企業數據資源的管理先行案例:櫻桃為什么少了Ben&Jerry’s公司每天生產19萬品脫冰淇淋。產品及時輸入oracle數據庫,并采用數據挖掘工具。每周收到的電話投訴與產品關聯。在收到大量投訴某品種櫻桃不足的投訴后,使用智能工具數據挖掘,排除了生產流程,進一步,找到最終問題,包裝盒圖片貼錯了。第三章數據庫與數據倉庫第2頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫互聯網行業BI解決方案ProClarity公司介紹:普科(ProClarity)公司總部在美國,是微軟商業智能平臺的全球首選搭檔,其產品在BI客戶端領域連續兩年市場占有率(基于微軟OLAP)排名世界第一。自從1995年開始,普科公司就開始為世界3000強企業提供革命性的分析解決方案。普科公司的總部位于美國BoiseIdaho,產品和服務遍及歐亞大陸。普科公司目前支持著全球1600多家大中型客戶,包括AT&T,CompUSA,愛立信,通用電氣,惠普,TheHomeDepot,PennzoilQuakerState,ReckittBenckiser,Roche,西門子,USDA,Verizon和富國銀行等。普科公司是微軟公司長期的戰略伙伴。普科系列產品完全支持微軟SQLServer2000分析服務的全部功能。同時也支持SQL2005Beta版,目前ProClarity最新的版本是6.0。
第3頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫產品名稱:互聯網行業BI解決方案。版本:V2.0
發布時間:2004年3月方案介紹用戶問題——互聯網行業商務智能分析,如網絡游戲分析:一個游戲在初期,需要好的創意、策劃、美工、程序等等,但是到了一定的階段后,主要的挑戰將會是游戲的平衡性。不論是網絡游戲還是網絡競技,平衡性都是至關重要的。為什么游戲中總有玩家抱怨不平衡?為什么某些群體的玩家因為不平衡成批退出游戲?所以游戲的運營商和廠商需要時刻監控游戲中各個玩家的行為,防止玩家利用游戲Bug或舞弊來投機取巧。可以說一個游戲到了后期,平衡性是決定能否成功的關鍵因素之一。而怎樣才能達到平衡性呢?這就需要游戲商積極地、動態地、精心地調整游戲各個參數。為了做到這些,游戲商需要時刻監控游戲的運行情況。但是隨著玩家十萬、百萬的增長,我們怎樣來監控呢?如果發現游戲中某些異常表現,某比如些個別玩家的成長、行為與絕大多數玩家有較大差異。那么其原因可能是利用游戲中的Bug或者某些游戲管理員利用個人關系舞弊,上述任何一種情況都是成功游戲的大敵。此外玩家是游戲中真正的“上帝”。玩家的行為、趨勢也是游戲商最關心的。但問題的難點是如何掌握絕大多數玩家的趨勢?特別是這些趨勢隨時都可能變化!可以說只要掌握了趨勢,就可以預見未來,就可以贏得未來。方案特點:·客觀分析,隨時了解游戲的平衡性,使運營商和廠商進行調整。監控游戲運行情況,發現異常情況,最大限度地減少損失?!ふ莆战^大多數玩家的趨勢,提前預測可能出現的情況。第4頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫案例演示在實際案例中,邁思奇網游數據提取器定期(例如每天)收集游戲中玩家的歷史數據。把歷史數據經過抽取、轉換,導入數據倉庫(SQLServer2000)。然后進一步導入多維數據庫(AnalysisService)。我們用ProClarity(普科的商務智能工具)搭建分析平臺。通過網絡,游戲廠商或運營商可以隨時察看分析結果,從而獲得游戲平衡性的統計,監控游戲中的行為,掌握玩家動態。第5頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫SQLServer2005方案:從活躍玩家的統計情況可看出,各門派玩家的數目是不平衡的。桃花島遠遠高出一些。同時,桃花島100級以上的玩家比例較高。如何定義活躍玩家?這是游戲商可以根據自己的商務規則可以靈活定制的。例如,最近一個月上線超過3天的游戲者。第6頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫各門派級別升級速度的統計情況,首先,可以發現,各玩家的級別增長不是線性的。由入門到中層較快,由中層到高手漲速較緩。這是合理的。但是,在同一級別,往往是桃花島的玩家先到達這個高度,可見桃花島的玩家比較容易升級,這是游戲平衡性設計的失誤,必須進行調整。第7頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫玩家級別每日增長的統計情況,并且把每日級別增長超過6級進行報警,可以看出有的玩家一天增長了194級或者89級,明顯不正常,很有可能這些玩家在利用游戲中的bug,或者是某管理員的同學。企業的規模越大,越需要自動化的監控措施。因此,定義一系列的KPI(關鍵性能指標)非常重要。所有的KPI都是不需要任何編程,業務人員就可以定制的。第8頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫活躍玩家門派統計情況的樹型結構。這種分析方法叫做分解樹,可以從宏觀到具體,一層層了解運營中的狀況,是非常有效的新型分析手段。本解決方案除了具有上述的各種分析功能外,還有權限管理控制、各種報表導出格式、基于Internet的Thin-Client版本,以及個性化的定制、總經理儀表盤等等。用戶可以在任何時間,任何地點,不需要安裝任何特殊的軟件,只要通過瀏覽器,就可以看到全部的分析結果,還可以在此基礎之上進行深層分析??偠灾?,邁思奇網游BI解決方案的最大特點就是:將游戲中瞬息萬變的海量數據轉化為每一個業務人員都需要的信息。由此帶來的決策支持,風險預警等效益直接為游戲商帶來商業價值。本方案基于Microsoft的主要產品及平臺技術·MicrosoftSQLServer2000·MicrosoftSQLServer2000AnalysisService此外,使用了美國ProClarity公司的產品作為前端工具以及商務邏輯定制器。第9頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.1引言各個領域大量的數據(如銀行每天巨額的交易數據)蘊藏著豐富信息,如何處理這些數據得到有益的信息,人們進行了探索,推動了數據庫技術的發展。數據庫的定義:數據是數據的集合,由具有統一形式存放在外存中,并可被應用所共享。面對潮水般的數據,人們不滿足數據庫查詢,提出了深層次問題。能不能從數據挖掘中提取信息或知識為決策服務。數據倉庫是一個綜合的解決方案,主要用來幫助企業有關部門和業務人員做出更符合業務發展規律的決策。數據倉庫的定義:數據倉庫是面向主題的、集成的、穩定的、隨時間變化的數據集合,用于支持管理決策過程。第10頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫第11頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.1.1商務智能商務智能商務智能是企業利用現代信息技術收集、管理和分析結構化和非結構化的商務數據和信息,創造和累計商務知識和見解,改善商務決策水平,采取有效的商務行動,完善各種商務流程,提升各方面商務績效,增強綜合競爭力的智慧和能力。數據庫與數據倉庫是組織處理信息及實現商務智能最常用的方法(不同點)數據庫管理系統、數據倉庫及數據挖掘工具是完成信息處理和商務智能的常用工具??赡苌婕暗募夹g有:MIS、DSS、數據庫技術、數據倉庫、數據集市、數據整合與清洗工具、查詢和報告工具、在線分析處理工具、數據挖掘等。第12頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫第13頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.1.2兩種信息處理類型:P521.聯機事務處理(OLTP)–OLTP的基礎是數據庫,完成對基本數據的增刪改查。2.聯機分析處理(OLAP)–OLAP的基礎是數據倉庫,完成對數據的分析處理,用于支持決策。第14頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.2關系數據庫模型P53數據庫–是存儲在外存上的可共享的信息集合。能夠按照信息的邏輯結構對其進行組織存取.關系型數據庫–采用一系列二維表或文件來存儲信息.關系–實際上一個關系就是一張二維表.關系數據庫由兩部分組成:1.信息的邏輯結構,相當于日常填的表格。2.信息的具體內容,基本的數據,相當于表格填寫的內容。第15頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫數據庫是有序數據的集合學號 姓名 班級 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男學生信息第16頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫一個關系就是一個二維表格,也叫表。學號 姓名 班級出生年月性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男學生信息行記錄列字段
第17頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫關鍵字是能夠惟一地決定一個記錄的字段或字段的集合。每個表至少有一個關鍵字,可以有多個。學號 姓名 班級 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男關鍵字
第18頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫外部關鍵字反映了表與表之間的關系編號 名稱 專業 系別
8971 物理971 物理 物理系10971 應數971 應用數學 數學系10972 應數972 應用數學 數學系15951 電子951 應用電子學 自動化系學號 姓名 班級 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男外部關鍵字
第19頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫表是存放數據的對象表是記錄的集合記錄是一個完整的數據,由字段組成一個字段對應表的一列(字段名、字段值)學號 姓名 班級 出生年月 性別970812 王剛 8971 80年7月 男971003 劉金敏 10971 80年3月 女971005 彥芳 10971 81年5月 女971013 崔健 10971 80年5月 男971159 任維新 10971 80年7月 男記錄字段第20頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.2.0數據庫管理系統——從應用的觀點理解P58基本組成:DBMS引擎、數據定義子系統、數據操作子系統、應用程序生成子系統、數據管理子系統3.2.1信息收集(參P54)主要收集基本的業務數據,并進行分類。為下面的建立數據庫表打下良好的基礎。第21頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.2.2建立數據庫的基本過程(參P55~59)創建數據庫表結構(還可進行修改)在建立數據庫時,首先要創建數據字典.數據字典包括了信息的邏輯結構.實際上建立數據庫表的結構:數據庫庫結構(數據庫名、表名、字段名、各項的定義)其它概念:記錄,為一行數據。輸入有關數據(增刪改查?。┑?2頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫文件菜單第23頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫創建空數據庫使用數據庫向導請選擇……第24頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫設計表表向導第25頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫關鍵字索引插入行刪除行屬性生成器數據庫窗口新對象工具欄按鈕第26頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫格式工具表工具視圖編輯工具排序工具篩選工具查找新記錄刪除記錄記錄選定器字段選定器記錄定位按鈕記錄編號第27頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫設計視圖第28頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫數據表視圖第29頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.2.3信息內部的邏輯聯系主鍵Primarykey–指能夠唯一確定一個記錄的字段名P55外鍵Foreignkey–是取自另一個文件的主鍵P563.2.4內在的完整性約束(參P57)完整性約束有利于保證信息的合理性.采用數據庫管理系統,如MicrosoftOffice的Access數據庫,建立一個本班學生通訊數據庫,你認為主要步驟有幾步?主要文件應該有哪些字段名,數據類型是什么?第30頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫實施參照完整性約束關系類型第31頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.3數據庫管理系統工具——P57書上觀點數據庫管理系統可以定義數據庫的邏輯結構,并對數據庫中的信息進行存取和應用。數據庫管理系統包括以下組成:DBMS引擎數據定義子系統數據操作子系統應用程序生成子系統數據管理子系統DBMS引擎-處理來自其它子系統的查詢等請求,并將其轉換為對應的物理表達。物理視圖–是在存儲設備中如何將信息進行物理安排、存儲、應用的表現方法。邏輯視圖–重點是如何安排和存取信息,以滿足特定的業務需求。第32頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.3.1數據定義子系統數據定義子系統–幫助人們建立并維護數據庫中的文件結構。幫助建立數據字典。信息的邏輯結構——主要在建立數據庫文件結構時考慮重點:字段名、類型、寬度、小數位
行業透視用數據庫技術建立客戶的個性化視圖如MetLife公司創建一個允許顧客通過Internet訪問的數據庫環境。它們的銀行服務、投資服務、人壽保險和金融策劃還未包含在個性化數據庫中。第33頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.3.2數據操作子系統P59數據操作子系統–提供數據庫中的記錄增加、修改和刪除功能,提供用戶的操作界面。主要工具有:視圖、報表生成器、查詢工具和SQL查詢語言。1視圖–查看數據庫文件的內容,對其進行必要的修改、分類等。2報表生成器–快速定義報表格式,確定要發布的信息。3查詢工具QBE第34頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫單擊此外增加新記錄排序↓
↑,望遠鏡查詢第35頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫查詢工具(QBE)-幫助用戶以圖表的方式設計問題的答案。QBE格柵選擇標準第36頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫4結構化查詢語言(SQL)–是大多數數據庫環境下使用的標準的第四代查詢語言.基本語句格式:SELECT…FROM…WHERE(P92).SELECTPart.[PartNumber],Part.Cost,Employee.[Employee Name],Employee.[EmployeeNumber] FROMPart,Employee WHERE(((Part.Cost)>10));3.3.3應用程序生成系統P63應用程序生成系統是一種常用的開發工具,幫助用戶建立面向對象事務的應用程序。數據輸入界面DBMS定義管理公共程序編制語言第37頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.3.4數據管理子系統P63數據管理子系統-是數據庫管理環境,其功能:查詢優化、數據備份恢復、并發控制和更新管理.備份和恢復工具:定期將數據庫保存的信息進行備份.在信息被損環的情況下重新保存和恢復.安全管理工具–提供用戶存取、查詢信息的權限管理.查詢優化工具–提供給用戶查詢功能,以在最小時間內響應.重組工具–在信息存取過程中進行實時維護.并發控制工具–保證多人同時存取、修改信息的合法性.第38頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.4數據倉庫和數據挖掘P643.4.1數據倉庫引出:了解上月皮鞋銷售總收益額,簡單查詢即可。但是“實際銷售額與預算額比較、與過去5年同期銷售比較,了解在東南和西南地區上月銷售了多少雙黑色的42號皮鞋”,需要更深入的設計。只利用數據庫不夠。數據倉庫–信息的邏輯集合–來自不同的業務數據庫,將創建商務智能,以便支持企業的分析活動和決策任務。數據倉庫是一個綜合的解決方案,主要用來幫助企業有關部門和業務人員做出更符合業務發展規律的決策。數據倉庫的定義:數據倉庫是面向主題的、集成的、穩定的、隨時間變化的數據集合,用于支持管理決策過程。1數據倉庫具有多維性.2數據倉庫支持決策而非事務處理。僅支持在線分析處理(OLAP).第39頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.4.2數據挖掘工具P66數據挖掘工具–是用戶對數據倉庫進行信息查詢的軟件工具查詢和報表工具–類似于QBE工具,SQL語言和典型的報表生成器.智能代理–運用人工智能工具以形成信息發現的信息基礎,并創建商務智能。如華爾街股票分析軟件,結合神經網絡為股票和交易制定規則。多維分析工具(MDA)–允許人們從不同的角度觀察多維信息,主要是切片和切塊技術。統計工具–利用各種數據模型將信息存儲到數據倉庫中。數據倉庫工具技術基本查詢及報表前端工具在線分析處理(OLAP)數據挖掘(Datamining,DM)DSS等第40頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫3.4.3數據集市–小型的數據倉庫P68數據集市是數據倉庫的子集,僅聚集了部分數據倉庫的數據.3.4.4數據挖掘為職業生涯創造機會P69掌握工具為自已增加競爭力。第41頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫數據倉庫、數據挖掘與數據管理——補充數據倉庫是以信息主題為核心,從不同功能性數據庫中直接取得可用的數據源。傳統的數據庫適全特定和例行的數據處理需求。但數據庫要同時滿足例行+復雜查詢處理要求。決策支持的數據庫。MCI電話公司:趨勢分析、估算銷售成本(電影市場:20~50%銷售廣告成本,5000影幕,3年)、客戶維持率,以選擇更便宜有效的銷售方式。Wal-mart:分析顧客每次采購物品、時間及擺放地點等,找出關聯性,以決定每一家店的進貨方式、促銷戰略與店面貨物的最有效排列方式。美聯邦住宅局:數據倉庫將10年來分散于70個系統中預算及會計數據整合起來,供預算分析、支出分析、趨勢分析、方案評比和政策分析之用。Visa會員銀行:分析,發現欺詐的行為模式,減少16%偽造信息卡損失。思考:數據倉庫與數據挖掘主要利用什么數據?解決什么問題?第42頁,課件共47頁,創作于2023年2月第三章數據庫與數據倉庫數據庫與數據倉庫比較數據庫數據倉庫無重復數據重復詳細、少量匯總(微觀)詳細、少量匯總(宏觀)數據處理量(數個月)數據處理量(5-10年)經常異動不常異動提供作業層管理層服務每日交易的操作(增刪改查?。┲С止芾頉Q策需求(查詢打印)在線交易處理(OLTP)在線分析處理(OLAP)操作有
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年環保產業項目可行性研究評估報告
- 成人教育終身學習體系構建與平臺運營中的遠程教育技術發展趨勢報告
- 工業互聯網平臺數字簽名技術規范與工業互聯網平臺數據治理報告
- 社會實踐自我鑒定總結范文
- 大型公司辦公室管理制度
- 泵站配電安全管理制度
- 2025年四川省遂寧市中考生物真題(原卷版)
- 土溪鎮三公經費管理制度
- 加裝電梯出入口管理制度
- 分公司勞務派遣管理制度
- 初中生物中考全四冊復習知識點總結
- 2024年陜西省中考生物真題(含解析)
- 12J003《室外工程圖集》
- 浙江省杭州市濱江區2023-2024學年八年級下學期期末科學試題(解析版)
- 大學武術智慧樹知到期末考試答案章節答案2024年浙江大學
- 河南省許昌市2023-2024學年高一下學期期末考試生物試題(無答案)
- 農產品購銷合同范本版
- 農業工程概論智慧樹知到期末考試答案章節答案2024年昆明理工大學
- 中國古都西安英文介紹課件
- 《相遇問題》課件
- 《預防脊柱側彎》課件
評論
0/150
提交評論