數據庫系統導論_第1頁
數據庫系統導論_第2頁
數據庫系統導論_第3頁
數據庫系統導論_第4頁
數據庫系統導論_第5頁
已閱讀5頁,還剩36頁未讀, 繼續免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據庫系統導論第一頁,共四十一頁,2022年,8月28日第1章數據庫系統導論數據模型1.1數據庫方法特點與應用簡史1.2數據庫系統體系結構1.3數據庫系統的發展與演化1.4第二頁,共四十一頁,2022年,8月28日2023/2/1221.1數據模型1.1.1數據模型的定義與分類1.1.2一些典型的數據模型特點綜述什么是模型?

模型是人類學習知識、認識世界的基本手段方法,是系統知識的抽象表示,使我們可以把精力集中在問題的主要方面――只反映系統某些選定的方面,如結構、行為(操作)和約束等特征。什么是數據模型?是可精確、抽象描述數據如何表示的一組概念集(包括描述數據類型結構、數據關系和數據約束等數據結構化部分),并可選地包括一組描述數據如何操縱的操作方法集。第三頁,共四十一頁,2022年,8月28日2023/2/1231.1.2數據模型分類通常按描述DB結構概念的抽象層次進行分類高級數據模型(概念數據模型)所提供的概念抽象層次比較高,與領域用戶理解數據的方式較接近,能更好隱藏數據存儲組織和操作的細節。典型代表包括:E-R模型、擴展E-R模型(EER模型)和UML類圖等。低級數據模型(物理數據模型)所提供的概念描述了數據如何在計算機上存儲的具體細節。對應DBMS底層實現部分,沒有/也不需要有統一的標準實現主要感興趣者:DB系統開發專家。邏輯數據模型介于概念和物理兩類數據模型之間,是DB系統的主要工作模型。典型代表包括關系模型、OO模型和O-R數據模型,以及早期DB系統中用的層次模型和網狀模型。第四頁,共四十一頁,2022年,8月28日2023/2/124一些典型數據模型特點綜述--關系模型(1)第五頁,共四十一頁,2022年,8月28日2023/2/125一些典型數據模型特點綜述--關系模型(2)第六頁,共四十一頁,2022年,8月28日2023/2/126一些典型數據模型特點綜述--ER模型第七頁,共四十一頁,2022年,8月28日2023/2/127一些典型數據模型特點綜述--EER模型是ER模型的擴展模型(Enhanced/ExentedER),它在ER模型的基礎上,擴展了以下概念:類、超類/子類(ISA)關系、特化與泛化關系。EER的特化,能混合表達‘重疊/不相交’約束,以及‘完全/部分’約束。UNION子類或類別。EER的union子類,可表達完全和部分約束。多值屬性和復合結構屬性;與基本ER模型相比,EER模型表達能力更強,能表達更多的數據語義。3.2節將詳細介紹EER模型。第八頁,共四十一頁,2022年,8月28日2023/2/128一些典型數據模型特點綜述--UML類圖UML是一種基于OO范型的建模語言定義了一個用于建模的概念框架用符號表示概念連接符號(路徑)表示概念間的聯系。UML常用于對軟件系統進行描述和可視化構造,允許基于不同的視點,建立描述系統體系結構的各種視圖,其中:UML類圖也可作為一種有效的概念數據模型。所屬類型概念模型,它是一種視圖表達模型。數學基礎:無。第九頁,共四十一頁,2022年,8月28日2023/2/129一些典型數據模型特點綜述-ODMG模型(1)第十頁,共四十一頁,2022年,8月28日2023/2/1210一些典型數據模型特點綜述-ODMG模型(2)第十一頁,共四十一頁,2022年,8月28日2023/2/1211一些典型數據模型特點綜述-ODMG模型(3)第十二頁,共四十一頁,2022年,8月28日2023/2/12121.2數據模型1.2.1數據模型方法特點1.2.2書刊技術發展簡史第十三頁,共四十一頁,2022年,8月28日2023/2/12131.2.1數據庫方法特點與利用OS文件進行簡單的數據管理相比,利用DB進行數據管理至少具有以下優勢:具有更好的數據獨立性具有更好的數據存儲有效性更便于數據共享可以更好確保數據的完整性和安全性。具有并發存取和崩潰恢復功能。更有利于減小應用開發時間,提高應用的健壯性。不適合使用DB的一些應用舉例只有幾個嚴格定義的關鍵操作,必須用高效風格的代碼來實現。應用并不關心靈活查詢、安全性、并發存取和崩潰恢復等性能時。應用可能需要以DBMS不支持的方式來查詢數據。第十四頁,共四十一頁,2022年,8月28日2023/2/12141.2.2數據庫技術發展簡史(1)1960s年代初期通用電氣的巴克曼[1973年的ACM圖靈獎獲得者]等人設計成功第一個通用DBMS系統這個模型后來被CODASYL(theConferenceOnDataSystemsLanguages)進一步標準化,并強烈影響了整個1960s年代的DB系統技術.1960s年代后期IBM成功開發IMS系統(InformationManagementSystem)IMS是網狀數據模型之外的另一個重要數據表示模型(即層次數據模型)的基礎.第十五頁,共四十一頁,2022年,8月28日2023/2/12151.2.2數據庫技術發展簡史(2)1970s年初期

IBMSanJose研究室的提出了新一代的數據表示框架――關系數據模型,定義了關系數據庫的基本概念。該成果被認為是數據庫系統發展的一個分水嶺1970s中后期數據庫作為一個學科分支開始逐步走向成熟,關系DBMS也變得十分流行,其優點已被人們廣泛認可。利用DBMS管理公司/組織的數據逐漸開始成為趨勢。第十六頁,共四十一頁,2022年,8月28日2023/2/12161.2.2數據庫技術發展簡史(3)1980s年代關系數據模型成為DBMS的主流數據模型,并進一步鞏固了其領域地位。SQL在1986年被美國國家標準信息委員會(ANSI)和國際標準化組織(ISO)采納為關系數據庫語言的標準。該時期,最廣泛使用的并發程序形式是可并發執行的、被稱為“事務”的DB程序。第十七頁,共四十一頁,2022年,8月28日2023/2/12171.2.2數據庫技術發展簡史(4)從1980s后期到1990s年代初期DB領域在許多方面--從更強有力的查詢語言到各種新型數據模型,都得到了廣泛且深入的研究并取得了重要進展。很多著名的DBMS開發商,都增加了對大型圖像、文本等新數據類型的支持,增強了針對復雜數據集進行數據分析處理和回答更復雜查詢的能力,增強了支持創建數據倉庫的特性。該時期另一個重要進展是關于“對象數據庫系統(ODBMS)”研究和開發。但該時期,ODBMS相關技術及產品由于沒有統一標準,缺乏可移植性,故大都屬于原型產品。第十八頁,共四十一頁,2022年,8月28日2023/2/12181.2.2數據庫技術發展簡史(5)從1990s年代中期開始,DB進入了或許是最重要的Internet時代。幾乎所有DBMS開發商都在他們的產品中增加了更適合在Internet上部署的特性。第十九頁,共四十一頁,2022年,8月28日2023/2/12191.2.2數據庫技術發展簡史(6)1993年,ODMG提出了第一個對象數據管理標準ODMG1.0。該標準后續修訂版包括ODMG2.0(1997)和ODMG3.0(2000)。ODMG標準出現,不僅改善對象數據庫系統的可移植性,而且進一步促進了ODBMS的規范健康發展。新一代的ORDBMS不僅能提供了更為豐富的類型系統,包括復雜數據類型和面向對象,而且還在SQL-99標準的框架下,擴展了傳統的關系查詢/關系數據操縱語言,以適應更豐富的類型系統。第二十頁,共四十一頁,2022年,8月28日2023/2/12201.3數據庫系統體系結構1.3.1DB數據的三層抽象模型1.3.2一種典型的DBMS實現體系結構1.3.3五層DBMS體系結構模型第二十一頁,共四十一頁,2022年,8月28日2023/2/12211.3.1DB數據的三層抽象模型

第二十二頁,共四十一頁,2022年,8月28日2023/2/12221.3.2一種典型的DBMS實現體系結構第二十三頁,共四十一頁,2022年,8月28日2023/2/12231.3.3五層模型體系結構第二十四頁,共四十一頁,2022年,8月28日2023/2/12241.4數據庫系統的發展與演化1.4.1五層模型體系結構的發展綜述1.4.2層次模型與事務模型1.4.3體系結構變體1.4.4可靠性與可適應性1.4.5結論與展望第二十五頁,共四十一頁,2022年,8月28日2023/2/12251.4.1五層模型體系結構的發展綜述過去的20多年中,DB系統無論是在功能還是在性能方面,都已經發生了巨大變化。雖然其中大部分的增強和改變,已被五層體系結構模型所容納。但由于許多新特征/新特性引入,五層模型的各層次也不可避免需要進行一定的調整和變化。20多年前,SQL尚未標準化,關系模型也很簡單。今天,我們必須引用SQL-99,或引用對象-關系模型,它們的各部分通常較復雜且不那么好理解。第二十六頁,共四十一頁,2022年,8月28日2023/2/1226L5層的演化發展用戶定義類型、嵌套子表/類型、遞歸等新特性引入,須在L5層進行調整。通過增強利用各類實例統計數據,基于代價的查詢優化器得到了更成功的改進,但對標志性新概念--用戶定義類型,尚缺乏通用且有效的處置方法。在為動態QEP建立更有效優化器,以更好處理新資源適用性問題,以及減少查詢引擎的“剎車距離”等方面,已取得了一定進展,但還遠未達到可實用的程度。第二十七頁,共四十一頁,2022年,8月28日2023/2/1227L4層的演化發展(1)L4層適配技術,不僅與單個算法處理有關,而且與單個查詢的多個操作符,或與多個并發查詢處理有關。較新出現的、影響操作符實現的重要自適應技術:根據當前工作集設置和調整并行度;對重復進入的索引進行重排序或范圍整合;在多個查詢之間共享表掃描等技術。某些特定的查詢類型,如top/bottomN查詢、OLAP查詢,往往存在新的可動態優化機會。第二十八頁,共四十一頁,2022年,8月28日2023/2/1228L4層的演化發展(2)在針對一些已有標準操作的優化處理方面,也已提出了一些改進、建議和擴展算法,其中很多成果已被集成到商業DBMS系統中。一些原先被認為是非標準應用的操作,被重新利用并擴展了它們的使用范圍。如空間連接,或一些支持OLAP的功能。但僅通過調整已有的或增加新操作符,似乎并不足以或不可能應對呈‘爆炸性’增長的新類型集。第二十九頁,共四十一頁,2022年,8月28日2023/2/1229L3層的演化發展L3層是在過去20多年中,一項很“火爆”的研究熱點。通過提供更合適的存取路徑和存取結構,L3層中的操作已變為更加有效。VolkerGaede等人詳細分析對比了1998年以前提出的各種存取結構。但除了無處不在的B+樹,以及它的一些變體外,它們中只有少數結構被成功集成到特殊的數據處理系統。第三十頁,共四十一頁,2022年,8月28日2023/2/1230L2層的演化發展最劇烈改進發生在并不需DB研究者下太多功夫的L2層。Moore定律已為他們完成了大部分工作。巨大緩存容量也使平滑實現‘預取緩存分區’成為可能。隔離L2層的“段/頁”與L1層的“文件/塊”,為復雜的數據映射和更新傳播提供了機會。但至今,這方面體系結構還沒有任何變化發生。第三十一頁,共四十一頁,2022年,8月28日2023/2/1231L1層的演化發展L1層通常不是DB研究者們感興趣的焦點。操作系統(OS)研究者對文件系統處理的各種改進,只有部分會對DB管理有用。至今,對于L1層抽象,仍未得到任何事務支持。但標準的文件映射已更為精細,能支持2G字節的長字段和大對象。許多新出現的設備或技術的使用,已被能被透明地集成到體系的L1層中。RAID技術及存儲設備支持并行存取能力提高,為在L1~L3層支持不同的存儲策略和優化提供了新的機會。第三十二頁,共四十一頁,2022年,8月28日2023/2/12321.4.2層次模型與事務模型所謂的事務,指的是DBMS中一個可執行的、具有一定偏序的動作/操作序列。任何事務,都具有以下四個基本特性,即原子性、一致性、孤立性和持久性,簡稱ACID特性。進一步考慮ACID,層模型能更好幫助我們清晰描述概念和引出一些更合適的解決方案。第三十三頁,共四十一頁,2022年,8月28日2023/2/12331.4.3體系結構變體

在過去的20多年中,出現了很多較特殊的新型數據管理應用場景。如何將它們納入五層或簡化的DBMS體系?一個很好的觀察切入點是:DBMS結構變化決定于體系結構中“映射步”的變化。。我們應能通過標識相關層中變體組件和擴展映射,并通過解釋DB處理中的相似性和特殊性,來平滑處理各種體系結構變體問題。第三十四頁,共四十一頁,2022年,8月28日2023/2/1234DB處理的橫向分布變化:分布式DBMS系統圖1.5DBMSs沿水平分布擴展后演化成分布式DBMSs系統

第三十五頁,共四十一頁,2022年,8月28日2023/2/1235DBMSs處理的垂直分布變化:C/SDBMS這類DBMS體系結構的典型代表是所謂的C/SDBMSs(client/serverDBMSs)。它們的主要目標是:使應用或客戶機能有效使用DBMS的處理能力。C/SDBMSs通常被用在需要較長事務,且需要對數據進行檢查/校驗的場合。圖1.6中給出了三種常見的C/S體系結構變體。這方面面臨的主要挑戰是:如何利用當前查詢緩存結果內容,來處理聲明性的、面向集合的查詢。

第三十六頁,共四十一頁,2022年,8月28日2023/2/12361.4.3.3新的體系結構需求五層或其簡化體系結構已能很好滿足面向集合操作的、記錄式的數據庫管理,使得它們能以不變或稍許變化的方式,重用已有標準DBMS或其簡單變體來實現。然而,近年來,需求已有強烈偏離這種規范的傾向。一個最引人關注的進展是:基于組件體系的、松散耦合的數據庫系統研制與應用,這種體系現已被廣泛應用到對象-關系數據庫系統(ORDBMSs)中。例如,Informix的數據刀片(DataBlades)、Oracle的盒式插件(Cardridges)等框架結構。但目前這類方法尚未達到真正無縫集成的要求,也沒有達到所期許的性能和可伸縮性。將來的挑戰可能仍主要是面向體

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論