《access程序設計》課件全套 (何青)第1-9章 數據庫基礎- 項目綜合實訓_第1頁
《access程序設計》課件全套 (何青)第1-9章 數據庫基礎- 項目綜合實訓_第2頁
《access程序設計》課件全套 (何青)第1-9章 數據庫基礎- 項目綜合實訓_第3頁
《access程序設計》課件全套 (何青)第1-9章 數據庫基礎- 項目綜合實訓_第4頁
《access程序設計》課件全套 (何青)第1-9章 數據庫基礎- 項目綜合實訓_第5頁
已閱讀5頁,還剩1527頁未讀 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

Access程

計數據庫基礎第一章導師:UU數據庫技術產生于20世紀60年代,它是現代信息科學與技術的重要組成部分,是計算機數據處理與信息管理系統(tǒng)的核心,是計算機科學中的一個重要分支。隨著數據庫技術的發(fā)展,其應用范圍已經由早期的科學計算,逐步滲透到各行各業(yè)的業(yè)務中,如銀行業(yè)務、證券市場業(yè)務、火車飛機訂票業(yè)務等。本章主要介紹數據管理發(fā)展概況、數據庫系統(tǒng)、數據模型、關系數據庫和數據庫設計基礎等知識。目錄CONTENTS數據管理發(fā)展概況01數據庫系統(tǒng)0203關系數據庫04數據模型關系運算05數據庫設計0607關系數據理論目錄CONTENTS內容要點了解數據管理的發(fā)展掌握數據庫系統(tǒng)及其組成了解數據模型掌握關系數據庫了解數據庫設計基礎1.1Access

程序設計數據管理發(fā)展概況1.1.1數據、信息和數據處理1.1.2數據管理技術的發(fā)展數據管理發(fā)展概況1.1自從世界上第一臺電子數字計算機誕生以來,數據管理經歷了從人工管理到先進的數據庫、數據倉庫、數據挖掘的演變。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理1.數據2.信息3.數據與信息的關系4.數據處理數據管理發(fā)展概況1.11.1.1數據、信息和數據處理1.數據數據(Data)是指存儲在某種存儲介質(如計算機)上,能夠被識別的物理符號的集合,數據能夠反映事物的客觀特性。在日常生活中,人們用自然語言描述事物,而在計算機中,為了存儲和處理這些事物,就要抽象出事物中人們感興趣的、有代表性的特征,并用這些特征來描述事物,這些描述符號被人們稱為數據,并賦予了特定的語義。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理1.數據數據有一定的結構,其結構又分為型和值。數據的型是指數據的數據類型,如整型、實型、字符型等;數據的值是指符合數據類型的具體值,如整型數據73。數據的表現形式可以是多種多樣的,可以是數字、字母、文字和其他特殊字符組成的文本形式,也可以是圖形、圖像、動畫、影像、聲音等多媒體形式。在計算機系統(tǒng)中,一切能被計算機接收和處理的物理符號都稱為數據。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理2.信息信息(Information)是客觀現實世界中的事物、事件和概念的抽象反映。它所反映的是某一客觀系統(tǒng)中某一事物某一方面的屬性或某一時刻的表現形式。信息是數據的內涵,是對數據的語義解釋,是數據含義的體現,信息對于數據接收者來說是有意義的。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理2.信息例如,“楊林”“73”只是單純的數據,沒有實際具體的意義,但如果我們對數據進行解釋,解釋為“楊林的數據庫成績?yōu)?3分”,那么這就是一條有意義的信息。再如,“楊林今年73歲”“楊林駕駛的汽車當前的車速為73km/h”等都是有意義的信息。同一條數據可以根據實際需要解釋為多條有意義的數據。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理3.數據與信息的關系數據和信息是兩個互相聯系、互相依賴但又互相區(qū)別的概念。數據是用來記錄信息的可識別的符號,是信息的具體表現形式,是信息的載體。信息則是有用的數據,是數據的內涵。信息是通過數據符號來傳播的,而數據若不具有知識性和有用性,則不能稱為信息,因此只有經過加工處理,形成的具有使用價值的數據才能稱為信息。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理4.數據處理數據要經過加工處理才能成為有意義的信息,這個加工處理就稱為數據處理(DataProcessing)。數據處理是對各種形式的數據進行收集、整理、存儲、加工和傳播的一系列活動的總和。數據處理也稱為信息處理,簡單來說就是將數據轉換為信息的過程。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理4.數據處理數據處理的基本目的是從大量的、雜亂無章的甚至難以理解的原始數據中,整理、提煉、抽取出對人們有價值、有意義的數據(信息)作為決策的依據。數據管理發(fā)展概況1.11.1.1數據、信息和數據處理4.數據處理數據處理的真正含義是為了產生信息而處理數據。數據、信息和數據處理的關系如圖1-1所示。圖1-1數據、信息和數據處理的關系數據的組織、存儲、檢查和維護等工作是數據處理的基本環(huán)節(jié),這些工作一般統(tǒng)稱為數據管理。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展數據管理技術就是數據庫技術,是應對數據管理任務需要而產生的。數據管理是指對數據進行分類、組織、編碼、存儲、檢索和維護,是數據處理的核心問題。隨著計算機技術的不斷發(fā)展,在應用需求的推動下,在計算機硬件、軟件發(fā)展的基礎上,數據管理技術經歷了人工管理、文件系統(tǒng)、數據庫系統(tǒng)3個階段,每個階段的發(fā)展都以數據存儲冗余(重復)不斷減小、數據獨立性不斷增強、數據操作更加方便簡單為標志。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展數據管理技術經歷的3個階段:1.人工管理階段2.文件系統(tǒng)階段3.數據庫系統(tǒng)階段數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展1.人工管理階段20世紀50年代中期以前,計算機主要應用于科學計算,數據量較小,一般不需要長期保存數據,再加上受到當時硬件和軟件技術的限制,外部存儲器只有紙帶、卡片和磁帶,沒有硬盤等可以直接進行存取的存儲設備;軟件方面沒有操作系統(tǒng),沒有對數據進行管理的系統(tǒng)軟件;數據的管理完全在程序中進行,數據處理的方式基本上是批處理。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展1.人工管理階段在這個階段,數據操作在裸機上進行,由人工進行數據的管理。程序員在編寫應用程序時既要設計算法,又要考慮數據的邏輯結構、物理結構以及輸入/輸出方法等問題。程序與數據是一個整體,數據是面向程序的,如果數據脫離了程序就無任何存在的價值。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展1.人工管理階段一組數據只能對應一個程序,無法被其他程序使用,因此程序與程序之間存在大量的冗余數據。各程序之間的數據不能相互傳遞,缺少共享性,應用程序的設計和維護負擔繁重。另外,如果數據的類型、格式或者輸入/輸出方式等邏輯結構或者物理結構發(fā)生變化,則必須對應用程序做出相應的修改。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展1.人工管理階段概括起來,這個階段有如下特點:(1)數據不保存;(2)程序與數據不具有獨立性,數據完全依賴程序;(3)數據不能共享,冗余度極高;(4)用戶管理數據。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展1.人工管理階段在人工管理階段,數據和程序之間的關系如圖1-2所示。圖1-2人工管理階段數據和程序之間的關系數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段在20世紀50年代后期到60年代中期,計算機不僅用于科學計算,還大量用于信息處理。隨著數據量的增加,數據的存儲、檢索和維護等問題都成為急需解決的問題,并且此時數據結構和數據管理技術也已經迅速發(fā)展起來。在硬件方面,出現了能直接存取的大容量外部存儲器,如硬盤、磁鼓等,這為計算機系統(tǒng)管理數據提供了物質基礎。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段在軟件方面,出現了高級語言和操作系統(tǒng)等軟件。其中,操作系統(tǒng)中的文件系統(tǒng)是專門用來管理外部存儲設備中數據的管理軟件,文件是操作系統(tǒng)管理的重要資源之一,也是數據存儲在外部存儲設備中的最小單位。文件系統(tǒng)為數據管理提供了技術支持。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段文件系統(tǒng)提供了在外部存儲器上長期保存數據并對數據進行存取的手段。用戶可以把相關數據組織成一個文件存放在計算機中,由文件系統(tǒng)對數據進行存取管理。數據的處理方式有批處理,也有聯機實時處理。由于計算機此時大量用于信息處理,因此需要用戶能隨時對文件進行查詢、修改、插入和刪除等處理。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段文件中只存儲數據,不存儲文件記錄的結構描述信息,對數據的操作都以記錄為單位。文件的建立、存取、查詢、插入、刪除、修改等所有操作都要用程序來實現。在文件系統(tǒng)階段,文件的邏輯結構與存儲結構有一定的區(qū)別,這樣就使得程序與數據有一定的獨立性。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段數據的存儲結構變化不一定會影響到程序,因此程序員可以集中精力進行算法設計,從而極大地減少了維護程序的工作量。這個階段有如下特點:(1)數據可以“文件”的形式長期保存;(2)程序與數據具有獨立性,但獨立性低;(3)數據共享性差,數據冗余大;數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段數據的存儲結構變化不一定會影響到程序,因此程序員可以集中精力進行算法設計,從而極大地減少了維護程序的工作量。這個階段有如下特點:(4)對數據的操作都以記錄為單位;(5)數據的邏輯結構和物理結構有了比較簡單的區(qū)別;數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段在文件系統(tǒng)階段,數據和程序之間的關系如圖1-3所示。圖1-3文件系統(tǒng)階段數據和程序之間的關系數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段文件系統(tǒng)使計算機在數據管理方面有了很大的進步。時至今日,文件系統(tǒng)仍是一般高級語言普遍采用的數據管理方式。但隨著數據管理規(guī)模的擴大,數據量急劇增加,使用數據的用戶也越來越多,這時候文件系統(tǒng)在進行數據處理時就顯露出了以下3個缺陷:數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段(1)數據冗余度大。數據冗余度是指同一個數據重復存儲時的重復程度。在文件系統(tǒng)階段,各數據文件之間沒有直接的聯系,一個文件基本上對應一個應用程序,即使兩組數據完全相同,當應用在兩個應用程序上時,這些數據也必須存儲為兩個文件,數據不能共享,因此數據的冗余度大。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段(2)數據獨立性差。文件系統(tǒng)中的文件是為某一特定應用服務的,許多情況下不同的應用程序使用的數據和程序是相互依賴的,系統(tǒng)不宜進行擴充。一旦改變數據的邏輯結構,就必須修改相應的應用程序,而應用程序發(fā)生改變(比如改用另一種程序設計語言來編寫程序),也需要修改數據結構。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段(3)數據聯系弱。由于相同數據重復存儲、各自管理,各文件中的數據之間沒有聯系,因此在進行數據的更新操作時,容易造成各文件中的數據不一致。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展2.文件系統(tǒng)階段(3)數據聯系弱。例如,學校的教務處、財務處、宿管中心這三個部門建立的文件中都有學生的詳細資料,如姓名、學號、身份證號、聯系電話、家庭住址等,如果某個學生的家庭地址改變,就需要修改這三個部門文件中的家庭地址數據,否則會引起同一數據在三個部門中不一致。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展3.數據庫系統(tǒng)階段20世紀60年代末,隨著技術的進步,計算機硬件和軟件技術得到了飛速發(fā)展,計算機應用的范圍越來越廣,管理的對象規(guī)模越來越大,需要處理的數據量急劇增加。同時隨著硬件技術的發(fā)展,出現了大容量的磁盤,使數據能為盡可能多的應用程序服務。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展3.數據庫系統(tǒng)階段20世紀60年代末,隨著技術的進步,計算機硬件和軟件技術得到了飛速發(fā)展,計算機應用的范圍越來越廣,管理的對象規(guī)模越來越大,需要處理的數據量急劇增加。同時隨著硬件技術的發(fā)展,出現了大容量的磁盤,使數據能為盡可能多的應用程序服務。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展3.數據庫系統(tǒng)階段同時多種應用、多種語言相互覆蓋地共享數據集合的要求也越來越強烈,由此數據庫技術應運而生,出現了統(tǒng)一管理數據的專門軟件系統(tǒng),即數據庫系統(tǒng),數據管理進入了數據庫系統(tǒng)階段。在數據庫系統(tǒng)階段,應用程序與數據庫的關系通過數據庫管理系統(tǒng)(DatabaseManagementSystem,DBMS)來實現。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展3.數據庫系統(tǒng)階段與人工管理和文件系統(tǒng)階段相比,數據庫系統(tǒng)階段具有以下特點:(1)數據不再只針對某一特定應用,而是面向全組織,具有整體的結構性;(2)數據共享性高,冗余度小;(3)程序與數據間具有較高的獨立性;(4)實現了對數據的統(tǒng)一控制和管理。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展3.數據庫系統(tǒng)階段在數據庫系統(tǒng)階段,數據和程序之間的關系如圖1-4所示:圖1-4數據庫系統(tǒng)階段數據和程序之間的關系數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展3.數據庫系統(tǒng)階段以上三個階段的特點對照參見表1-1:特點人工管理階段文件系統(tǒng)階段數據庫系統(tǒng)階段數據的管理者用戶文件系統(tǒng)數據庫管理系統(tǒng)數據面向的對象某一應用程序某一應用程序現實世界數據共享程度無共享,冗余度極大共享性差,冗余度大共享性高,冗余度小數據的獨立性不獨立,完全依賴程序獨立性差具有高度的物理獨立性和一定的邏輯獨立性數據的結構化無結構記錄內有結構,整體無結構整體結構化,用數據模型描述數據控制能力應用程序自己控制應用程序自己控制由數據庫管理系統(tǒng)提供數據的安全性、完整性、并發(fā)控制和恢復能力數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展4.新一代數據庫管理技術數據庫技術開始于20世紀60年代末,經歷了最初的基于文件的初級系統(tǒng)以及20世紀六七十年代流行的層次系統(tǒng)和網狀系統(tǒng)階段,目前廣泛使用的是關系型數據庫系統(tǒng)。數據庫應用也從簡單的事務管理發(fā)展到各個應用領域,如用于決策支持的數據庫、用于多媒體技術的多媒體數據庫等,但應用最廣泛的還是基于事務管理的各類數據庫。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展4.新一代數據庫管理技術目前,新一代數據庫管理技術主要具有以下3個特點:1)整體系統(tǒng)方面2)體系結構方面3)應用方面數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展4.新一代數據庫管理技術1)整體系統(tǒng)方面相對于傳統(tǒng)數據庫而言,新一代數據庫管理技術在數據模型及其語言、事務處理與執(zhí)行模型、數據邏輯組織與物理存儲等方面,都集成了新的技術、工具和機制,如面向對象的數據庫、主動數據庫、實時數據庫等。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展4.新一代數據庫管理技術2)體系結構方面新一代數據庫管理技術不改變數據庫的基本原理,而是在系統(tǒng)的體系結構方面采用和集成了新的技術,如分布式數據庫、并行數據庫、數據倉庫等。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展4.新一代數據庫管理技術3)應用方面新一代數據庫管理技術以特定應用領域的需要為出發(fā)點,在某些方面采用和引入了一些非傳統(tǒng)數據庫技術,以加強系統(tǒng)對有關應用的支撐能力,如工程數據庫(支持CAD、CAM、CIMS等應用領域)、空間數據庫(包括地理數據庫,支持地理信息系統(tǒng)(GIS)的應用)、科學與統(tǒng)計數據庫(支持統(tǒng)計數據中的應用)以及超文檔數據庫(包括多媒體數據庫)和網絡數據庫等。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)分布式數據庫(DistributedDataBase,DDB)是數據庫技術與網絡技術相結合的產物。隨著傳統(tǒng)的數據庫技術日趨成熟,計算機網絡技術飛速發(fā)展,網絡的應用范圍也在不斷擴充,數據庫應用已經普遍建立在計算機網絡之上。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)這時,以前所用的集中式數據庫系統(tǒng)就表現出了它的不足之處:一是數據按實際需要已經在網絡上完成了分布存儲,這時再采用集中式處理,會出現通信開銷大的情況;二是應用程序集中在一臺計算機上運行,一旦這臺計算機發(fā)生故障,則整個系統(tǒng)都會受到影響,可靠性不高;三是集中式處理導致系統(tǒng)的規(guī)模和配置都不夠靈活,系統(tǒng)的可擴充性差。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)在這種形勢下,集中式數據庫的“集中計算”開始向“分布計算”發(fā)展。在分布式數據庫系統(tǒng)中,一個應用程序可以對數據庫進行透明操作,數據庫中的數據分別在不同的局部數據庫中存儲,由不同的數據庫管理系統(tǒng)(DBMS)進行管理,在不同的機器上運行,由不同的操作系統(tǒng)支持,被不同的通信網絡連接在一起。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)分布式數據庫系統(tǒng)有兩種:12在物理上是分布的,但邏輯上卻是集中的;在物理上和邏輯上都是分布的,也就是聯邦數據庫。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)第一種分布式數據庫在邏輯上是一個統(tǒng)一的整體,在物理上則分別存儲在不同的物理節(jié)點上。一個應用程序通過網絡連接可以訪問分布在不同地理位置的數據庫,它的分布性表現在數據庫中的數據不存儲在同一場地。更確切地說,不存儲在同一計算機的存儲設備上。這就是分布式數據庫與集中式數據庫的區(qū)別。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)從用戶的角度看,一個分布式數據庫系統(tǒng)在邏輯上和集中式數據庫系統(tǒng)一樣,用戶可以在任何一個場地執(zhí)行全局應用,就好像那些數據存儲在同一臺計算機上,由單個數據庫管理系統(tǒng)(DBMS)管理一樣,用戶并沒有感覺不一樣。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)聯邦數據庫(FederatedDataBase,FDB)技術的提出就是為了實現對相互獨立運行的多個數據庫的互操作。通常稱相互獨立運行的數據庫系統(tǒng)為單元數據庫系統(tǒng)。所謂聯邦數據庫系統(tǒng),是一組彼此協作且又相互獨立的單元數據庫系統(tǒng)的集合,它將單元數據庫系統(tǒng)按不同程度進行集成,為該系統(tǒng)提供整體控制和協同操作的軟件叫聯邦數據庫管理系統(tǒng)(FederatedDataBaseManagementSystem,FDBMS)。LOREMIPSUM數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展5.分布式數據庫系統(tǒng)一個單元數據庫可以加入若干個聯邦數據庫管理系統(tǒng),每個單元數據庫系統(tǒng)可以是集中式的,也可以是分布式的,或者是另外一個FDBMS。它允許數據庫管理人員定義數據子集,這些子集統(tǒng)一形成一個虛擬數據庫,提供給聯邦數據庫管理系統(tǒng)內的其他用戶使用。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展6.面向對象的數據庫系統(tǒng)面向對象的數據庫系統(tǒng)(Object-OrientedDataBaseSystem,OODBS)是將面向對象技術與數據庫技術相結合產生的。面向對象的數據庫系統(tǒng)支持定義和操作面向對象的數據庫,應滿足兩個標準:(1)首先它是數據庫系統(tǒng);(2)其次它是面向對象的系統(tǒng);數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展6.面向對象的數據庫系統(tǒng)第一個標準為數據庫系統(tǒng)應具備的能力(持久性、事務管理、并發(fā)控制、恢復、查詢、版本管理、完整性、安全性)。第二個標準要求面向對象的數據庫充分支持完整的面向對象(OO)的概念和控制機制。綜上所述,可將面向對象的數據庫簡寫為:面向對象的數據庫=面向對象的系統(tǒng)+數據庫能力。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展6.面向對象的數據庫系統(tǒng)面向對象的數據庫系統(tǒng)必須支持面向對象的數據模型,具有面向對象的特性。一個面向對象的數據模型可用面向對象的觀點來描述現實世界實體(對象)的邏輯組織、對象之間的限制和聯系等。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展6.面向對象的數據庫系統(tǒng)把面向對象的方法和數據庫技術結合起來可以使數據庫系統(tǒng)的分析、設計最大程度地與人們對客觀世界的認識相一致,對提高應用的開發(fā)效率及增強應用系統(tǒng)界面的友好性、系統(tǒng)的可伸縮性和可擴充性等具有重要的意義。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展7.數據倉庫隨著客戶機/服務器技術的成熟和并行數據庫的發(fā)展,信息處理技術實現了從大量的事務型數據庫中抽取數據,并將其清理、轉換為新的存儲格式的過程,即為實現決策目標而把數據聚合在一種特殊的格式中。隨著此過程的發(fā)展和完善,這種支持決策的、特殊的數據存儲被稱為數據倉庫(DataWarehouse,DW或DWH)。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展7.數據倉庫數據倉庫由數據倉庫之父比爾·恩門(BillInmon)于1990年提出。他在1991年出版的BuildingtheDataWarehouse

(《建立數據倉庫》)一書中所提出的定義被廣泛接受——數據倉庫(DataWarehouse)是一個面向主題的(SubjectOriented)、集成的(Integrated)、相對穩(wěn)定的(Non-Volatile)、隨時間變化(TimeVariant)的數據集合,用于支持管理決策(DecisionMakingSupport)。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展7.數據倉庫集成是指數據倉庫中的信息不是從各個業(yè)務系統(tǒng)中簡單抽取出來的,而是經過一系列加工、整理和匯總的過程,因此數據倉庫中的信息是關于整個企業(yè)的一致的全局信息。隨時間變化是指數據倉庫內的信息并不只是反映企業(yè)當前的狀態(tài),而是記錄了從過去某一時點到當前各個階段的信息。相對穩(wěn)定是指源數據加載成功后,一般不會修改,只執(zhí)行查詢操作。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展8.數據挖掘隨著社會和科技的不斷發(fā)展,數據挖掘(DataMining)引起了信息產業(yè)界的極大關注,其主要原因是存在大量數據,可以廣泛使用,并且迫切需要將這些數據轉換成有用的信息和知識。獲取的信息和知識可以廣泛用于各種應用,包括商務管理、生產控制、市場分析、工程設計和科學探索等。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展8.數據挖掘數據挖掘是人工智能和數據庫領域研究的熱點問題。數據挖掘是一種決策支持過程,它主要基于人工智能、機器學習、模式識別、統(tǒng)計學、數據庫、可視化技術等,高度自動化地分析企業(yè)的數據,做出歸納性的推理,從中挖掘出潛在的模式,幫助決策者調整市場策略,減少風險,做出正確的決策。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展8.數據挖掘簡單來說,數據挖掘就是從大量數據中提取或“挖掘”知識。知識發(fā)現過程由以下三個階段組成:數據準備、數據挖掘、結果表達和解釋。數據挖掘可以與用戶或知識庫交互。數據挖掘和數據倉庫的協同工作可以簡化數據挖掘過程中的重要步驟,提高數據挖掘的效率和能力,確保數據挖掘過程中數據來源的廣泛性和完整性。數據挖掘已經成為數據倉庫應用中極為重要和相對獨立的工具。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展9.大數據大數據(BigData)或稱巨量數據、海量數據,指的是所涉及的數據量規(guī)模巨大,無法通過主流軟件工具在合理時間內截取、管理、處理并整理成為人類所能解讀的信息的數據集合。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展9.大數據在維克托·邁爾-舍恩伯格及肯尼斯·庫克耶編寫的《大數據時代》中,大數據指不用隨機分析法(抽樣調查)這樣的捷徑,而采用所有數據進行分析處理。大數據的5V特點(由IBM提出)是:Volume(大量)、Velocity(高速)、Variety(多樣)、Value(低價值密度)、Veracity(真實性)。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展9.大數據從技術上看,大數據與云計算的關系就像一枚硬幣的正反面一樣密不可分。大數據必然無法用單臺的計算機進行處理,必須采用分布式架構。它的特色在于對海量數據進行分布式數據挖掘,但它必須依托云計算的分布式處理、分布式數據庫和云存儲、虛擬化技術。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展10.元宇宙元宇宙(Metaverse)是利用科技手段進行鏈接與創(chuàng)造的與現實世界映射和交互的虛擬世界,它具備新型社會體系的數字生活空間。元宇宙本質上是對現實世界的虛擬化、數字化過程,需要對內容生產、經濟系統(tǒng)、用戶體驗以及實體世界內容等進行大量改造。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展10.元宇宙元宇宙基于擴展現實(VR和AR)技術提供沉浸式體驗,基于數字孿生技術生成現實世界的鏡像,基于區(qū)塊鏈技術搭建經濟體系,將虛擬世界與現實世界在經濟系統(tǒng)、社交系統(tǒng)、身份系統(tǒng)上密切融合,并且允許每個用戶進行內容生產和世界編輯。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展10.元宇宙“元宇宙”一詞出現于1992年的科幻小說《雪崩》。該小說描述的是超前的未來世界。在原著中,元宇宙(Metaverse)是由Meta和Verse兩個單詞組成的,Meta表示超越,Verse代表宇宙(universe),合起來即為“超越宇宙”:一個平行于現實世界運行的人造空間,是互聯網的下一個階段,由AR、VR、3D等技術支持的虛擬現實的網絡世界。數據管理發(fā)展概況1.11.1.2數據管理技術的發(fā)展10.元宇宙關于“元宇宙”,比較認可的思想源頭是美國數學家和計算機專家弗諾·文奇教授在其1981年出版的小說《真名實姓》中創(chuàng)造性地構思的一個通過腦機接口進入并獲得感官體驗的虛擬世界。1.2Access

程序設計數據庫系統(tǒng)1.2.1硬件系統(tǒng)1.2.2軟件系統(tǒng)1.2.3數據庫1.2.4數據庫管理系統(tǒng)1.2.5數據庫應用系統(tǒng)1.2.6人員1.2.7數據庫系統(tǒng)的特點1.2.8數據庫系統(tǒng)的體系結構數據庫系統(tǒng)1.2數據庫系統(tǒng)(DataBaseSystem,DBS)是指引入數據庫技術后的計算機系統(tǒng)。它能夠有組織地、動態(tài)地存儲大量相關數據,并能提供數據處理和信息資源共享。數據庫系統(tǒng)實際上是一個集合體,一般由硬件系統(tǒng)、軟件系統(tǒng)、數據庫、數據庫管理系統(tǒng)、數據庫應用系統(tǒng)、數據庫管理員和用戶組成。數據庫系統(tǒng)1.2數據庫系統(tǒng)的組成如圖1-5所示:圖1-5數據庫系統(tǒng)組成數據庫系統(tǒng)1.21.2.1硬件系統(tǒng)硬件系統(tǒng)是指構成計算機系統(tǒng)的各種物理設備,包括存儲所需的外部設備。由于數據庫系統(tǒng)承擔著數據管理的任務,它主要在計算機操作系統(tǒng)的支持下工作,而且包含著數據庫管理例行程序、應用程序、數據緩沖區(qū)等,因此要求有足夠大的內存空間。同時,由于用戶的數據庫管理軟件都要保存在外部存儲器上,因此對外部存儲器容量的要求也很高。另外,外部存儲器還應該具有較高的數據傳輸能力,以提高數據傳輸率。硬件的配置應滿足整個數據庫系統(tǒng)的需要。數據庫系統(tǒng)1.21.2.2軟件系統(tǒng)數據庫系統(tǒng)中的軟件系統(tǒng)包括操作系統(tǒng)、數據庫管理系統(tǒng)、與數據庫接口的高級語言及其編譯系統(tǒng)和以數據庫管理系統(tǒng)為核心的應用開發(fā)工具。數據庫系統(tǒng)1.21.2.3數據庫數據庫(DataBase,DB)是數據庫系統(tǒng)的數據源,簡單來說,數據庫是存放數據的“倉庫”。數據庫是長期存儲在計算機內的、有組織的、可共享的數據的集合。數據庫中的數據按一定的數據模型組織、描述和存儲,具有較小的冗余度、較高的數據獨立性和易擴展性,可為各種用戶共享。數據庫系統(tǒng)1.21.2.3數據庫數據庫中不僅包括描述事物的數據本身,還包括相關事物之間的關系。數據庫中的數據不只面向某一種特定的應用,而且可以面向多種應用,可以被多個用戶、多個應用程序共享。比如,某一學校的數據庫可以被學校下屬的各個部門、各個院系的有關管理人員共享使用,而且可供各個管理人員運行的不同的應用程序共享使用。數據庫系統(tǒng)1.21.2.3數據庫數據庫主要有以下特點:(1)數據的共享性高。數據庫中的數據能為多個用戶服務,并可被各個應用程序共享。(2)數據的獨立性高。在數據庫中,用戶的應用程序與數據的邏輯組織和物理存儲方式都是無關的。(3)數據的完整性好。數據庫中的數據在操作和維護過程中可以保證正確無誤。(4)數據的冗余度小。數據庫中的數據會盡可能避免重復。數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)數據庫的建立、使用和維護都是通過特定的數據庫語言進行的。正如使用高級語言需要解釋/編譯程序的支持一樣,使用數據庫語言也需要一個特定的支持軟件,這就是數據庫管理系統(tǒng)(DataBase

ManagementSystem,DBMS)。數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)數據庫管理系統(tǒng)是數據庫系統(tǒng)的核心,是位于用戶與操作系統(tǒng)之間的一種系統(tǒng)軟件,負責數據庫中的數據組織、操縱、維護、控制、保護和數據服務等。用戶不能直接接觸數據庫,而是利用數據庫管理系統(tǒng)提供的一整套命令,對數據庫進行各種操作,從而實現用戶對數據的處理要求。數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)目前主要的DBMS有關系型數據庫系統(tǒng),如Oracle、DB2、SQLServer、MYSQL、Access等,也有非關系型數據庫系統(tǒng),如MongoDB、Redis、Hbase、Neo4j等。數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)一般來說,數據庫管理系統(tǒng)應該具有以下功能:1.數據定義功能3.數據庫控制和管理功能5.數據庫通信功能2.數據操縱功能4.數據庫維護功能數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)DBMS提供了數據定義語言(DataDefinitionLanguage,DDL),用于定義數據庫結構、數據之間的聯系等。用戶通過它可以方便地對數據庫中的數據對象進行定義。例如,數據庫、表、存儲過程、視圖等都是數據庫中的對象,都需要通過定義才能使用。1.數據定義功能數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)DBMS提供了數據操縱語言(DataManipulationLanguage,DML),主要用于操縱數據庫中的數據,實現對數據庫數據的基本存取操作。數據操縱功能包括查找、插入、刪除和修改等語句,是數據庫的主要應用。2.數據操縱功能數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)DBMS提供了數據控制語言(DataControlLanguage,DCL),用于實現對數據庫的并發(fā)控制、安全性檢查、完整性約束條件的檢查等。它們在數據庫運行過程中監(jiān)視對數據庫的各種操作,控制管理數據庫資源,處理多用戶的并發(fā)操作等。3.數據庫控制和管理功能LOREMIPSUM數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)DBMS還提供了一些應用程序,用于對已經建立好的數據庫進行維護,包括數據庫的轉儲與恢復、數據庫的重組與重構、數據庫性能的監(jiān)視與分析等。4.數據庫維護功能數據庫系統(tǒng)1.21.2.4數據庫管理系統(tǒng)在分布式環(huán)境下或網絡數據庫系統(tǒng)中,DBMS為不同數據庫間提供了通信的功能。5.數據庫通信功能數據庫系統(tǒng)1.21.2.5數據庫應用系統(tǒng)數據庫應用系統(tǒng)(DataBaseApplicationSystem,DBAS)是系統(tǒng)開發(fā)人員使用計算機高級語言利用數據庫系統(tǒng)資源開發(fā)出來的,對數據庫中的數據進行處理和加工的軟件。如教務管理系統(tǒng)、圖書管理系統(tǒng)、證券實時行情系統(tǒng)等。數據庫系統(tǒng)1.21.2.6人員數據庫系統(tǒng)的人員主要有3類:1.終端用戶2.數據庫應用系統(tǒng)開發(fā)人員3.數據庫管理員數據庫系統(tǒng)1.21.2.6人員終端用戶是數據庫的使用者,通過應用程序與數據庫進行交互。1.

終端用戶2.

數據庫應用系統(tǒng)開發(fā)人員數據庫應用系統(tǒng)開發(fā)人員負責分析、設計、開發(fā)、維護數據庫系統(tǒng)中的各類應用程序,數據庫系統(tǒng)一般需要1個以上的數據庫應用系統(tǒng)開發(fā)人員在開發(fā)周期內完成數據庫結構設計、應用程序開發(fā)等任務。數據庫系統(tǒng)1.21.2.6人員數據庫管理員(DataBaseAdministrator

,

DBA)是高級用戶,其職能是管理、監(jiān)督、維護數據庫系統(tǒng)的正常運行,負責全面管理和控制數據庫系統(tǒng)。3.

數據庫管理員數據庫系統(tǒng)1.21.2.6人員在數據庫系統(tǒng)中,各層次之間的相互關系如圖1-6所示:3.

數據庫管理員圖1-6數據庫系統(tǒng)各層次之間的相互關系數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點數據庫系統(tǒng)的主要特點如下8個:特點1.數據結構化2.數據共享3.數據獨立性4.可控冗余度數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點數據庫系統(tǒng)的主要特點如下8個:特點5.安全性保護6.數據完整性控制7.并發(fā)控制8.故障發(fā)現和恢復控制數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點數據庫系統(tǒng)實現整體數據的結構化,是數據庫的主要特征之一,也是數據庫系統(tǒng)與文件系統(tǒng)的本質區(qū)別。1.

數據結構化數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點在數據庫系統(tǒng)中,所有的程序都存取同一份數據庫。一個庫中的數據不僅可為同一企業(yè)或機構之間的各個部門所共享,也可為不同單位、地域甚至不同國家的用戶所共享。2.

數據共享數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點在數據庫系統(tǒng)中,用戶的應用程序與存儲在磁盤上的數據庫中的數據是相互獨立的。用戶不需要了解數據實際的存取方式,只需要通過數據庫系統(tǒng)的存取命令就可以得到所需要的數據。3.

數據獨立性數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點實現共享后,不必要的重復數據將全部消除,這樣可以節(jié)省存儲空間、減少存取時間、避免數據之間的不相容性和不一致性。但為了提高查詢效率,有時也會保留少量重復數據,比如學生基本信息表和學生成績表中都有學生的學號數據。數據庫系統(tǒng)中的冗余度可由設計人員控制。4.

可控冗余度數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點安全性保護是指保護數據以防止不合法使用所造成數據破壞或泄密,可以通過設置訪問權限、對數據加密等手段實現。5.

安全性保護數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點6.

數據完整性控制數據完整性是指數據的正確性、有效性和相容性。數據庫系統(tǒng)提供了必要的功能,保證了數據在輸入、修改過程中始終符合原來的數據定義和規(guī)定。數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點7.

并發(fā)控制并發(fā)控制是指多個用戶進程在同一時刻期望存取同一數據時發(fā)生的事件。為了避免并發(fā)進程間相互干擾進而導致錯誤的結果或破壞數據完整性,必須對多用戶的并發(fā)操作加以控制和協調。數據庫系統(tǒng)1.21.2.7數據庫系統(tǒng)的特點8.

故障發(fā)現和恢復控制在數據庫系統(tǒng)運行中,由于用戶操作失誤或硬件及軟件的故障,可能使得數據庫遭到局部性或全局性損壞,但系統(tǒng)能進行應急性處理,把數據庫恢復到正確狀態(tài)。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構數據庫內部體系結構是數據庫系統(tǒng)的一個總框架。為了有效地組織和管理數據,提高數據庫的邏輯獨立性和物理獨立性,人們?yōu)閿祿煸O計了一個嚴謹的體系結構。現在DBMS的產品多種多樣,可在不同的操作系統(tǒng)支持下工作,大多數數據庫系統(tǒng)的內部體系結構是三級模式和兩級映象結構。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構三級模式分別是外模式、模式和內模式。兩級映象分別是外模式到模式的映象和模式到內模式的映象。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構三級模式和兩級映象如圖1-7所示:圖1-7數據庫系統(tǒng)的三級模式和兩級映象數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構美國國家標準協會(AmericanNationalStandardsInstitute,ANSI)的數據庫管理系統(tǒng)研究小組于1978年提出了數據庫結構標準化的建議,將其分為三級:面向用戶或應用程序員的用戶級、面向建立和維護數據庫人員的概念級、面向系統(tǒng)程序員的物理級。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構用戶級對應外模式,概念級對應模式,物理級對應內模式,使不同級別的用戶對數據庫形成不同的視圖。視圖是指觀察、認識和理解數據的范圍、角度和方法,是數據庫在用戶“眼中”的反映,很顯然,不同級別的用戶所“看到”的數據庫是不同的。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構為了保障數據與程序之間的獨立性,使用戶能以簡單的邏輯結構操作數據而無須考慮數據的物理結構,簡化應用程序的編制和程序員的負擔,增強系統(tǒng)的可靠性,通常DBMS將數據庫的體系結構分為三級模式:外模式、模式和內模式。1.

數據庫的三級模式結構數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構1.

數據庫的三級模式結構1)外模式2)模式3)內模式數據庫的體系結構分為三級模式:數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構1.

數據庫的三級模式結構1)外模式外模式又稱為用戶模式或子模式,是數據庫用戶(包括開發(fā)人員和最終用戶)和數據庫系統(tǒng)的接口,是數據庫用戶的數據視圖(view),是數據庫用戶可以看見和使用的局部數據的邏輯結構和特征的描述,是與某一應用有關的數據的邏輯表示。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構1.

數據庫的三級模式結構1)外模式一個數據庫通常有多個外模式。當不同用戶在應用需求、保密級別等方面存在差異時,其外模式的描述就會有所不同。外模式是保證數據庫安全的重要措施。每個用戶只能看見和訪問所對應的外模式中的數據,而數據庫中的其他數據均不可見。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構1.

數據庫的三級模式結構2)模式模式是所有數據庫用戶的公共數據視圖,是數據庫中全部數據的邏輯結構和特征的描述,反映了數據庫系統(tǒng)的整體觀。一個數據庫只有一個模式。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構1.

數據庫的三級模式結構2)模式模式不但要描述數據的邏輯結構,比如數據記錄的組成,各數據項的名稱、類型、取值的范圍等,而且要描述數據之間的聯系以及數據的完整性、安全性等要求。3)內模式數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構1.

數據庫的三級模式結構內模式也稱存儲模式或物理模式,是對數據物理結構和存儲方式的描述,是數據在數據庫內部的表示方式,一個數據庫只有一個內模式。內模式對一般用戶是透明的,但它的設計直接影響數據庫的性能。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構1.

數據庫的三級模式結構內模式處于最底層,它反映數據在計算機物理結構中的實際存儲形式;模式處于中間層,它反映設計者的數據全局邏輯要求;外模式處于最外層,它反映用戶對數據的要求。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構2.

數據庫的兩級映象數據庫的三級模式結構是數據的三個抽象級別。它把數據的具體組織留給DBMS去做,用戶只要抽象地處理數據,而不必關心數據在計算機中的表示和存儲,這樣就減輕了用戶使用系統(tǒng)的負擔。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構2.

數據庫的兩級映象三級模式結構之間往往差別很大,為了實現這三個抽象級別的聯系和轉換,DBMS在三級模式結構之間提供了兩級映象:1)外模式/模式映象2)模式/內模式映象1)外模式/模式映象數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構2.

數據庫的兩級映象模式描述的是數據的全局邏輯結構,外模式描述的是數據的局部邏輯結構,對應于同一個模式可以有任意多個外模式。對于每個外模式,數據庫系統(tǒng)都有一個外模式/模式映象,它定義了該外模式與模式之間的對應關系。這些映象定義通常包含在各自外模式的描述中。數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構2.

數據庫的兩級映象當模式改變時(如增加新的關系、新的屬性或改變屬性的數據類型等),由數據庫管理員對各個外模式/模式映象作相應改變,可以使外模式保持不變。應用程序是依據數據的外模式編寫的,從而應用程序不必修改,保證了數據與程序的邏輯獨立性,簡稱邏輯數據獨立性。1)外模式/模式映象數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構2.

數據庫的兩級映象數據庫中不僅只有一個模式,而且也只有一個內模式,所以模式/內模式映象是唯一的,它定義了數據庫全局邏輯結構與存儲結構之間的對應關系。例如,說明邏輯記錄和字段在內部是如何表示的。2)模式/內模式映象數據庫系統(tǒng)1.21.2.8數據庫系統(tǒng)的體系結構2.

數據庫的兩級映象該映象的定義通常包含在模式描述中。當數據庫的存儲結構改變了(如選用了另一種存儲結構),由數據庫管理員對模式/內模式映象作相應的改變,可以保證模式保持不變,從而應用程序也不必改變,保證了數據與程序的物理獨立性,簡稱物理數據獨立性。2)模式/內模式映象1.3Access

程序設計數據模型1.3.1基本概念1.3.2數據模型組成要素1.3.3數據模型的層次類型1.3.4概念數據模型1.3.5邏輯數據模型1.3.6物理數據模型數據模型1.3計算機不能直接處理現實世界中的具體事物,所以人們必須事先將具體事物轉換成計算機能夠處理的數據。1.3.1基本概念計算機信息處理的對象是現實生活中的客觀事物,在對客觀事物實施處理的過程中,首先要經歷了解、熟悉的過程,從觀測中抽象出大量描述客觀事物的信息,再對這些信息進行整理、分類和規(guī)范,進而將規(guī)范化的信息數據化,最終由數據庫系統(tǒng)存儲、處理。1.3數據模型1.3.1基本概念1.3數據模型數據庫系統(tǒng)存儲、處理,這一過程涉及三個層次,經歷了兩次抽象和轉換:1.現實世界2.信息世界3.數據世界1.3.1基本概念1.3數據模型1.

現實世界現實世界就是人們所能看到的、接觸到的世界,是存在于人腦之外的客觀世界。現實世界中的事物是客觀存在的,事物與事物之間的聯系也是客觀存在的。客觀事物及其相互聯系就處于現實世界中,客觀事物可以用對象和性質來描述。1.3.1基本概念1.3數據模型2.

信息世界信息世界就是現實世界在人們頭腦中的反映,又稱概念現實世界世界。客觀事物在信息世界中稱為實體,反映事物間聯系的是實體模型或概念模型。現實世界是物質的,相對而言信息世界是抽象的。1.3.1基本概念1.3數據模型3.

數據世界數據世界就是信息世界中的信息數據化后對應的產物。現實世界中的客觀事物及其聯系在數據世界中以數據模型描述。相對于信息世界,數據世界是量化的、物化的。1.3.1基本概念1.3數據模型3.

數據世界現實世界中的客觀事物通過數據抽象轉換為數據世界轉換的數據。首先將現實世界中的客觀事物抽象為某一種信息結構,這種信息結構不依賴具體的計算機系統(tǒng),不是某一個DBMS支持的數據模型,而DBMS據模型是概念級的模型;然后將概念模型轉換為計算機上某一個DBMS支持的數據模型。圖1-8數據抽象過程1.3.2數據模型組成要素1.3數據模型數據模型是對客觀事物及聯系的數據描述,是概念模型的數據化,即數據模型提供表示和組織數據的方法。一般地講,數據模型是嚴格定義的概念的集合,這些概念精確地描述系統(tǒng)的靜態(tài)特性、動態(tài)特性和完整性約束條件。1.3.2數據模型組成要素1.3數據模型數據模型通常由3部分組成:1.數據結構2.數據操作3.數據完整性約束1.3.2數據模型組成要素1.3數據模型數據結構是對計算機的數據組織方式和數據之間的聯系進行框架性描述的集合,是對數據庫靜態(tài)特征的描述,是刻畫一個數據模型性質最重要的方面。因此,在數據庫系統(tǒng)中,通常按照其數據結構的類型來命名數據模型。1.

數據結構例如,層次結構、網狀結構、關系結構的數據模型分別命名為層次模型、網狀模型和關系模型。1.3.2數據模型組成要素1.3數據模型數據操作是指數據庫中各記錄允許執(zhí)行的操作的集合,包括操作方法及有關的操作規(guī)則等,例如,插入、刪除、修改、檢索、更新等操作是對數據庫動態(tài)特征的描述。2.

數據操作1.3.2數據模型組成要素1.3數據模型3.

數據完整性約束數據的約束條件是關于數據狀態(tài)和狀態(tài)變化的一組完整性約束規(guī)則的集合,以保證數據的正確性、有效性和一致性。數據模型應該反映和規(guī)定本數據模型必須遵守的、基本的、通用的完整性約束。此外數據模型還應該提供定義完整性約束的機制,以反映具體所涉及的數據必須遵守的特定語義約束。1.3.2數據模型組成要素1.3數據模型3.

數據完整性約束例如,在學生信息表中,學生的“性別”只能為“男”或“女”。數據模型是數據庫技術的關鍵,它的三個要素完整地描述了一個數據模型。1.3.3數據模型的層次類型1.3數據模型根據數據抽象的不同級別,可以將數據模型分為三層:1.概念數據模型2.邏輯數據模型3.物理數據模型1.3.3數據模型的層次類型1.3數據模型從現實世界到概念模型的轉換由數據庫設計人員完成;從概念模型到邏輯模型的轉換可由數據庫設計人員完成,也可用數據庫設計工具協助設計人員來完成;從邏輯模型到物理模型的轉換一般由DBMS完成。1.3.3數據模型的層次類型1.3數據模型概念數據模型是從用戶的角度來看的,強調對數據對象的基本表示和概括性描述(包括數據及其聯系),而不考慮計算機具體實現,與具體的DBMS無關。1.

概念數據模型1.3.3數據模型的層次類型1.3數據模型邏輯數據模型是從計算機的角度來看的,用于在數據庫系統(tǒng)中實現。概念數據模型必須轉化為邏輯數據模型,才能在DBMS中實現。2.

邏輯數據模型1.3.3數據模型的層次類型1.3數據模型物理數據模型是從計算機(存儲介質)的角度來看的,每種邏輯數據模型在實現時,都有其對應的物理數據模型的支持。3.

物理數據模型1.3.4概念數據模型1.3數據模型概念數據模型簡稱為概念模型或信息模型,是用來建立信息世界的數據模型,與具體的DBMS無關。概念數據模型強調語義表達,描述信息結構,是對現實世界的第一層抽象。LOREMIPSUM1.3.4概念數據模型1.3數據模型1)實體1.

基本概念實體是客觀存在并且可以相互區(qū)別的事物。實體可以是具體的事物,如一個學生,一本書;也可以是抽象的事物,如一次考試。1.3.4概念數據模型1.3數據模型2)屬性1.

基本概念屬性用于描述實體的特征(性質)

,用以區(qū)分一個個實體。例如,學生可用學號、姓名、性別、年齡等屬性描述,一次考試可用考試時間、考試地點、考試科目等屬性描述。1.3.4概念數據模型1.3數據模型3)實體型1.

基本概念具有相同屬性的實體必然具有共同的特征和性質。用實體名及描述它的各屬性名,可以刻畫出全部同質實體的共同特征和性質,稱為實體型。例如,學生(學號,姓名,性別,出生年月,所在院系,入學時間)就是一個實體型。1.3.4概念數據模型1.3數據模型1.

基本概念實體集是指具有相同類型及相同屬性的實體的集合。如若干個學生實體的集合構成學生實體集。4)實體集1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念兩個實體集之間實體的對應關系稱為聯系,它反映了現實世界事物之間的相互關聯。例如,學生和教師是兩個不同的實體集,但學生要修讀課程,兩者之間就發(fā)生了關聯,建立了聯系。1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念(1)一對一聯系(1:1)。如果實體集E1中的每一個實體至多和實體集E2中的一個實體有聯系,反之亦然,則稱E1和E2是一對一的聯系,表示為1:1。聯系的種類分為以下三種:1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念圖1-9所示的是一對一聯系的實體集校長和實體集學校,表示一個學校在當前時刻只有一個校長,一個校長在當前時刻只能擔任一個學校的校長。因此實體集校長和實體集學校之間是一對一的聯系。圖1-9一對一聯系的實體集校長和實體集學校1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念例如,李木是第一中學的校長,第一中學的校長是李木。按照概念來說,E1中的每一個實體至多與E2中的一個實體有聯系,也可以沒有聯系,如圖1-9中的實體集E1中的陳耳和實體集E2中的第二中學。1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念如果實體集E1中的每個實體與實體集E2中的任意多個實體有聯系,而實體集E2中的每一個實體至多和實體集E1中的一個實體有聯系,則稱E1和E2之間是一對多的聯系,表示為1:N,E1稱為一方,E2稱為多方。(2)一對多聯系(1:N)。1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念圖1-10所示的是一對多聯系的實體集學校和實體集學生,表示一個學校在當前時刻可以有多個學生,一個學生在當前時刻只能屬于一個學校。因此實體集學校和實體集學生之間是一對多的聯系,一方是實體集學校,多方是實體集學生。圖1-10多對一聯系的實體集學生和實體集學校1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念如果實體集E1中的每個實體與實體集E2中的任意多個實體有聯系,反之,實體集E2中的每個實體與實體集E1中的任意多個實體有聯系,則稱E1和E2之間是多對多的聯系,表示為M:N。(3)多對多聯系(M:N)。1.3.4概念數據模型1.3數據模型5)實體之間的聯系1.

基本概念圖1-11所示的是多對多聯系的實體集學生和實體集課程,表示一個學生可以修讀多門課程,一門課程可以有多個學生修讀,因此實體集學生和實體集課程之間是多對多的聯系。圖1-11多對多聯系的實體集學生和實體集課程1.3.4概念數據模型1.3數據模型2.

實體-聯系模型(E-R模型)概念模型的表示方法很多,其中最為著名和使用最為廣泛的是P.P.Chen于1976年提出的E-R(Entity-Relationship)模型。E-R模型是直接從現實世界中抽象出實體類型及實體間的聯系,是對現實世界的一種抽象,它主要由實體、聯系和屬性組成。E-R模型的圖形表示稱為E-R圖。1.3.4概念數據模型1.3數據模型2.

實體-聯系模型(E-R模型)基本E-R圖的組成如下:(1)矩形:表示實體集,實體名稱寫在矩形框內。(2)橢圓:表示實體集或聯系的屬性,橢圓框內標明屬性的名稱。(3)菱形:表示實體間的關系,菱形框內注明聯系名稱。(4)無向邊:連接實體和各個屬性以及連接實體和聯系,同時在無向邊上注明聯系類型(1:1,1:N或M:N)。1.3.4概念數據模型1.3數據模型2.

實體-聯系模型(E-R模型)圖1-12~圖1-15所示分別為多個不同實體集之間的多種不同聯系的E-R圖(圖中的實體只列出了部分屬性)。圖1-12班級和班長的聯系對應的E-R圖1.3.4概念數據模型1.3數據模型2.

實體-聯系模型(E-R模型)圖1-13學生和班級的聯系對應的E-R圖1.3.4概念數據模型1.3數據模型2.

實體-聯系模型(E-R模型)圖1-14學生和課程的聯系對應的E-R圖1.3.4概念數據模型1.3數據模型2.

實體-聯系模型(E-R模型)圖1-15學校信息數據庫系統(tǒng)的E-R圖1.3.5邏輯數據模型1.3數據模型邏輯數據模型簡稱為邏輯模型或數據模型。概念數據模型是概念上的抽象,它與具體的DBMS無關,而邏輯數據模型與具體的DBMS有關,是DBMS所支持的數據模型,描述數據庫數據的整體邏輯結構,便于在數據庫系統(tǒng)中實現。用概念數據模型表示的數據必須轉化為邏輯數據模型表示的數據,才能在DBMS中實現。1.3.5邏輯數據模型1.3數據模型根據數據及數據間聯系的表示形式的不同,邏輯數據模型主要分為以下四種:1.層次模型2.網狀模型3.關系模型4.面向對象模型1.3.5邏輯數據模型1.3數據模型1.

層次模型層次模型是數據庫系統(tǒng)中最早使用的數據模型,它采用層次數據結構來表示實體及實體之間的聯系。層次模型可以簡單、直觀地表示信息世界中實體、實體的屬性及實體之間的一對多聯系。1.3.5邏輯數據模型1.3數據模型1.

層次模型層次數據結構也稱為樹形結構,各個實體在數據模型中被稱為結點,層次模型有以下特點:(1)只有一個最高結點即根結點。(2)其余結點有而且僅有一個父結點(上層結點)。(3)每個結點可以有零個或多個子結點(下層結點)。(4)上下層結點之間表示一對多的聯系。1.3.5邏輯數據模型1.3數據模型1.

層次模型層次模型多用于表示行政組織機構、家族輩分關系等。圖1-16所示為使用層次模型表示的某高校的部分組織結構。圖1-16層次模型示例1.3.5邏輯數據模型1.3數據模型2.

網狀模型網狀模型用網狀結構來表示實體及實體之間的關系,可以將其看成層次模型的一種擴展,層次模型是網狀模型的一個特例。在教學過程中,學生、教師、專業(yè)、課程和教室之間的關系可以用網狀模型表示,如圖1-17所示。圖1-17網狀模型示例1.3.5邏輯數據模型1.3數據模型2.

網狀模型網狀模型有以下特點:(1)用圖表示數據之間的關系。(2)允許結點有多于一個的父結點。(3)可以有一個以上的結點沒有父結點。(4)表示結點之間多對多的聯系。1.3.5邏輯數據模型1.3數據模型3.

關系模型1970年,IBM公司的E.F.Cood提出了關系模型的概念,首次運用數學方法來研究數據庫的結構和數據操作,并將數據庫的設計從以經驗為主提高到以理論為指導。關系模型用二維表來表示實體及實體之間的聯系,一個二維表就是一個關系,它不僅可以反映實體本身,也可以反映實體之間的聯系。1.3.5邏輯數據模型1.3數據模型3.

關系模型表1-2所示為“學生”關系示例。學號姓名性別出生日期專業(yè)生源地郵政編碼政治面貌20191101李宇男2000/9/5計算機天津市西青區(qū)大寺鎮(zhèn)王村300015中共黨員20191102楊林女2001/5/17計算機北京市西城區(qū)太平街100012中共黨員20191103張山男1999/1/10計算機濟南市歷下區(qū)華能路250121預備黨員20191104馬紅女2000/3/20計算機江蘇省南京市秦淮區(qū)軍農路210121共青團員20191105林偉男1999/2/3計算機四川省成都市武侯區(qū)新盛路610026中共黨員20192101姜恒男1997/12/7自動化重慶市渝中區(qū)嘉陵江濱江路400028預備黨員20192102崔敏女1997/2/24自動化北京市朝陽區(qū)安貞街道100102中共黨員1.3.5邏輯數據模型1.3數據模型3.

關系模型關系模型可以描述一對一、一對多和多對多的聯系,并向用戶隱藏存取路徑,大大提高了數據的獨立性及程序員的工作效率。此外,關系模型建立在嚴格的數學基礎之上,支持集合運算。關系模型是目前最成熟和最重要的一種數據模型,如Oracle、Sybase、SQLServer以及本書后面將要介紹的MicrosoftAccess2016等,都是基于關系模型的關系數據庫管理系統(tǒng)。1.3.5邏輯數據模型1.3數據模型4.

面向對象模型面向對象模型是用面向對象的觀點來描述現實世界實體的邏輯組織、實體之間的限制和聯系的模型。在面向對象數據模型中,所有現實世界中的實體都可看成對象。一個對象包含若干屬性,用于描述對象的特性。1.3.5邏輯數據模型1.3數據模型4.

面向對象模型屬性也是對象,它又可包含其他對象作為其屬性。這種遞歸引用對象的過程可以繼續(xù)下去,從而組成各種復雜的對象,而且同一個對象可以被多個對象引用。除了屬性之外,對象還包含若干方法,用于描述對象的行為。方法又稱為操作,它可以改變對象的狀態(tài)。對象是封裝的,它是由數據和操作組成的封裝體。1.3.5邏輯數據模型1.3數據模型4.

面向對象模型面向對象數據模型比層次模型、網狀模型和關系模型更直接、更具體,但由于面向對象模型比較復雜,因此普及度不高。1.3.6物理數據模型1.3數據模型物理數據模型是在計算機系統(tǒng)的底層對數據進行抽象,它描述數據在存儲介質上的存儲方式和存取方法,是面向計算機系統(tǒng)的。物理數據模型反映了數據在存儲介質上的存儲結構,它不僅與具體的DBMS有關,也和操作系統(tǒng)及硬件有關。1.3.6物理數據模型1.3數據模型在設計一個數據庫時,首先需要將現實世界抽象得到概念數據模型,然后將概念數據模型轉換為邏輯數據模型,最后將邏輯數據模型轉換為物理數據模型。最后一步一般由選定的DBMS自動實現。1.4Access

程序設計關系數據庫1.4.1關系模型的基本術語1.4.2關系的性質1.4.3關系模型的優(yōu)缺點1.4.4關系完整性1.4關系數據庫關系數據庫是支持關系模型的數據庫。在關系模型中,不論是實體還是聯系都用關系來表示。一個關系模型中所有關系的集合稱為關系數據庫,也就是說,關系數據庫是由若干張二維表組成的,它包括二維表的結構以及二維表中的數據兩部分。Access2016就是一個關系數據庫管理系統(tǒng),使用它可以創(chuàng)建某一具體應用的關系數據庫。1.4關系數據庫關系模型理論、日常工作和生活及關系數據庫中的術語對照如表1-3所示。1.4.1關系模型的基本術語表1-3術語對照1.4關系數據庫下面10個是關系模型中一些主要的基本術語:1.4.1關系模型的基本術語1.關系3.屬性5.關鍵字或碼2.元組4.域6.候選關鍵字或候選碼1.4關系數據庫下面10個是關系模型中一些主要的基本術語:1.4.1關系模型的基本術語8.主屬性10.外部關鍵字或外碼7.主關鍵字或主碼9.非主屬性或非碼屬性11.主表和從表12.關系模式1.4關系數據庫1.4.1關系模型的基本術語1.

關系關系就是一張二維表,通常將一個沒有重復行、重復列的二維表看成一個關系,每個關系都有一個關系名。在Access2016中,一個關系對應一個數據庫文件中的表。1.4關系數據庫1.4.1關系模型的基本術語1.

關系例如,學生信息管理系統(tǒng)中的課程表就是一個關系,如表1-4所示。表1-4課程表1.4關系數據庫1.4.1關系模型的基本術語2.

元組二維表中從第二行開始的每一行在關系中稱為一個元組,在關系數據庫中稱為一條記錄。“關系”是元組的集合,“元組”是屬性值的集合,一個關系模型中的數據就是這樣逐行逐列組織起來的。1.4關系數據庫1.4.1關系模型的基本術語3.

屬性二維表的每一列在關系中稱為一個屬性,每個屬性都有一個屬性名,屬性值則是各個元組在該屬性上的取值。在關系數據庫中表中的一列稱為一個字段,屬性名也稱為字段名。例如,表1-4的第二列中,“課程名”是屬性名,“Access2016”則為第三個元組在“課程名”屬性上的取值,稱為屬性值。1.4關系數據庫1.4.1關系模型的基本術語4.

域屬性的取值范圍稱為域。域作為屬性值的集合,其類型與范圍具體由屬性的性質及其所表示的意義確定。例如,表1-4中“課程性質”屬性的域是{A,B},表1-2學生表中性別屬性的域是{男,女}。1.4關系數據庫1.4.1關系模型的基本術語5.

關鍵字或碼在關系的多個屬性中,能夠用來唯一標識元組的屬性或屬性組稱為關鍵字或碼。例如,表1-4中的“課程號”屬性是關鍵字,因為通過課程號可以唯一地確定元組。表1-2中的“學號”屬性是關鍵字。1.4關系數據庫1.4.1關系模型的基本術語6.

候選關鍵字或候選碼如果在一個關系中存在多個屬性(或屬性組),且都能用來唯一標識該關系中的元組,那么這些屬性(或屬性組)都稱為該關系的候選關鍵字或候選碼。1.4關系數據庫1.4.1關系模型的基本術語6.

候選關鍵字或候選碼例如,表1-4中,如果沒有重名的課程名,那么課程號和課程名都是課程表的候選關鍵字。學生表中,如果有“身份證號”屬性,那么學號和身份證號都是學生表的候選關鍵字。LOREMIPSUM1.4關系數據庫1.4.1關系模型的基本術語7.

主關鍵字或主碼在一個關系的若干候選關鍵字中,被指定作為關鍵字的候選關鍵字稱為該關系的主關鍵字(簡稱主鍵)或主碼。1.4關系數據庫1.4.1關系模型的基本術語7.

主關鍵字或主碼關系的主鍵只有一個,這個主鍵可以是一個屬性,也可以是多個屬性的組合。如表1-2的學生表中,選擇“學號”作為主鍵,則此主鍵是一個屬性。圖1-18中成績表score的主鍵為(學號,課號),則此主鍵是兩個屬性的組合。1.4關系數據庫1.4.1關系模型的基本術語8.

主屬性在一個關系中,包含在任一候選關鍵字中的屬性稱為主屬性

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論