




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1.1數據庫技術概述
1.2數據模型
1.3數據庫設計
1.4概念模型2/4/20231.1數據庫技術概述1.1.1數據庫基本概念
數據(Data)
數據是描述現實世界事物的符號記錄,是用物理符號記錄的可以鑒別的信息。數據庫(DataBase,簡記為DB)
數據庫是長期存儲在計算機內、有組織的、可共享的數據集合。這種集合具有如下特點:最小的冗余度應用程序對數據資源共享數據獨立性高統一管理和控制數據庫管理系統(DataBaseManagementSystem,簡記為DBMS)2/4/2023
數據庫管理系統是位于用戶與操作系統之間的一個數據管理軟件,它的基本功能包括以下幾個方面:數據定義功能用戶通過數據定義語言(DDL,DataDefinitionLanguage)它可以方便地對數據庫中的數據對象進行定義。數據操縱功能用戶可以使用數據操縱語言(DML,DataManipulationLanguage)操縱數據,實現對數據的基本操作。如查詢、插入、刪除和修改。數據庫的運行管理功能數據庫在建立、運行和維護時由數據庫管理系統統一管理和控制,以保證數據的安全性、完整性,對并發操作的控制以及發生故障后的系統恢復等。數據庫的建立和維護功能它包括數據庫初始數據的輸入、轉換功能,數據庫的轉儲、恢復功能,數據庫的重組織功能和性能監視、分析功能等。2/4/2023數據庫系統(DataBaseSystem,簡記為DBS)
數據庫系統一般由數據庫、操作系統、數據庫管理系統(及其開發工具)、應用系統、數據庫管理員(DBA)和用戶構成。2/4/20231.1.2數據庫技術的產生與發展
數據管理技術經歷了如下三個階段:人工管理階段、文件系統階段和數據庫系統階段。人工管理階段這一階段是指20世紀50年代中期以前,計算機主要用于科學計算,當時的計算機硬件狀況是:外存只有磁帶、卡片、紙帶,沒有磁盤等直接存取的存儲設備;軟件狀況是:沒有操作系統,沒有管理數據的軟件,數據處理方式是批處理。人工管理階段的特點是:數據不保存、數據無專門軟件進行管理、數據不共享、數據不具有獨立性、數據無結構。文件系統階段這一階段從20世紀50年代后期到60年代中期,計算機硬件和軟件都有了一定的發展。計算機不僅用于科學計算,還大量用于管理。這時硬件方面已經有了磁盤、磁鼓等直接存取的存儲設備。在軟件方面,操作系統中已經有了數據管理軟件,一般稱為文件系統。處理方式上不僅有了文件批處理,而且能夠聯機實時處理2/4/2023
文件階段的數據管理特點是:數據可以長期保存、由文件系統管理數據、程序與數據有一定的獨立性、數據共享性差、數據獨立性差、記錄內部有結構。數據庫系統階段從20世紀60年代后期以來,計算機硬件和軟件技術得到了飛速發展,為了解決多用戶、多應用共享數據,使數據為盡可能多的應用服務,文件系統已不能滿足應用需求,一種新的數據管理技術--數據庫技術應運而生。數據庫系統階段具有以下的特點:數據結構化在描述數據時不僅描述數據本身,還描述數據之間的聯系。數據共享性高、冗余度小、易擴充數據可以被多個應用共享。這不僅大大減小了數據的冗余度、節約存儲空間、減少存取時間,而且可以避免數據之間的不相容性和不一致性。2/4/2023數據獨立性高數據獨立性包括物理獨立性和邏輯獨立性。數據的物理獨立性是指當數據的物理存儲改變時,應用程序不用改變。數據的邏輯獨立性是指當數據的邏輯結構改變時,用戶應用程序不用改變。統一的數據管理和控制數據庫對系統中的用戶是共享資源。計算機的共享一般是并發的,即多個用戶可以同時存取數據庫中的數據,甚至可以同時存取數據庫中同一個數據。因此,數據庫管理系統必須提供以下幾個方面的數據控制保護功能。數據的安全性(security)保護數據的完整性(integrity)控制數據庫恢復(recovery)并發(concurrency)控制
2/4/20231.1.3數據庫系統的體系結構集中式系統
DBMS和應用程序以及與用戶終端進行通信的軟件等都運行在一臺宿主計算機上,所有的數據處理都是在宿主計算機中進行。宿主計算機一般是大型機、中型機或小型機。應用程序和DBMS之間通過操作系統管理的共享內存或應用任務區來進行通信,DBMS利用操作系統提供的服務來訪問數據庫。終端通常是非智能的,本身沒有處理能力。集中系統的主要優點是:具有集中的安全控制,以及處理大量數據和支持大量并發用戶的能力。集中系統的主要缺點是:購買和維持這樣的系統一次性投資太大,并且不適合分布處理。個人計算機系統與大型系統不同,通常個人計算機(微機)上的DBMS功能和數據庫應用功能是結合在一個應用程序中的,這類DBMS(如FoxPro、Acssce)的功能靈活,系統結構簡潔,運行速度快,但這類DBMS的數據共享性、安全性、完整性等控制功能比較薄弱。2/4/2023客戶/服務器系統在客戶/服務器(Client/Server,簡記為C/S)結構的數據庫系統中,數據處理任務被劃分為兩部分:一部分運行在客戶端,另一部分運行在服務器端。客戶端負責應用處理,數據庫服務器完成DBMS的核心功能。這種模型中,客戶機上都必須安裝應用程序和工具,使客戶端過于龐大、負擔太重,而且系統安裝、維護、升級和發布困難,從而影響效率。分布式系統一個分布式數據系統由一個邏輯數據庫組成,整個邏輯數據庫的數據,存儲在分布于網絡中的多個結點上的物理數據庫中。在當今的客戶/服務器結構的數據庫系統中,服務器的數目可以是一個或多個。當系統中存在多個數據庫服務器時就形成了分布系統。瀏覽器/服務器系統隨著Internet的迅速普及,出現了三層客戶機/服務器模型:客戶機→應用服務器→數據庫服務器。這種系統稱為瀏覽器/服務器(Browser/Server,簡記為B/S)系統。2/4/20231.1.4數據庫系統三級模式結構從DBMS方面考慮,數據庫系統通常采用三級模式結構,這是DBMS內部的系統結構。模式(schema)
模式也稱為邏輯模式,是數據中全體數據的邏輯結構和特征描述,是所有用戶的公共數據視圖。一個數據庫只有一個模式。DBMS提供描述語言(模式DDL)來嚴格定義模式。外模式(externalschema)
外模式也稱為子模式或用戶模式,它是數據庫用戶能夠看到和使用的局部數據的邏輯結構和特征的描述,是數據庫用戶的數據視圖,是與某一應用有關的數據的邏輯表示。外模式通常是模式的子集。一個數據庫可以有多個外模式。外模式是保證數據庫安全性的一個有力措施。每個用戶只能看見和訪問所對應的外模式中的數據,數據庫中其余數據是不可見的。
DBMS提供子模式描述語言(子模式DDL)來嚴格定義子模式。2/4/2023內模式(internalshcema)
內模式也稱為存儲模式(storageshcema),一個數據庫只有一個內模式。它是數據物理結構和存儲方式的描述,是數據在數據庫內部的表示方式。
DBMS提供內模式描述語言(內模式DDL,或者存儲模式DDL)來嚴格定義內模式。三級模式之間的映射
三級模式間有兩種映射:模式/外模式映射、模式/內模式映射模式/外模式映射定義某個外模式和模式的對應關系,當模式發生改變時,只要改變其映射,而無需改動外模式,從而保證了數據的邏輯獨立性。模式/內模式映射定義內模式和模式的對應關系,當內模式發生改變時,只要改變其映射,而無需改動模式,從而保證了數據的物理獨立性。2/4/20231.2數據模型
1.2.1數據模型及其組成要素
數據庫系統的核心是數據庫,數據庫是根據數據模型建立的,因而數據模型是數據庫系的基礎。數據模型通常都是由數據結構、數據操作和完整性約束3個要素組成。數據結構數據結構研究數據元素之間的組織形式、存儲形式以及數據操作等。數據結構用于描述系統的靜態特性。在數據庫系統中,通常按照其數據結構的類型來命名數據模型。例如層次結構、網狀結構、關系結構的數據模型分別命名為層次模型、網狀模型和關系模型。2/4/2023數據操作數據操作用于描述系統的動態特性。數據操作是指對數據庫中的各種對象的實例允許執行的操作的集合,包括操作及有關的操作規則。數據庫主要有查詢和更新兩大類操作。數據完整性約束數據完整性約束是一組完整性規則的集合。完整性規則是給定的數據模型中數據及其聯系所具有的制約和儲存規則,用以符合數據模型的數據庫狀態以及狀態的變化,以保證數據的正確、有效和相容。數據模型是數據庫技術的關鍵,它的3個要素完整地描述了一個數據模型。2/4/20231.2.2數據模型的種類目前,數據庫領域中,最常用的數據模型有:層次模型、網狀模型和關系模型。層次模型層次模型是數據庫中最早出現的數據模型,層次數據庫系統采用層次模型作為數據的組織方式。用樹型結構表示實體類型以及實體間的聯系是層次模型的主要特征。層次模型的一個最基本的特點是,任何一個給定的記錄值(也稱為實體)只有按照其路徑查看時,才能顯出它的全部意義。沒有一個子記錄值能夠脫離雙親記錄值而獨立存在。
2/4/2023R1R2R3R4R5R6圖1-1層次模型示意圖2/4/2023網狀模型在現實世界中事物之間的聯系更多的是非層次關系的,用層次模型表示非樹形結構是很不直接的,網狀模型則可以克服這一弊端。用網狀結構表示實體類型及實體之間聯系的數據模型稱為網狀模型。在網狀模型中,一個子結點可以有多個父結點,在兩個結點之間可以有一種或多種聯系。R1R2R3R4R5
圖1-2網狀模型示意圖2/4/2023關系模型(relationalmodel)
關系模型是目前最常用的一種數據模型。關系數據庫系統采用關系模型作為數據的組織方式。在關系模型中,數據在用戶觀點下的邏輯結構就是一張二維表。每一張二維表稱為一個關系(relation)。學號姓名性別出生年月班級專業R10001王宏男85/11/121班軟件R20002孫萌女86/10/091班軟件R30115陳小明男86/07/122班信息管理R40200吳江男86/04/053班信息管理關系模型示意圖2/4/20231.3數據庫設計
1.3.1數據庫設計概述
數據庫設計的主要內容有數據庫的結構特性設計和數據庫的行為特性設計。數據庫的結構特性設計起著關鍵作用。數據庫的結構特性是靜態的,一般情況下不會輕易變動。數據庫的行為結構設計是指確定數據庫用戶的行為和動作。數據庫用戶的行為和動作是指數據查詢和統計、事物處理及表報處理等。1.3.2數據庫設計的基本步驟考慮數據庫及其應用系統開發的全過程,可以將數據庫設計過程可分為以下6個階段。2/4/2023需求分析階段進行數據庫應用軟件的開發,首先必須準確了解與分析用戶需求(包括數據處理)。需求分析是整個開發過程的基礎,是最困難、最耗費時間的一步。作為地基的需求分析是否做的充分與準確,決定了在其上建造數據庫大廈的速度與質量。需求分析做的不好,會導致整個數據庫應用系統開發返工重做的嚴重后果。概念結構設計階段概念結構設計是整個數據庫設計的關鍵,它通過對用戶需求進行綜合、歸納與抽象,形成一個獨立于具體DBMS的概念模型,一般用E-R圖表示概念模型。邏輯結構設計階段邏輯結構設計是將概念結構轉化為選定的DBMS所支持的數據模型,并使其在功能、性能、完整性約束、一致性和可擴充性等方面均滿足用戶的需求。2/4/2023數據庫物理設計階段
數據庫的物理設計是為邏輯數據模型選取一個最適合應用環境的物理結構(包括存儲結構和存取方法)。即利用選定的DBMS提供的方法和技術,以合理的存儲結構設計一個高效的、可行的數據庫的物理結構。數據庫實施階段
數據庫實施階段的任務是根據邏輯設計和物理設計的結果,在計算機上建立數據庫,編制與調試應用程序,組織數據入庫,并進行系統測試和試運行。
數據庫運行和維護階段數據庫應用系統經過試運行后即可投入正式運行。在數據庫系統運行過程中必須不斷地對其進行評價、調整與修改。
2/4/20231.4概念模型2/4/20231.4.1信息世界中的基本概念
實體(entity)
客觀存在并可相互區別的事物稱為實體。實體可以是具體的人、事、物,也可以是抽象的概念或聯系。屬性(attribute)
實體所具有的某一特性稱為屬性。一個實體可以由若干個屬性來刻畫。主碼(primarykey)
惟一標識實體的屬性集稱為主碼。例如,學生號是學生實體的主碼,職工號是職工實體的主碼。域(domain)
屬性的取值范圍稱為該屬性的域。例如,職工性別的域為(男,女),姓名的域為字母字符串集合,年齡的域為小于150的整數,職工號的域為5位數字組成的字符串等。2/4/2023實體型(entitytype)
具有相同屬性的實體必然具有共同的特征和性質。用實體名及其屬性名集合來抽象和刻畫同類實體,稱為實體型。例如,學生(學號,姓名,性別,出生年份,系,入學時間)就是一個實體型。實體集(entityset)
同型實體的集合稱為實體集。例如,全體學生就是一個實體集。圖書館的圖書也是一個實體集。
聯系(relationship)
在現實世界中,事物內部以及事物之間是有聯系的,這些聯系在信息世界中反映為實體內部的聯系和實體之間的聯系。實體內部的聯系通常是組成實體的各屬性之間的聯系。2/4/2023
兩個實體型之間的聯系可以分為3類一對一聯系(1:1)如果對于實體集A中的每一個實體,實體集B至多有一個實體與之聯系,反之亦然,則稱實體集A與實體集B具有一對一聯系,記為1:1。
例如,一個賓館,每個客房都對應著一個房間號,一個房間號也惟一的對應這一間客房。所以,客房和房間號之間具有一對一聯系。又如,確定部門實體和經理實體之間存在一對一聯系,意味著一個部門只能有一個經理管理,而一個經理只管理一個部門。一對多聯系(1:n)
如果對于實體集A中的每一個實體,實體集B中有n個實體與之聯系(n>=0),反之,對于實體集B中的每一個實體,實體集A中至多有一個實體與之聯系,則稱實體集A與實體集B具有一對多聯系,記為1:n。
例如,一個部門中有若干名職工,而每個職工只能在一個部門工作,則部門與職工之間具有一對多聯系。
2/4/2023多對多聯系(m:n)
如果對于實體集A中的每一個實體,實體集B中有n個實體與之聯系(n>=0),反之,對于實體集B中的每一個實體,實體集A中也有m個實體與之聯系(m>=0),則稱實體集A與實體集B具有多對多聯系,記為m:n。
注意:一對一聯系是一對多聯系的特例,而一對多聯系又是多對多聯系的特例。實體型之間的這種一對一、一對多、多對多聯系不僅存在于兩個實體型之間,也存在于兩個以上的實體型之間。同一個實體集內的各實體之間也可以存在一對一、一對多、多對多的聯系。2/4/20231.4.2概念模型的表示方法
概念模型是對信息世界建模,所以概念模型應該能夠方便、準確地表示信息世界中的常用概念。概念模型的表示方法很多,其中最為常用的是P.P.S.Chen于1976年提出的實體-聯系方法(Entity-RelationshipApproach,簡記為E-R表示法)。該方法用E-R圖來描述現實世界的概念模型,稱為實體-聯系模型,簡稱E-R模型。E-R圖中各圖形的含義及圖示見表1-1。
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
評論
0/150
提交評論