




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
電子商務的數據庫技術注冊電子商務工程師(CEBE)認證培訓教材
第1章數據庫技術概論
本章的重要概念信息、數據、數據處理、數據管理、關系模型、概念數據模型、邏輯數據模型、數據庫、數據庫管理系統、數據庫系統、外模式、模式、內模式、E–R圖、現實世界、信息世界、機器世界
本章的重要知識點(1)數據和信息的基本含義及他們之間的相互(2)數據的三個范疇及其聯系(3)邏輯數據模型的三要素(4)數據庫、數據庫管理系統及數據庫系統之間的聯系(5)數據庫管理系統的功能(6)數據庫系統的三級模式結構及他們之間的映象(7)數據庫技術新進展。
1.1信息與數據信息是一種已經被加工為特定形式的數據,這種數據形式對接收者來說是有意義的,而且對當前和將來的決策具有明顯的或實際的價值。信息可以劃分為兩大類。能夠用數據或統一的結構加以表示,稱之為結構化數據,如數字、符號;無法用數字或統一的結構表示,如文本、圖像、聲音、網頁等,稱之為非結構化數據。
1.1.1信息信息具有如下一些重要的特性:
(1)普遍性
(2)無限性
(3)相對性
(4)傳遞性
(5)變換性
(6)有序性
(7)動態性
(8)轉化性
1.1.1信息1.1.2
數據數據是用來記錄信息的、可以識別的符號,是信息的載體、信息的具體表示形式
數據具有兩方面的含義:一方面數據內容是事物特性的反映或描述;另一方面數據是存儲在某一種媒體上符號的集合
1.1.3信息與數據的關系
信息必然是數據,但數據未必是信息,信息僅是數據的一個子集,有用的數據才成為信息
1.2數據處理與數據管理數據處理是指將數據進行加工轉換成信息的過程。數據管理是指數據的收集、整理、組織、存儲、維護、檢索、傳送等操作。數據處理是與數據管理相聯系的,數據管理技術的優劣,將直接影響數據處理的效率。1.3
數據模型數據模型:
描述要管理的數據的邏輯結構、使用操作要求,以及完整性的形式方法
數據的描述包括兩個方面:(1)數據的靜態性:包括數據的基本結構、數據間的聯系和數據中的約束。(2)數據的動態性:指定義在數據上的操作。1.3.1數據描述
現實世界就是存在于人腦之外的客觀存在的事物及其相互聯系。事物之間的聯系是由事物本身的特性決定的。
信息世界,也稱為概念世界,是現實世界在人們頭腦中的反映,是對客觀事物及其聯系的一種抽象描述。機器世界,也稱為數據世界,是對信息世界中的有關信息進行加工、編碼及格式化等具體處理,然后以數據形式存儲在計算機內。
1.3.1數據描述
信息世界常涉及到的概念和術語:(1)實體(2)實體集
(3)屬性
(4)碼
(5)域
(6)實體類型
(7)聯系
1.3.1數據描述
機器世界中,常涉及到的概念和術語:(1)字段
(2)記錄
(3)文件
(4)數據庫
(5)關鍵字
1.3.2概念數據模型
概念數據模型,也稱為概念模型,是指為正確直觀地反映客觀事物及其聯系,按用戶觀點對信息世界所建立一個抽象模型。該模型獨立于計算機系統的模型,完全不涉及信息在系統中的表示,只是用來描述某個特定組織所關心的信息結構.1.3.2概念數據模型
概念數據模型:(1)具有較強的語義表達能力,能夠方便、直接地表達應用中的各種語義知識;(2)由于用戶一般缺乏計算機知識,因此概念模型應當簡單、清晰、易于理解;(3)獨立于計算機系統的模型,完全不涉及信息在計算機中的表示;(4)獨立于任何DBMS,但可以轉換為計算機上任一DBMS所支持的特定數據模型。
1.3.2概念數據模型
實體間的聯系(1)一對一聯系(2)一對多聯系(3)多對多聯系實體聯系方法
E–R模型通常由如下三個要素構成:(1)實體:表示客觀事物。(2)屬性:表示客觀事物的特征(屬性)。(3)聯系:客觀事物之間的聯系。1.3.2概念數據模型
E–R模型三要素的表示:(1)矩形:表示實體,矩形框內寫明實體名;(2)橢圓:表示實體的屬性,并用無向邊將其與相應的實體連接起來;(3)菱形:表示實體間的聯系,菱形框內寫明聯系名,并用無向邊分別與有關實體連接起來,同時在無向線段上標注聯系的類型,即1:1、1:n或m:n。1.3.3邏輯數據模型邏輯數據模型:將概念數據模型中描述的實體及實體之間的聯系轉換為表示數據及數據之間邏輯聯系的結構形式。這種對現實世界的第二層抽象是直接面向數據庫的邏輯結構,稱為邏輯數據模型。邏輯數據模型滿足如下三個要求:(1)能比較真實模擬現實世界;(2)容易為人所理解;(3)便于在計算機上實現。
1.3.3邏輯數據模型邏輯數據模型的三要素:(1)數據結構(2)數據操作(3)數據的約束條件邏輯數據模型的分類:(1)層次模型用樹形結構表示實體及其之間的聯系的模型,他由處于不同層次的各個結點組成,每一個結點為一個描述實體的記錄類型,每個記錄類型可包含若干個描述實體屬性的字段。結點之間的連線表示記錄類型間的聯系。1.3.3邏輯數據模型層次模型的特點:
除根結點外,其余各結點有且僅有一個上一層結點作為其“雙親”結點,而位于其下的較低一層的若干個結點作為其“子女”結點;任何一個給定的記錄值只有按其路徑查看時,才能顯出他的全部意義,沒有一個子女記錄值能夠脫離雙親記錄值而獨立存在。1.3.3邏輯數據模型層次模型的優點:①數據模型比較簡單,只需很少幾條命令就可操縱數據庫,使用方便;
②對于實體間聯系是固定的應用系統,性能較好;③提供良好的完整性支持;
④對具有一對多的層次關系的部門進行描述非常自然、直觀,容易理解,這就是層次模型的突出優點。1.3.3邏輯數據模型(2)網狀模型網狀模型是一種比層次模型更具普遍性的結構,他去掉了層次模型的兩個限制,允許多個結點沒有父結點,允許一個結點有多個父結點,此外他還允許兩個結點之間有多種聯系。網狀模型通常用指針來確定數據間的聯系關系,是具有多對多類型的數據組織方式,網狀模型將數據組織成有向圖結構。結構中每個結點代表一個數據記錄型,每個記錄型可包含若干字段,結點間的連線描述不同結點數據間的關系。1.3.3邏輯數據模型網絡模型的優點:
①可以描述現實生活中極為常見的多對多的關系,并具有良好的性能;②數據存貯效率較高;③在一定程度上支持數據的重構,具有一定的數據共享特性,并且運行效率較高;④能取代任何層次結構的系統。可以認為層次模型是網絡模型的特例。1.3.3邏輯數據模型(3)關系模型關系模型是當前最重要、最常用的一種數據模型。他是由E.F.Codd于1970年提出的。關系模型把世界看作是由實體和聯系構成的。在關系模型中實體通常是以表的形式來表現的。表的每一行描述實體的一個實例,表的每一列描述實體的一個特征或屬性。
1.3.3邏輯數據模型關系模型中的一些基本概念:①元組②屬性③域④主鍵⑤關系名⑥分量⑦關系模式⑧關系數據庫1.3.3邏輯數據模型關系模型的優點: ①能夠以簡單、靈活的方式表達現實世界中各種實體及其相互間關系。 ②關系模型具有嚴密的數學基礎 ③關系數據模型中數據間的關系具有對稱性 ④關系模型的存取路徑對用戶透明1.3.4物理數據模型
反映數據存儲結構的數據模型稱為物理數據模型。在數據庫系統中,數據的邏輯結構與數據的物理結構之間可以差別很大,數據的邏輯結構面向程序員,數據的物理結構面向機器。數據庫管理軟件的功能之一,就是要能夠把數據的邏輯結構映象為數據的物理結構、把數據的物理結構映象為數據的邏輯結構。1.4數據庫中的基本概念數據庫是按一定的格式存儲在計算機內的相關數據集合,他能為不同用戶所共享數據庫管理系統是對數據庫進行管理的軟件系統。他為用戶或應用程序提供了訪問數據庫的數據和對數據的安全性、完整性、保密性、并發性等進行統一控制的方法數據庫系統是指以數據庫方式管理共享數據的計算機系統,數據庫系統常簡稱為數據庫。數據庫系統由數據庫和數據庫管理系統兩部分組成1.4數據庫中的基本概念數據庫、數據庫系統和數據庫管理系統是三個不同的概念。數據庫強調的是數據,數據庫管理系統則是系統軟件,而數據庫系統強調的是整個系統,目的在于維護信息,并在必要時提供協助取得這些信息。另一方面,用戶使用數據庫是目的,數據庫管理系統是幫助達到這一目的的工具和手段。1.5數據庫系統的結構從數據庫系統的角度看,數據庫系統內部通常采用由外模式、模式和內模式三級抽象模式構成的三級模式結構。從最終用戶的角度看,數據庫系統外部的體系結構分為單用戶結構、主從式結構、分布式結構、客戶/服務器結構和瀏覽器/服務器等。1.5.1數據庫三級模式結構數據庫系統的三級模式結構是指數據庫系統是由外模式(也稱子模式或用戶模式)、模式(也稱邏輯模式或概念模式)和內模式(也稱存儲模式)三級抽象模式構成。模式是數據庫中全部數據的整體邏輯結構的描述,是所有用戶的公共數據視圖。他既不涉及數據的物理存儲細節和硬件環境,也與具體的應用程序和所使用的應用開發工具無關。他僅僅涉及到型的描述,因此數據的模式是相對穩定的。1.5.1數據庫三級模式結構外模式是用戶和數據庫系統的接口,是對用戶用到的那部分數據的邏輯結構的描述。從數據庫管理系統來講,外模式就是對單個用戶使用的數據視圖的描述。內模式是數據庫在物理存儲方面的描述,定義所有內部記錄類型、索引和文件的組織方式,以及數據控制方面的細節等。一個數據庫只有一個內模式。1.5.1數據庫三級模式結構為了能夠在內部實現這三個抽象層次的聯系和轉換,數據庫管理系統在這三級模式之間提供了外模式/模式和模式/內模式兩個層次的映象,使用戶能邏輯地、抽象地處理數據,而不必關心數據在計算機中的具體表示方式及存儲方式。外模式/模式映象定義了外模式和模式之間的對應關系。模式/內模式映象用于定義模式和內模式之間的對應關系1.5.2數據庫系統的體系結構
單用戶數據庫系統是一種早期的最簡單的數據庫系統。整個數據庫系統都裝在一臺計算機上,為一個用戶獨占主從式數據庫系統是一個主機帶多個終端的多用戶數據庫系統分布式結構的數據庫系統是指數據庫中的數據在邏輯上是一個整體,但物理地分布在計算機網絡的不同結點上1.5.2數據庫系統的體系結構服務器是指網絡中某個(些)結點上的計算機專門用于執行數據庫管理系統功能。客戶機是指其他結點上的計算機安裝數據庫管理系統的外圍應用開發工具,支持用戶的應用瀏覽器/服務器結構
1.6
數據庫技術的發展(1)數據庫技術與分布式處理技術相結合,形成了分布式數據庫系統;(2)數據庫技術與面向對象技術相結合,形成了面向對象數據庫系統;
(3)數據庫技術與多媒體技術相結合,形成了多媒體數據庫系統。1.6.1面向對象數據庫系統面向對象數據模型的基本概念(1)對象與對象標識(2)封裝(3)類(4)類層次結構(5)類的繼承性(6)消息1.6.1面向對象數據庫系統面向對象數據庫語言(1)類的定義與操縱(2)方法的定義(3)對象的操縱1.6.1面向對象數據庫系統構造面向對象數據庫系統的方法(1)擴充面向對象程序設計語言,為其增加DBMS的特性(2)對傳統關系數據庫管理系統加以擴展,為其增加面向對象的特性(3)建立全新的支持面向對象數據模型的面向對象數據庫系統1.6.2分布式數據庫系統
分布式數據庫系統是由若干臺計算機(也稱為節點)組成。節點之間通過通訊網絡連接在一起,每個節點都是一個獨立的數據庫系統,他們都擁有各自的數據庫、中央處理機、終端,以及各自的局部數據庫管理系統。1.6.2分布式數據庫系統與集中式數據庫系統不同,分布式數據庫系統具有如下特點:(1)數據的物理分布性(2)數據的邏輯整體性
(3)數據的分布透明性
(4)數據的冗余及冗余透明性
(5)集中與自治相結合的控制機構
1.6.3多媒體數據庫系統
多媒體數據庫是指數據庫中的信息不僅涉及各種數字、字符等格式化的表達形式,而且還包括多媒體的非格式化的表達形式,數據管理要涉及各種復雜對象的處理。與傳統數據庫相比,多媒體數據庫具有如下特點:(1)處理的數據對象、數據類型、數據結構、數據模型和應用對象都不同,處理的方式也不同。(2)多媒體數據庫存儲和處理復雜對象,其存儲技術需要增加新的處理功能,如數據壓縮和解壓。1.6.3多媒體數據庫系統(3)多媒體數據庫面向應用,沒有單一的數據模型適應所有情況,隨應用領域和對象而建立相應的數據模型。(4)多媒體數據庫強調媒體獨立性,用戶應最大限度地忽略各媒體間的差別而實現對多種媒體數據的管理和操作。(5)多媒體數據庫強調對象的物理表現和交互方式,強調終端用戶界面的靈活性和多樣性。(6)多媒體數據庫具有更強的對象訪問手段,比如特征訪問、瀏覽訪問、近似性查詢等。第2章關系數據庫的
基本理論
本章的重要概念關系、屬性、域、元組、主關鍵字、外鍵、關系模型、索引、視圖、投影、選擇、連接、笛卡兒乘積、除、并、交、差、基本表
本章的重要知識點(1)關系模型的構成及關系模型的完整性(2)如何利用SQL語言定義、修改、刪除表、視圖、索引等(3)如何用關系代數表達式來表達實際查詢問題(4)對給定一個關系代數表達式如何用SQL語句進行描述(5)如何利用SQL的SELECT完成數據的查詢(6)如何利用SQL的UPDATE、INSETER完成數據的修改、插入操作(7)存儲過程的概念及優點
2.1關系數據庫域是一組具有相同數據類型的值的集合。也稱為值域,記為D。域中所包含的值的個數稱為域的基數,記為m。在關系數據庫中用域表示屬性的取值范圍。給定一組域D1,D2,…,Dn,這些域中可以有相同的部分,則D1,D2,…,Dn的笛卡爾積定義為:D1×D2×…×Dn={(d1,d2,…,dn)|di∈Di,i=1,2,…,n}
2.1.1關系模型的數據結構
D1×D2×…×Dn的子集叫作在域D1、D2、…、Dn上的關系,用R(D1,D2,…,Dn)表示。這里R表示關系的名字,n是關系的目或度,也稱為元數。關系是笛卡積的子集,所以關系也是一個二維表,表的每行對應一個元組,表的每列對應一個域。由于域可以相同,為了加以區分,必須對每列起一個名字,稱為屬性。
2.1.1關系模型的數據結構
關系可以有三種類型:基本關系(也稱為基本表或基表,一個基本表對應于關系型數據庫中的一個關系)、查詢表和視圖表。基本表是實際存在的表,他是實際存儲數據的邏輯表示。查詢表是查詢結果對應的表。視圖表是由基本表或其他視圖表導出的表,是虛表。2.1.1關系模型的數據結構
關系數據庫中的關系具有以下六條性質:①列是同質的,即每一列中的分量是同一類型的數據,來自同一個域;②不同的列可出自同一個域,稱其中的每一列為一個屬性,不同的屬性要給予不同的屬性名;③列的順序無所謂,即列的次序可以任意交換;④任意兩個元組不能完全相同。⑤行的順序無所謂,即行的次序可以任意交換;⑥分量必須取原子值,即每一個分量都必須是不可分的數據項。
2.1.1關系模型的數據結構
一個命名關系的屬性名序列或關系的描述稱為關系模式。可以形式化地表示為:R(U,D,DOM,F)由于D和DOM對模式設計關系不大,因此關系模式通常被看作是一個二元組:R〈U,F〉。如果一個關系名R,并有屬性名列A1,A2,…,An。則關系模式通常可以簡記為:R(A1,A2,…,An)。而域名及屬性向域的映象常常被說明為屬性的類型、長度。
2.1.1關系模型的數據結構
2.1.2關系模型的完整性
完整性是指對數據邏輯正確性的判斷,他關系到某種狀態是否為語義所允許。完整性可以分為兩大類:一類是與數據模型有關的;一類是現實世界固有的,他是數據合理性的補充說明。就關系模型而言,關系模型的完整性是指對關系的某種約束條件。主要有:實體完整性約束,即對主鍵約束;參照完整性約束,即外鍵約束;用戶定義的完整性。
2.1.2關系模型的完整性
實體完整性規則為:若屬性A是基本關系R的主屬性,則屬性A不能取空值。參照完整性規則為:若屬性(或屬性組)F是基本關系R的外鍵,他與基本關系S的主鍵Ks相對應(基本關系R和S不一定是不同的關系),則對于R中每個元組在F上的值必須為:
(1)或者取空值(F的每個屬性值均為空值);
(2)或者等于S中某個元組的主鍵值。用戶定義的完整性就是針對某一具體關系數據庫的約束條件,他反映某一具體應用所涉及的數據必須滿足的語義要求。2.2關系代數
關系代數是一種抽象的查詢語言,是關系數據操縱語言的一種表達方式。如同數字運算的對象和結果都是數字一樣,關系代數運算的對象和結果都是關系。關系運算符可以分為集合運算符、專門的關系運算符、算術比較符和邏輯運算符四大類2.2.1傳統的集合運算
并運算:設關系R和關系S具有相同的目n,即兩個關系都有n個屬性,且相應的屬性取自同一個域,則關系R與關系S的并是由屬于R或屬于S的元組組成的集合,其結果關系仍為n目關系。記作:
RUS={t|t∈R∨t∈S}
差運算:設關系R和關系S具有相同的目n,且相應的屬性取自同一個域,則關系R與關系S的差是由屬于R而不屬于S的所有元組組成。其結果關系仍為n目關系。記作:
R-S={t|t∈R∧┐t∈S}2.2.1傳統的集合運算
交運算:設關系R和關系S具有相同的目n,且相應的屬性取自同一個域,則關系R與關系S的交是由既屬于R又屬于S的元組組成。其結果關系仍為n目關系。記作:
R∩S={t|t∈R∧t∈S}
廣義笛卡爾積:假設關系R和S的元組分別為n目和m目,則關系R和S的廣義笛卡爾積是一個(n+m)列的元組的集合。元組的前n列是關系R的一個元組,后m列是關系S的一個元組。若R有k1個元組,S有k2個元組,則關系R和關系S的廣義笛卡爾積有k1×k2個元組。記作:
R×S={t|t=(tn,tm)tn∧∈R∧tm∈S}
關系SabcdefABC關系RabcdefwxyABCabcdefwxyABC并集【例】設有兩個關系R和S,且他們具有相同的關系模式,求關系R和S的并集。
關系SabcdefABC關系RabcdefwxyABC【例】設有兩個關系R和S,且他們具有相同的關系模式,求關系R和S的差集
。
關系R-SwxyABC關系SabcdefABC關系RabcdefwxyABC【例】設有兩個關系R和S,且他們具有相同的關系模式,求關系R和S的交集
。
關系R∩SabcdefABC關系SabcdefABC關系RabcdefwxyABC【例】設有兩個關系R和S,且他們具有相同的關系模式,求關系R和S的廣義笛卡爾積。
關系R×SabcabcabcdefdefabcdefdefwxyabcwxydefABCABC2.2.2專門的關系運算
選擇:依據關系R中的某些條件對關系R進行水平分割,即在關系R中選擇滿足給定條件的元組。記作:
σF(R)={t|t∈R∧F(t)=“真”}
投影:投影就是從關系R中選擇出若干屬性列形成新的關系,即對關系R進行垂直的分割,去掉某些列,保留指定的列,其結果關系是列的子集。記作:
πA(R)={t[A]|t∈R}
2.2.2專門的關系運算連接:連接(也稱為θ連接)是從兩個關系的笛卡爾積中選取屬性值滿足一定條件的元組。記作:連接運算中最為重要連接運算是:等值連接和自然連接
2.2.2專門的關系運算等值連接:就是下式中θ為“=”的連接運算記作:2.2.2專門的關系運算自然連接:是一種特殊的等值連接,他要求參與運算的兩個關系在同名屬性域上有相同的值,并且要在結果中把重復的屬性去掉。即若R和S具有相同的屬性組B,則自然連接可記作:2.2.2專門的關系運算自然連接與等值連接的區別是:①在做自然連接的兩個關系中,要求值相等的屬性名也必須相等,而在等值連接中不要求值相等的屬性名相等。②在自然連接的結果中,去掉重復的屬性名,而在等值連接的結果中不要求去掉重復的屬性名。
2.2.2專門的關系運算對關系R和S進行連接運算的步驟為:①計算笛卡爾積R×S;②從R×S中選擇那些滿足AθB的元組,即是要求的結果
2.2.2專門的關系運算對關系R和S進行自然連接運算的步驟為:①計算關系R和S的笛卡爾積R×S;②從R×S中選擇那些公共屬性如A的數值相同(σR.A=S.A)的元組。此時我們擁有一個包含屬性A兩次的表;③去掉S.A,將留下來的R.A改為A后,就是所要的結果。
2.2.2專門的關系運算除:設給定關系R(X,Y)和S(Y,Z),其中X,Y,Z為屬性組。R中的Y與S中的Y可以有不同的屬性名,但必須出自相同的域集。R與S的除運算得到一個新的關系P(X),P是R中滿足下列條件的元組在X屬性列上的投影:元組在X上分量值x的象集Yx包含S在Y上投影的集合。記作:
2.2.2專門的關系運算求R÷S的操作步驟為:①將被除關系R的屬性分為象集屬性Y和結果屬性X兩部分,其中象集屬性Y是除關系S中的全部屬性的集合;②在除關系X中,對與被除關系相同的象集屬性進行投影,得到除目標數據集;③將被除關系分組,分組原則是:結果屬性值一樣的元組分為一組;④對③中所得每一個組,如果他的象集屬性值中包括除目標數據集,則對應的結果屬性值應屬于該除法運算結果集。
【例】設有關系R和S,計算R∞S。
關系R
關系S
ABC
CDE123
3ab456
6cd789
2ef(1)計算笛卡兒乘積R×S
ABR.CS.CDE1233ab1236cd1232ef4563ab4566cd4562ef7893ab7896cd7892ef(2)選擇σR.C=S.C(R×S
)ABR.CS.CDE1233ab4566cd(3)刪除重復的列S.C,并將留下來的R.C改為C
ABCDE123ab456cd2.3結構化查詢語言SQL結構化查詢語言SQL(StructuredQueryLanguage,簡稱SQL)是由Boyce和Chamberlin于1974年提出的一個通用的、功能極強的關系數據庫語言。他所提供的功能包括查詢、操縱、定義和控制四個方面
SQL語言的特點
(1)一體化(2)高度非過程化(3)面向集合的操作方式(4)以同一種語法結構提供兩種使用方式(5)語言簡潔,易學易用2.3結構化查詢語言SQL定義基本表
CREATETABLE表名(列名1數據類型列名2數據類型
列名n
數據類型)2.3結構化查詢語言SQL修改基本表
ALTERTABLE表名
[ADD(新列名數據類型)][MODIFY(列名
數據類型)];
刪除基本表
DROPTABLE表名2.3結構化查詢語言SQL建立索引
CREATEINDEX索引名
ON表名(列名);
刪除索引
DROPINDEX索引名;2.3結構化查詢語言SQL建立視圖
CREATEVIEW視圖名
[(列名[,列名,…])] [ASSELECT查詢子句]刪除視圖
DROPVIEW視圖名2.3結構化查詢語言SQL數據添加
INSERTINTO表名(列名1,列名2,…列名n)
VALUES(值1,值2,…值n)
數據修改
UPDATE表名SET列名=值[,列名=值][WHERE限制條件];2.3結構化查詢語言SQL數據刪除
DELETE FROM表名
[WHERE限制條件];
數據查詢
SELECT表的列名或列表達式集合
FROM表集合
[WHERE條件表達式] [GROUPBY列名集合] [HAVING組條件表達式] [ORDERBY列名[ASC|DESC]];2.3結構化查詢語言SQL授權語句
GRANT權限[,權限]... [ON對象類型對象名] TO用戶[,用戶]... [WITHGRANTOPTION];
收權語句
REVOKE權限[,權限]... [ON對象類型對象名] FROM用戶
[,用戶
]...2.3結構化查詢語言SQL存儲過程
存儲過程是一組為了完成特定功能的由流控制和SQL語句書寫的過程,這個過程經編譯和優化后存儲在數據庫服務器中,使用時只要調用即可。
使用存儲過程有以下的優點:(1)存儲過程的能力大大增強了SQL語言的功能和靈活性。(2)可保證數據的安全性和完整性。(3)通過存儲過程可以使沒有權限的用戶在控制之下間接地存取數據庫,從而保證數據的安全。2.3結構化查詢語言SQL(4)通過存儲過程可以使相關的動作在一起發生,從而可以維護數據庫的完整性。(5)再運行存儲過程前,數據庫已對其進行了語法和句法分析,并給出了優化執行方案。(6)由于存儲過程是已經編譯好的代碼,所以執行的時候不必再次進行編譯,從而提高了程序的運行效率。第3章關系數據庫的
設計理論
本章的重要概念規范化、函數依賴、非平凡的函數依賴、平凡的函數依賴、部分函數依賴、傳遞函數依賴、多值依賴、主關鍵字、候選關鍵字、主屬性、非屬性、第一范式、第二范式、第三范式、第四范式、BCNF范式
本章的重要知識點(1)函數依賴、多值依賴和鍵的基本內涵(2)關系模式規范化的途徑(3)第一范式、第二范式、第三范式、BCN范式和第四范式含義、聯系與區別(4)數據庫設計概念、內容、常用方法、新奧爾良方法的設計步驟
3.1關系模式規范化概述
關系模式的規范化就是要求關系數據庫中的關系必須遵循的一定規則,即在關系數據庫中,要對你所設計的關系模式進行一定的規范化處理常見的范式有1NF、2NF、3NF、BCNF、4NF、5NF等第一范式(1NF)是關系模式必須滿足的最低要求。在第一范式的基礎上進一步滿足更多要求的稱為為第二范式(2NF),其余范式以次類推。
設R(U)是屬性集U上的關系模式。X,Y是U的子集。若對于R(U)的任意一個關系r,若r中任意兩個元組在X上的屬性值相等,則他們在Y上的屬性值也一定相等,則稱X函數確定Y,或Y函數依賴于X。記作X→Y。如果X→Y,且Y不是X的子集,則稱X→Y是非平凡的函數依賴。3.2函數依賴如果X→Y,且Y是X的子集,則稱X→Y是平凡的函數依賴。在R(U)中,如果X→Y,并且對于X的任何一個真子集X',X'→Y都不成立,則稱X→Y是一個完全函數依賴,即Y完全函數依賴于X。記作:XY。3.2函數依賴在R(U)中,如果X→Y,并且對于X的任何一個真子集X',X'→Y都成立,則稱X→Y是一個部分函數依賴,即Y部分函數依賴于X。記作:XY。在R(U)中,如果存在非平凡函數依賴X→Y,Y→Z,而Y不能函數決定X,則稱Z對X傳遞函數依賴。記作XZ。3.2函數依賴設R(U)是屬性集U上的關系模式。X,Y,Z是U的子集,并且Z=U–X–Y。對R(U)的任一關系r,若給定一對(x,z)的值存在一組Y的值,且這組值僅僅決定于x值而與z值無關,則稱Y多值依賴于X。記作:X→→Y。若X→→Y,若Z為空,則稱X→→Y為平凡的多值依賴;若Z非空,則稱X→→Y為非平凡的多值依賴。3.2函數依賴設K為R〈U〉中的屬性或屬性組合,若KU,則稱K為R的候選關鍵字。若R(U)中存在一個以上的候選關鍵字,則可選定其中一個作為主關鍵字。如果關系R的某一屬性組X不是該關系本身的候選關鍵字,而是另一關系的候選關鍵字,則稱該屬性組X是R的外部關鍵字,也稱外鍵。3.2函數依賴對關系模式R中的任一個關系r,如果每個屬性值都是不可分解的,則稱R是第一范式的關系。記為R∈1NF。在關系模式R中,若任一非主屬性都完全函數依賴于任意一個候選關鍵字,則稱關系R是屬于第二范式的。記為則R∈2NF3.3規范化和范式
在關系模式R中,若任一非主屬性都不傳遞依賴于任何候選關鍵字,則稱關系R是屬于第三范式的。記為R∈3NF。在關系模式R中,如果R中的所有屬性都不傳遞依賴于R的任何候選關鍵字,則稱關系R是Boyde–Codd范式,簡記為BCNF。記為R∈BCNF。3.3規范化和范式
在關系模式R中,如果存在的每個非平凡多值依賴X→→Y中,X都含有主關鍵字,則稱R是屬于第四范式的。記為R∈4NF。3.3規范化和范式
數據庫設計就是在給定的DBMS、操作系統和硬件環境下,如何表達用戶的需求,并將其轉換為有效的數據庫結構,構成較好的數據庫模式。數據庫設計的具體內容是根據一個單位的信息需求、處理需求和數據庫的支撐環境,設計其數據模式以及典型的應用程序。其中信息需求表示一個單位所需要的數據及其結構。處理需求表示一個單位需要經常進行的數據處理。3.4數據庫設計
常用的數據庫設計方法:(1)基于E–R模型的數據庫設計方法
(2)基于第三范式的數據庫設計方法
(3)新奧爾良方法3.4數據庫設計
數據庫設計步驟:(1)系統需求分析(2)概念結構設計(3)邏輯結構設計(4)數據庫物理設計(5)數據庫實施(6)數據庫運行維護3.4數據庫設計
第4章電子商務與數據庫技術
本章的重要概念電子商務、EDI、數據倉庫、聯機分析、數據挖掘、關系數據庫、網狀數據庫、層次數據庫、MOLAP、ROLAP、HOLAP
本章的重要知識點(1)電子商務的概念,特性,結構及發展概況(2)數據資源管理技術的發展歷程(3)數據庫技術的發展歷程(4)關系模型的特點(5)數據倉庫的概念、特點、體系結構、關鍵技術及構件數據倉庫的步驟(6)聯機分析的概念、特點、體系結構、關鍵技術及分類(7)數據挖掘的概念、流程及關鍵技術(8)數數據倉庫、數據挖掘及聯機分析之間的關系(9)Web數據挖掘的基本內涵
4.1電子商務概述
電子商務(ElectronicCommerce,簡稱EC)是運用計算機技術、網絡通訊技術、自動控制技術、數據庫技術和多媒體技術等,借助Internet進行聯系,有效地組織商務貿易活動,實現整個交易過程的電子化。電子商務具有如下特性:①普遍性②方便性
③整體性
④安全性
⑤協調性
4.1電子商務概述
電子商務系統的組成
從總體上來看,電子商務系統是由應用層結構和支持應用實現的基礎結構兩層構成。其中基礎結構包括三個層次和兩個支柱。三個層次自下而上分別為網絡層、多媒體消息/信息發布和傳輸層、一般業務服務層;兩個支柱分別是技術標準和政策、法規。三個層次之上是各種特定的電子商務應用,可見三個基礎層次和兩個支柱是電子商務應用的條件。
4.1電子商務概述
電子商務的產生與發展
①電報、電話、傳真和電視②EDI傳統的EDI基于Internet的EDI
4.1電子商務概述
應用于電子商務中的數據庫技術主要有:(1)用于數據的收集、存儲和組織的數據資源管理技術(2)決策支持技術(3)Web數據庫技術
4.2電子商務中的數據庫技術
數據資源管理技術是指對數據的分類、組織、編碼、存儲、檢索和維護的技術。數據資源管理技術經歷如下三個階段:(1)人工管理階段(2)文件系統階段(3)數據庫系統階段
4.2.1數據資源管理技術
人工管理階段
二十世紀五十年代中期以前這一時期數據管理的特點是:(1)數據不保存(2)通過程序管理數據
(3)數據不共享(4)數據不具有獨立性
4.2.1數據資源管理技術
文件系統階段
自二十世紀五十年代后期到六十年代中期
這一時期數據管理的特點是:(1)數據可以長期保存
(2)文件系統管理數據
(3)數據共享性差、冗余度大
(4)數據獨立性差
4.2.1數據資源管理技術
數據庫系統階段自二十世紀六十年代后期以來數據庫系統具有如下特點:(1)數據結構化
(2)實現數據共享(3)具有較高的數據獨立性
(4)數據由DBMS統一管理和控制
(5)數據庫系統向用戶提供高級的接口(6)加強了對數據的保護
4.2.1數據資源管理技術
自二十世紀六十年代后期至今,數據庫技術可以劃分為三個階段:第一代的網狀、層次數據庫系統;第二代的關系數據庫系統;第三代的以面向對象模型為主要特征的數據庫系統。4.2.2數據庫技術
第一代數據庫系統–網狀、層次數據庫系統
網狀模型中以記錄為數據的存儲單位。記錄包含若干數據項。網狀數據庫的數據項可以是多值的和復合的數據。每個記錄有一個惟一標識他的內部標識符,他在一個記錄存入數據庫時由DBMS自動賦予。該內部標識符可以看作記錄的邏輯地址,可用于尋找記錄。網狀數據庫是導航式數據庫,用戶在操作數據庫時不但說明要做什么,還要說明怎么做。
4.2.2數據庫技術
層次數據庫是按記錄來存取數據的。層次數據模型中最基本的數據關系是基本層次關系,他代表兩個記錄型之間一對多的關系,也叫做雙親子女關系。數據庫中有且僅有一個記錄型無雙親,稱為根節點。其他記錄型有且僅有一個雙親。在層次模型中從一個節點到其雙親的映射是惟一的,所以對除根節點外的每一個記錄型只需要指出他的雙親,就可以表示出層次模型的整體結構。4.2.2數據庫技術
這兩種數據庫具有如下共同特點:
(1)支持三級模式的體系結構
(2)用存取路徑來表示數據之間的聯系
(3)有獨立的數據定義語言
(4)導航式的數據操縱語言
4.2.2數據庫技術
第二代數據庫系統–關系數據庫系統
1970年IBM公司SanJose研究實驗室的研究員E.F.Codd博士在總結層次、網狀數據庫優缺點的基礎上,發表了題為《大型共享數據庫的關系模型》論文,提出了關系數據模型的概念
4.2.2數據庫技術
關系數據模型由以下三部分組成:
(1)數據結構
(2)關系操作
(3)數據完整性
4.2.2數據庫技術
關系模型具有如下特點:
(1)關系模型的概念單一,實體以及實體之間的聯系都用關系來表示;
(2)以關系代數為基礎,形式化基礎好;
(3)數據獨立性強,數據的物理存儲和存取路徑對用戶隱蔽;
(4)關系數據庫語言是非過程化的,這樣可以將用戶從編程數據庫記錄的導航式檢索中解脫出來,大大減小用戶編程的難度。
4.2.2數據庫技術
第三代數據庫系統概念第三代數據庫的主要特征:(1)支持數據管理、對象管理和知識管理;(2)保持和繼承了第二代數據庫系統的技術;(3)對其他系統開放,支持數據庫語言標準,支持標準網絡協議,有良好的可移植性、可連接性、可擴展性和互操作性等。(4)支持多種數據模型4.2.2數據庫技術
數據倉庫數據倉庫是一個面向主題的(SubjectOriented)、集成的(Integrate)、相對穩定的(Non-Volatile)、反映歷史變化(TimeVariant)的數據集合,用于支持管理決策。4.2.3決策支持技術
數據倉庫的特點:
①數據倉庫是面向主題的 ②數據倉庫是集成的 ③數據倉庫是穩定的 ④反映歷史變化的4.2.3決策支持技術
數據倉庫的體系結構4.2.3決策支持技術
抽取清理裝載刷新數據集市數據倉庫
圖4–4數據倉庫系統體系結構OLAP服務器OLAP服務器前端工具分析工具服務數據源數據倉庫的關鍵技術 ①數據抽取 ②存儲和管理 ③數據展現4.2.3決策支持技術
創建數據倉庫的步驟 ①業務需求分析 ②數據倉庫設計 ③數據抽取模塊 ④數據倉庫的維護模塊4.2.3決策支持技術
聯機分析所謂OLAP是使分析人員、管理人員或執行人員能夠從多種角度對從原始數據中轉化出來的、能夠真正為用戶所理解的、并真實反映企業特性的信息進行快速、一致、交互地存取,從而獲得對數據的更深入了解的一類軟件技術。
4.2.3決策支持技術
在OLAP中,常涉及到的術語有: ①維 ②維的層次 ③維的成員 ④多維數組 ⑤度量(單元格)4.2.3決策支持技術
OLAP多維數據結構主要有: ①超立方結構 ②多立方結構OLAP的特點
①快速性(Fast)
②可分析性(Analysis)
③多維性(Multidimentional)
④共享性(Shared) ⑤信息性(Information)
4.2.3決策支持技術
OLAP分析
①切片和切塊
②鉆取
③旋轉/轉軸
OLAP系統的體系結構和分類 ①MOLAP
②ROLAP ③HOLAP
4.2.3決策支持技術
數據挖掘數據挖掘就是從大型數據庫的數據中提取人們感興趣的知識。這些知識是隱含的、事先未知的、潛在有用信息,提取的知識表示為概念、規則、規律、模式等形式。
4.2.3決策支持技術
數據挖掘的流程
①確定業務對象
②數據準備
③數據挖掘
④結果分析
⑤知識的同化
4.2.3決策支持技術
數據挖掘常用技術
①神經網絡方法
②遺傳算法
③決策樹方法
④粗集方法
4.2.3決策支持技術
數據倉庫、OLAP與數據挖掘之間的關系
一方面,OLAP技術可以為數據挖掘提供預期的挖掘對象和目標,避免挖掘的盲目性。另一方面,數據挖掘技術可以使聯機分析處理智能化,減少分析人員手工操作的繁雜性,減輕分析人員的負擔。
4.2.3決策支持技術
第5章Web數據庫技術
本章的重要概念Web、Web瀏覽器、Web服務器、URL、HTTP、HTML、Web數據庫、JDBC、ODBC
本章的重要知識點(1)ODBC的概念、設計思想及其體系結構(2)JDBC的概念、設計目標及其體系結構(3)客戶/服務器的數據庫系統的缺點(4)Web數據庫的概念及其技術特點(5)Web數據應用系統的結構、優點和開發方法
5.1Web概述Web的發展歷史
(1)1945年,VannevarBush提出超文本的雛型(2)1989年3月,CERN的科學家TimBernersLee,在他寫的一個關于信息管理的項目建議書中首次提出了Web概念
(3)1990年11月,第一個Web軟件在計算機上實現。(4)1992年,CERN正式向全世界宣布Web誕生。(5)1993年,美國NCSA的MarcAndreesen及其合作者發布了稱為Mosaic的瀏覽器
5.1Web概述Web的主要特點:(1)使用戶可在全世界范圍內查詢、瀏覽最新信息(2)支持超文本和超媒體信息服務(3)使用瀏覽器作為統一的用戶接口,直觀方便(4)可以將Web站點相互鏈接,以提供信息查找和漫游訪問服務(5)能使用戶與信息發布者或其他用戶相互交流信息5.1Web概述
Web基本元素
①Web瀏覽器
②Web服務器
③統一資源定位符
④超文本傳輸協議
⑤超文本標記語言5.2計算模型的演變
客戶/服務器計算模型
面向Web的計算模型
從技術角度講,Web數據庫系統也是一種客戶機/服務器體系機構,在這個結構中,充當服務器的就是Web服務器軟件,而計算機上運行的Web瀏覽器就是對服務器發出請求的客戶機程序,當Web務器接收到Web瀏覽器的請求并進行有關處理后,將請求的數據發送到Web瀏覽器,瀏覽器對接收到的數據進行解釋并在屏幕上顯示出來。實際上這是一個請求–應答的過程。
5.3Web數據庫
Web數據庫就是以后臺數據庫為基礎的,加上一定的前臺程序,通過瀏覽器完成數據存儲、查詢等操作的系統。
Web數據庫的特點
(1)利用現成的瀏覽器軟件,無需開發數據庫前端軟件,能使廣大用戶很方便地訪問數據庫信息。
(2)支持交叉平臺。
(3)能管理網上復雜的文檔型和多媒體型數據資源。(4)使用Web數據庫可以快速地查到他們需要的東西。5.3Web數據庫Web數據庫應用系統結構數據操作客戶機數據庫服務器Web服務器
圖5–1
Web數據庫應用系統結構HTML代碼Internet服務查詢結果5.3Web數據庫開發Web數據庫應用系統的步驟安裝Web服務器創建數據庫設置數據庫驅動程序設計網頁通過瀏覽器瀏覽圖5–2開發Web應用系統的步驟5.4Web數據訪問技術
訪問Web數據庫的原理
在客戶端安裝Web瀏覽器,作為用戶輸入查詢條件和顯示查詢結果的交互界面。用戶可以通過填寫表格或輸入關鍵字的方式來與Web服務器進行交互,當用戶單擊表格上的按鈕時,表格中的數據便發送到Web服務器。Web服務器介于Web瀏覽器與數據庫服務器之間,負責用戶輸入信息的接收。服務器將數據傳送至要被處理的腳本或應用程序,并在數據庫中查詢數據或將數據投遞到數據庫中。最后,服務器將返回結果插入到HTML頁面,傳送至客戶端以響應用戶。
5.4Web數據訪問技術
訪問Web數據庫的方法
(1)利用中間件技術在兩者之間建立連接和通信,如CGI(通用網關接口)和API(應用程序編程接口)(2)由瀏覽器中的Java小應用程序通過瀏覽器訪問Web服務器上的數據庫5.4Web數據訪問技術
ODBC
1991年11月,微軟宣布了ODBC,次年推出可用版本。1992年2月,推出了ODBCSDK2.0版。ODBC基于SAG的SQLCAE草案所規定的語法,共分為Core、Level1、Level2三種定義。
5.4Web數據訪問技術
ODBC的基本思想
ODBC的基本思想是為用戶提供簡單、標準、透明的數據庫連接的公共編程接口,開發廠商根據ODBC的標準去實現底層的驅動程序,這個驅動對用戶是透明的,并允許根據不同的DBMS采用不同的技術加以優化實現,這就利于不斷吸收新的技術而使驅動程序的實現更完善。
5.4Web數據訪問技術
ODBC的體系結構數據源名應用程序ODBC管理器ODBCAPI驅動程序管理器ODBC驅動程序數據源數據層驅動層應用層圖5–3ODBC的四層體系結構管理層5.4Web數據訪問技術
JDBCJDBC是用于執行SQL語句的Java應用程序接口,由一組用Java語言編寫的類和接口組成。
JDBC是一種規范,其宗旨是讓各數據庫開發商為Java程序員提供標準的數據庫訪問類和接口。
JDBC是利用JDBC–ODBC橋通過ODBC來訪問數據庫的。5.4Web數據訪問技術
JDBC的設計目標
JDBC的設計目標是為建立數據庫連接從Java內部填補一個調用級SQLAPI的空白,因此其核心在于執行SQL語句,然后接收其結果。5.4Web數據訪問技術
JDBC體系結構
應用程序JDBCAPI驅動程序管理器JDBC驅動程序數據庫圖5–4JDBC的體系結構第6章關系數據庫設計簡介本章的重要知識點(1)關系數據庫管理系統的發展的三個階段(2)Oracle的技術特點及其數據倉庫的解決方案(3)Informix的技術特點及其數據倉庫的解決方案(4)SQLServer的技術特點及其數據倉庫的解決方案
6.1數據庫管理系統概述關系數據庫管理系統的發展可以粗略地分為如下三個階段。
(1)第一階段從七十年代初E.F.Codd提出關系模型后,開始的對關系數據庫的理論研究和原型開發時代
(2)第二階段是從七十年代后期開始,關系數據庫系統的實用階段
(3)第三階段是從八十年代以來,關系數據庫成為發展的主流,幾乎所有新推出的數據
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025年機構策劃定制旅游服務協議范例
- 2025年工業項目拆除補償協議規范
- 鄉村教師教育能力提升的具體措施
- 公共文化服務體系的創新與實踐
- 跨界合作助推工業園區創新發展
- 2025年學生視力保護:課間操與眼保健操實施標準
- 2025年歐幾里得競賽解析幾何專項突破模擬試卷(坐標與向量)-精講精練版
- 2025年鄉村醫生考試必看:農村醫療衛生機構管理醫療質量管理與持續改進案例分析試題
- 非遺保護中的活態傳承策略
- 咖啡文化與制作(第二版)課件全套 01-咖啡的發現傳播經濟規模與發展-09-咖啡與健康
- 浙江省學軍、鎮海等名校2025屆高三(最后沖刺)歷史試卷含解析
- 四年級下冊科學教學設計-3.5《巖石、沙和黏土》教科版(含活動手冊)
- 電工測量基本知識課件
- GB/T 4354-2025優質碳素鋼熱軋盤條
- 2025至2030中國船舶舾裝行業發展潛力評估及市場趨勢研究報告
- 2024-2025學年人教版(2024)初中英語七年級下冊(全冊)知識點歸納
- 加油賒欠合同標準文本
- 水井打井施工中的技術難點與解決措施
- 水果配送合同協議
- 家庭醫生簽約基本服務包清單(試行)2025
- 2025年山東魯華龍心生物科技股份有限公司招聘筆試參考題庫含答案解析
評論
0/150
提交評論