非常實用的數據結構知識點總結_第1頁
非常實用的數據結構知識點總結_第2頁
非常實用的數據結構知識點總結_第3頁
非常實用的數據結構知識點總結_第4頁
非常實用的數據結構知識點總結_第5頁
已閱讀5頁,還剩25頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

數據結構學問點概括第一章概論數據就是指能夠被計算機識別、存儲和加工處理的信息的載體。數據元素是數據的基本單位,可以由若干個數據項組成。數據項是具有獨立含義的最小標識單位。數據結構的定義:·邏輯結構:從邏輯結構上描述數據,獨立于計算機?!ぞ€性結構:一對一關系?!ぞ€性結構:多對多關系?!ご鎯Y構:是邏輯結構用計算機語言的實現(xiàn)?!ひ来未鎯Y構:如數組?!ゆ準酱鎯Y構:如鏈表。·索引存儲結構:·稠密索引:每個結點都有索引項?!は∈杷饕好拷M結點都有索引項?!ど⒘写鎯Y構:如散列表?!祿\算?!祿牟僮?。定義在邏輯結構上,每種邏輯結構都有一個運算集合?!こS玫挠校簷z索、插入、刪除、更新、排序。數據類型:是一個值的集合以及在這些值上定義的一組操作的總稱?!そY構類型:由用戶借助于描述機制定義,是導出類型。抽象數據類型ADT:·是抽象數據的組織和及之的操作。相當于在概念層上描述問題。·優(yōu)點是將數據和操作封裝在一起實現(xiàn)了信息隱藏。程序設計的實質是對實際問題選擇一種好的數據結構,設計一個好的算法。算法取決于數據結構。算法是一個良定義的計算過程,以一個或多個值輸入,并以一個或多個值輸出。評價算法的好壞的因素:·算法是正確的;·執(zhí)行算法的時間;·執(zhí)行算法的存儲空間(主要是協(xié)助存儲空間);·算法易于理解、編碼、調試。時間困難度:是某個算法的時間耗費,它是該算法所求解問題規(guī)模n的函數。漸近時間困難度:是指當問題規(guī)模趨向無窮大時,該算法時間困難度的數量級。評價一個算法的時間性能時,主要標準就是算法的漸近時間困難度。算法中語句的頻度不僅及問題規(guī)模有關,還及輸入實例中各元素的取值相關。時間困難度按數量級遞增排列依次為:常數階O(1)、對數階O(log2n)、線性階O(n)、線性對數階O(nlog2n)、平方階O(n^2)、立方階O(n^3)、……k次方階O(n^k)、指數階O(2^n)。空間困難度:是某個算法的空間耗費,它是該算法所求解問題規(guī)模n的函數。算法的時間困難度和空間困難度合稱算法困難度。其次章線性表線性表是由n≥0個數據元素組成的有限序列。n=0是空表;非空表,只能有一個起先結點,有且只能有一個終端結點。線性表上定義的基本運算:·構造空表:Initlist(L)·求表長:Listlength(L)·取結點:GetNode(L,i)·查找:LocateNode(L,x)·插入:InsertList(L,x,i)·刪除:Delete(L,i)依次表是按線性表的邏輯結構次序依次存放在一組地址連續(xù)的存儲單元中。在存儲單元中的各元素的物理位置和邏輯結構中各結點相鄰關系是一樣的。地址計算:LOCa(i)=LOCa(1)+(i-1)*d;(首地址為1)在依次表中實現(xiàn)的基本運算:·插入:平均移動結點次數為n/2;平均時間困難度均為O(n)?!h除:平均移動結點次數為(n-1)/2;平均時間困難度均為O(n)。線性表的鏈式存儲結構中結點的邏輯次序和物理次序不肯定相同,為了能正確表示結點間的邏輯關系,在存儲每個結點值的同時,還存儲了其后繼結點的地址信息(即指針或鏈)。這兩部分信息組成鏈表中的結點結構。一個單鏈表由頭指針的名字來命名。單鏈表運算:·建立單鏈表·頭插法:s->next=head;head=s;生成的依次及輸入依次相反。平均時間困難度均為O(n)?!の膊宸ǎ篽ead=rear=null;if(head=null)head=s;elser->next=s;r=s;平均時間困難度均為O(n)·加頭結點的算法:對起先結點的操作無需特別處理,統(tǒng)一了空表和非空表。·查找·按序號:及查找位置有關,平均時間困難度均為O(n)?!ぐ粗担杭拜斎雽嵗嘘P,平均時間困難度均為O(n)?!げ迦脒\算:p=GetNode(L,i-1);s->next=p->next;p->next=s;平均時間困難度均為O(n)·刪除運算:p=GetNode(L,i-1);r=p->next;p->next=r->next;free(r);平均時間困難度均為O(n)單循環(huán)鏈表是一種首尾相接的單鏈表,終端結點的指針域指向起先結點或頭結點。鏈表終止條件是以指針等于頭指針或尾指針。采納單循環(huán)鏈表在好用中多采納尾指針表示單循環(huán)鏈表。優(yōu)點是查找頭指針和尾指針的時間都是O(1),不用遍歷整個鏈表。雙鏈表就是雙向鏈表,就是在單鏈表的每個結點里再增加一個指向其干脆前趨的指針域prior,形成兩條不同方向的鏈。由頭指針head惟一確定。雙鏈表也可以頭尾相鏈接構成雙(向)循環(huán)鏈表。雙鏈表上的插入和刪除時間困難度均為O(1)。依次表和鏈表的比較:·基于空間:·依次表的存儲空間是靜態(tài)安排,存儲密度為1;適于線性表事先確定其大小時采納?!ゆ湵淼拇鎯臻g是動態(tài)安排,存儲密度<1;適于線性表長度變更大時采納?!せ跁r間:·依次表是隨機存儲結構,當線性表的操作主要是查找時,宜采納?!ひ圆迦牒蛣h除操作為主的線性表宜采納鏈表做存儲結構?!と舨迦牒蛣h除主要發(fā)生在表的首尾兩端,則宜采納尾指針表示的單循環(huán)鏈表。第三章棧和隊列棧(Stack)是僅限制在表的一端進行插入和刪除運算的線性表,稱插入、刪除這一端為棧頂,另一端稱為棧底。表中無元素時為空棧。棧的修改是按后進先出的原則進行的,我們又稱棧為LIFO表(LastInFirstOut)。通常棧有依次棧和鏈棧兩種存儲結構。棧的基本運算有六種:·構造空棧:InitStack(S)·判??眨篠tackEmpty(S)·判棧滿:StackFull(S)·進棧:Push(S,x)·退棧:Pop(S)·取棧頂元素:StackTop(S)在依次棧中有“上溢”和“下溢”的現(xiàn)象?!ぁ吧弦纭笔菞m斨羔樦赋鰲5耐饷媸浅鲥e狀態(tài)?!ぁ跋乱纭笨梢员硎緱榭諚?,因此用來作為限制轉移的條件。依次棧中的基本操作有六種:·構造空棧·判??铡づ袟M·進棧·退棧·取棧頂元素鏈棧則沒有上溢的限制,因此進棧不要判棧滿。鏈棧不須要在頭部附加頭結點,只要有鏈表的頭指針就可以了。鏈棧中的基本操作有五種:·構造空棧·判??铡みM?!ね藯!とm斣仃犃校≦ueue)是一種運算受限的線性表,插入在表的一端進行,而刪除在表的另一端進行,允許刪除的一端稱為隊頭(front),允許插入的一端稱為隊尾(rear),隊列的操作原則是先進先出的,又稱作FIFO表(FirstInFirstOut).隊列也有依次存儲和鏈式存儲兩種存儲結構。隊列的基本運算有六種:·置空隊:InitQueue(Q)·判隊空:QueueEmpty(Q)·判隊滿:QueueFull(Q)·入隊:EnQueue(Q,x)·出隊:DeQueue(Q)·取隊頭元素:QueueFront(Q)依次隊列的“假上溢”現(xiàn)象:由于頭尾指針不斷前移,超出向量空間。這時整個向量空間及隊列是空的卻產生了“上溢”現(xiàn)象。為了克服“假上溢”現(xiàn)象引入循環(huán)向量的概念,是把向量空間形成一個頭尾相接的環(huán)形,這時隊列稱循環(huán)隊列。判定循環(huán)隊列是空還是滿,方法有三種:·一種是另設一個布爾變量來推斷;·其次種是少用一個元素空間,入隊時先測試((rear+1)%m=front)?滿:空;·第三種就是用一個計數器記錄隊列中的元素的總數。隊列的鏈式存儲結構稱為鏈隊列,一個鏈隊列就是一個操作受限的單鏈表。為了便于在表尾進行插入(入隊)的操作,在表尾增加一個尾指針,一個鏈隊列就由一個頭指針和一個尾指針唯一地確定。鏈隊列不存在隊滿和上溢的問題。在鏈隊列的出隊算法中,要留意當原隊中只有一個結點時,出隊后要同進修改頭尾指針并使隊列變空。第四章串串是零個或多個字符組成的有限序列?!た沾菏侵搁L度為零的串,也就是串中不包含任何字符(結點)?!た瞻状褐复邪粋€或多個空格字符的串?!ぴ谝粋€串中隨意個連續(xù)字符組成的子序列稱為該串的子串,包含子串的串就稱為主串?!ぷ哟谥鞔械男蛱柧褪侵缸哟谥鞔惺状纬霈F(xiàn)的位置?!た沾请S意串的子串,隨意串是自身的子串。串分為兩種:·串常量在程序中只能引用不能變更;·串變量的值可以變更。串的基本運算有:·求串長strlen(char*s)·串復制strcpy(char*to,char*from)·串聯(lián)接strcat(char*to,char*from)·串比較charcmp(char*s1,char*s2)·字符定位strchr(char*s,charc)串是特別的線性表(結點是字符),所以串的存儲結構及線性表的存儲結構類似。串的依次存儲結構簡稱為依次串。依次串又可按存儲安排的不同分為:·靜態(tài)存儲安排:干脆用定長的字符數組來定義。優(yōu)點是涉及串長的操作速度快,但不適合插入、鏈接操作?!討B(tài)存儲安排:是在定義串時不安排存儲空間,須要運用時按所需串的長度安排存儲單元。串的鏈式存儲就是用單鏈表的方式存儲串值,串的這種鏈式存儲結構簡稱為鏈串。鏈串及單鏈表的差異只是它的結點數據域為單個字符。為了解決“存儲密度”低的狀況,可以讓一個結點存儲多個字符,即結點的大小。依次串上子串定位的運算:又稱串的“模式匹配”或“串匹配”,是在主串中查找出子串出現(xiàn)的位置。在串匹配中,將主串稱為目標(串),子串稱為模式(串)。這是比較簡潔理解的,串匹配問題就是找出給定模式串P在給定目標串T中首次出現(xiàn)的有效位移或者是全部有效位移。最壞的狀況下時間困難度是O((n-m+1)m),假如m及n同階的話則它是O(n^2)。鏈串上的子串定位運算位移是結點地址而不是整數第五章多維數組數組一般用依次存儲的方式表示。存儲的方式有:·行優(yōu)先依次,也就是把數組逐行依次排列。PASCAL、C·列優(yōu)先依次,就是把數組逐列依次排列。FORTRAN地址的計算方法:·按行優(yōu)先依次排列的數組:LOCa(ij)=LOCa(11)+((i-1)*n+(j-1))*d.·按列優(yōu)先依次排列的數組:LOCa(ij)=LOCa(11)+((j-1)*n+(i-1))*d.矩陣的壓縮存儲:為多個相同的非零元素安排一個存儲空間;對零元素不安排空間。特別矩陣的概念:所謂特別矩陣是指非零元素或零元素分布有肯定規(guī)律的矩陣。稀疏矩陣的概念:一個矩陣中若其非零元素的個數遠遠小于零元素的個數,則該矩陣稱為稀疏矩陣。特別矩陣的類型:·對稱矩陣:滿意a(ij)=a(ji)。元素總數n(n+1)/2.I=max(i,j),J=min(i,j),LOCa(ij)=LOC(sa[0])+(I*(I+1)/2+J)*d.·三角矩陣:·上三角陣:k=i*(2n-i+1)/2+j-i,LOCa(ij)=LOC(sa[0])+k*d.·下三角陣:k=i*(i+1)/2+j,LOCa(ij)=LOC(sa[0])+k*d.·對角矩陣:k=2i+j,LOCa(ij)=LOC(sa[0])+k*d.稀疏矩陣的壓縮存儲方式用三元組表把非零元素的值和它所在的行號列號做為一個結點存放在一起,用這些結點組成的一個線性表來表示。但這種壓縮存儲方式將失去隨機存儲功能。加入行表記錄每行的非零元素在三元組表中的起始位置,即帶行表的三元組表。第六章樹樹是n個結點的有限集合,非空時必需滿意:只有一個稱為根的結點;其余結點形成m個不相交的子集,并稱根的子樹。根是起先結點;結點的子樹數稱度;度為0的結點稱葉子(終端結點);度不為0的結點稱分支結點(非終端結點);除根外的分支結點稱內部結點;有序樹是子樹有左,右之分的樹;無序樹是子樹沒有左,右之分的樹;森林是m個互不相交的樹的集合;樹的四種不同表示方法:·樹形表示法;·嵌套集合表示法;·凹入表示法·廣義表表示法。二叉樹的定義:是n≥0個結點的有限集,它是空集(n=0)或由一個根結點及兩棵互不相交的分別稱作這個根的左子樹和右子樹的二叉樹組成。二叉樹不是樹的特別情形,及度數為2的有序樹不同。二叉樹的4個重要性質:·二叉樹上第i層上的結點數目最多為2^(i-1)(i≥1)。;·深度為k的二叉樹至多有(2^k)-1個結點(k≥1);·在隨意一棵二叉樹中,若終端結點的個數為n0,度為2的結點數為n2,則n0=n2+1;·具有n個結點的完全二叉樹的深度為int(log2n)+1.滿二叉樹是一棵深度為k,結點數為(2^k)-1的二叉樹;完全二叉樹是滿二叉樹在最下層自右向左去處部分結點;二叉樹的依次存儲結構就是把二叉樹的全部結點依據層次依次存儲到連續(xù)的存儲單元中。(存儲前先將其畫成完全二叉樹)樹的存儲結構多用的是鏈式存儲。BinTNode的結構為lchild|data|rchild,把全部BinTNode類型的結點,加上一個指向根結點的BinTree型頭指針就構成了二叉樹的鏈式存儲結構,稱為二叉鏈表。它就是由根指針root唯一確定的。共有2n個指針域,n+1個空指針。依據訪問結點的次序不同可得三種遍歷:先序遍歷(前序遍歷或先根遍歷),中序遍歷(或中根遍歷)、后序遍歷(或后根遍歷)。時間困難度為O(n)。利用二叉鏈表中的n+1個空指針域來存放指向某種遍歷次序下的前趨結點和后繼結點的指針,這些附加的指針就稱為“線索”,加上線索的二叉鏈表就稱為線索鏈表。線索使得查找中序前趨和中序后繼變得簡潔有效,但對于查找指定結點的前序前趨和后序后繼并沒有什么作用。樹和森林及二叉樹的轉換是唯一對應的。轉換方法:·樹變二叉樹:兄弟相連,保留長子的連線。·二叉樹變樹:結點的右孩子及其雙親連?!ど肿兌鏄洌簶渥兌鏄?,各個樹的根相連。樹的存儲結構:·有雙親鏈表表示法:結點data|parent,對于求指定結點的雙親或祖先非常便利,但不適于求指定結點的孩子及后代。·孩子鏈表表示法:為樹中每個結點data|next設置一個孩子鏈表firstchild,并將data|firstchild存放在一個向量中。·雙親孩子鏈表表示法:將雙親鏈表和孩子鏈表結合。·孩子兄弟鏈表表示法:結點結構leftmostchild|data|rightsibing,附加兩個分別指向該結點的最左孩子和右鄰兄弟的指針域。樹的前序遍歷及相對應的二叉樹的前序遍歷一樣;樹的后序遍歷及相對應的二叉樹的中序遍歷一樣。樹的帶權路徑長度是樹中全部葉結點的帶權路徑長度之和。樹的帶權路徑長度最小的二叉樹就稱為最優(yōu)二叉樹(即哈夫曼樹)。在葉子的權值相同的二叉樹中,完全二叉樹的路徑長度最短。哈夫曼樹有n個葉結點,共有2n-1個結點,沒有度為1的結點,這類樹又稱為嚴格二叉樹。變長編碼技術可以使頻度高的字符編碼短,而頻度低的字符編碼長,但是變長編碼可能使解碼產生二義性。如00、01、0001這三個碼無法在解碼時確定是哪一個,所以要求在字符編碼時任一字符的編碼都不是其他字符編碼的前綴,這種碼稱為前綴碼(其實是非前綴碼)。哈夫曼樹的應用最廣泛地是在編碼技術上,它能夠簡潔地求出給定字符集及其概率分布的最優(yōu)前綴碼。哈夫曼編碼的構造很簡潔,只要畫好了哈夫曼樹,按分支狀況在左路徑上寫代碼0,右路徑上寫代碼1,然后從上到下到葉結點的相應路徑上的代碼的序列就是該結點的最優(yōu)前綴碼。第七章圖圖的邏輯結構特征就是其結點(頂點)的前趨和后繼的個數都是沒有限制的,即隨意兩個結點之間之間都可能相關。圖GraphG=(V,E),V是頂點的有窮非空集合,E是頂點偶對的有窮集。有向圖Digraph:每條邊有方向;無向圖Undigraph:每條邊沒有方向。有向完全圖:具有n*(n-1)條邊的有向圖;無向完全圖:具有n*(n-1)/2條邊的無向圖;有根圖:有一個頂點有路徑到達其它頂點的有向圖;簡潔路徑:是經過頂點不同的路徑;簡潔回路是起先和終端重的簡潔路徑;網絡:是帶權的圖。圖的存儲結構:·鄰接矩陣表示法:用一個n階方陣來表示圖的結構是唯一的,適合稠密圖?!o向圖:鄰接矩陣是對稱的?!び邢驁D:行是出度,列是入度。建立鄰接矩陣算法的時間是O(n+n^2+e),其時間困難度為O(n^2)·鄰接表表示法:用頂點表和鄰接表構成不是唯一的,適合稀疏圖?!ろ旤c表結構vertex|firstedge,指針域存放鄰接表頭指針?!む徑颖恚河妙^指針確定。·無向圖稱邊表;·有向圖又分出邊表和逆鄰接表;·鄰接表結點結構為adjvex|next,時間困難度為O(n+e)。,空間困難度為O(n+e)。。圖的遍歷:·深度優(yōu)先遍歷:借助于鄰接矩陣的列。運用棧保存已訪問結點。·廣度優(yōu)先遍歷:借助于鄰接矩陣的行。運用隊列保存已訪問結點。生成樹的定義:若從圖的某個頂點動身,可以系統(tǒng)地訪問到圖中全部頂點,則遍歷時經過的邊和圖的全部頂點構成的子圖稱作該圖的生成樹。最小生成樹:圖的生成樹不唯一,從不同的頂點動身可得到不同的生成樹,把權值最小的生成樹稱為最小生成樹(MST)。構造最小生成樹的算法:·Prim算法的時間困難度為O(n^2)及邊數無關適于稠密圖?!ruskal算法的時間困難度為O(lge),主要取決于邊數,較適合于稀疏圖。最短路徑的算法:·Dijkstra算法,時間困難度為O(n^2)。·類似于prim算法。拓撲排序:是將有向無環(huán)圖G中全部頂點排成一個線性序列,若<u,v>∈E(G),則在線性序列u在v之前,這種線性序列稱為拓撲序列。拓撲排序也有兩種方法:·無前趨的頂點優(yōu)先,每次輸出一個無前趨的結點并刪去此結點及其出邊,最終得到的序列即拓撲序列?!o后繼的結點優(yōu)先:每次輸出一個無后繼的結點并刪去此結點及其入邊,最終得到的序列是逆拓撲序列。第八章排序記錄中可用某一項來標識一個記錄,則稱為關鍵字項,該數據項的值稱為關鍵字。排序是使文件中的記錄按關鍵字遞增(或遞減)次序排列起來?!せ静僮鳎罕容^關鍵字大小;變更指向記錄的指針或移動記錄?!ご鎯Y構:依次結構、鏈表結構、索引結構。經過排序后這些具有相同關鍵字的記錄之間的相對次序保持不變,則稱這種排序方法是穩(wěn)定的,否則排序算法是不穩(wěn)定的。排序過程中不涉及數據的內、外存交換則稱之為“內部排序”(內排序),反之,若存在數據的內外存交換,則稱之為外排序。內部排序方法可分五類:插入排序、選擇排序、交換排序、歸并排序和安排排序。評價排序算法好壞的標準主要有兩條:執(zhí)行時間和所需的協(xié)助空間,另外算法的困難程序也是要考慮的一個因素。插入排序:·干脆插入排序:·逐個向前插入到合適位置。·哨兵(監(jiān)視哨)有兩個作用:·作為臨變量存放R[i]·是在查找循環(huán)中用來監(jiān)視下標變量j是否越界。·干脆插入排序是就地的穩(wěn)定排序。時間困難度為O(n^2),比較次數為(n+2)(n-1)/2;移動次數為(n+4)(n-1)/2;·希爾排序:·等間隔的數據比較并按要求依次排列,最終間隔為1.·希爾排序是就地的不穩(wěn)定排序。時間困難度為O(n^1.25),比較次數為(n^1.25);移動次數為(1.6n^1.25);交換排序:·冒泡排序:·自下向上確定最輕的一個?!ぷ陨舷蛳麓_定最重的一個。·自下向上確定最輕的一個,后自上向下確定最重的一個?!っ芭菖判蚴蔷偷氐姆€(wěn)定排序。時間困難度為O(n^2),比較次數為n(n-1)/2;移動次數為3n(n-1)/2;·快速排序:·以第一個元素為參考基準,設定、動兩個指針,發(fā)生交換后指針交換位置,直到指針重合。重復直到排序完成?!た焖倥判蚴欠蔷偷氐牟环€(wěn)定排序。時間困難度為O(nlog2n),比較次數為n(n-1)/2;選擇排序:·干脆選擇排序:·選擇最小的放在比較區(qū)前?!じ纱噙x擇排序就地的不穩(wěn)定排序。時間困難度為O(n^2)。比較次數為n(n-1)/2;·堆排序

·建堆:按層次將數據填入完全二叉樹,從int(n/2)處向前逐個調整位置?!と缓髮涓白罱K一個葉子交換值并斷開及樹的連接并重建堆,直到全斷開。·堆排序是就地不穩(wěn)定的排序,時間困難度為O(nlog2n),不相宜于記錄數較少的文件。歸并排序:·先兩個一組排序,形成(n+1)/2組,再將兩組并一組,直到剩下一組為止?!w并排序是非就地穩(wěn)定排序,時間困難度是O(nlog2n),安排排序:·箱排序:·按關鍵字的取值范圍確定箱子數,按關鍵字投入箱子,鏈接全部非空箱?!は渑判虻钠骄鶗r間困難度是線性的O(n)?!せ鶖蹬判颍骸牡臀坏礁呶灰来螌﹃P鍵字進行箱排序?!せ鶖蹬判蚴欠蔷头€(wěn)定的排序,時間困難度是O(d*n+d*rd)。各種排序方法的比較和選擇:·待排序的記錄數目n;n較大的要用時間困難度為O(nlog2n)的排序方法;·記錄的大?。ㄒ?guī)模);記錄大最好用鏈表作為存儲結構,而快速排序和堆排序在鏈表上難于實現(xiàn);·關鍵字的結構及其初始狀態(tài);·對穩(wěn)定性的要求;·語言工具的條件;·存儲結構;·時間和協(xié)助空間困難度。第九章查找查找的同時對表做修改操作(如插入或刪除)則相應的表稱之為動態(tài)查找表,否則稱之為靜態(tài)查找表。衡量查找算法效率優(yōu)劣的標準是在查找過程中對關鍵字須要執(zhí)行的平均比較次數(即平均查找長度ASL)。線性表查找的方法:·依次查找:逐個查找,ASL=(n+1)/2;·二分查找:取中點int(n/2)比較,若小就比左區(qū)間,大就比右區(qū)間。用二叉判定樹表示。ASL=(∑(每層結點數*層數))/N.·分塊查找。要求“分塊有序”,將表分成若干塊內部不肯定有序,并抽取各塊中的最大關鍵字及其位置建立有序索引表。二叉排序樹(BST)定義是:二叉排序樹是空樹或者滿意如下性質的二叉樹:·若它的左子樹非空,則左子樹上全部結點的值均小于根結點的值;·若它的右子樹非空,則右子樹上全部結點的值均大于根結點的值;·左、右子樹本身又是一棵二叉排序樹。二叉排序樹的插入、建立、刪除的算法平均時間性能是O(nlog2n)。二叉排序樹的刪除操作可分三種狀況進行處理:·*P是葉子,則干脆刪除*P,即將*P的雙親*parent中指向*P的指針域置空即可。·*P只有一個孩子*child,此時只需將*child和*p的雙親干脆連接就可刪去*p.·*p有兩個孩子,則先將*p結點的中序后繼結點的數據到*p,刪除中序后繼結點。關于B-樹(多路平衡查找樹)。它適合在磁盤等干脆存取設備上組織動態(tài)的查找表,是一種外查找算法。建立的方式是從下向上拱起。散列技術:將結點按其關鍵字的散列地址存儲到散列表的過程稱為散列。散列函數的選擇有兩條標準:簡潔和勻稱。常見的散列函數構的造方法:·平方取中法:hash=int((x^2)%100)·除余法:表長為m,hash=x%m·相乘取整法:hash=int(m*(x*A-int(x*A));A=0.618·隨機數法:hash=random(x)。處理沖突的方法:·開放定址法:·一般形式為hi=(h(key)+di)%m1≤i≤m-1,開放定址法要求散列表的裝填因子α≤1.·開放定址法類型:·線性探查法:address=(hash(x)+i)%m;·二次探查法:address=(hash(x)+i^2)%m;·雙重散列法:address=(hash(x)+i*hash(y))%m;·拉鏈法:·是將全部關鍵字為同義詞的結點鏈接在同一個單鏈表中。·拉鏈法的優(yōu)點:·拉鏈法處理沖突簡潔,且無積累現(xiàn)象;·鏈表上的結點空間是動態(tài)申請的適于無法確定表長的狀況;·拉鏈法中α可以大于1,結點較大時其指針域可忽視,因此節(jié)約空間;·拉鏈法構造的散列表刪除結點易實現(xiàn)?!だ湻ㄒ灿腥秉c:當結點規(guī)模較小時,用拉鏈法中的指針域也要占用額外空間,還是開放定址法省空間。第十章排序10.1排序的基本概念10.2插入排序10.3選擇排序10.4交換排序本章主要學問點:排序的基本概念和衡量排序算法優(yōu)劣的標準,其中衡量標準有算法的時間困難度、空間困難度和穩(wěn)定性干脆插入排序,希爾排序干脆選擇排序,堆排序冒泡排序,快速排序10.1排序的基本概念1.排序是對數據元素序列建立某種有序排列的過程。2.排序的目的:便于查找。3.關鍵字是要排序的數據元素集合中的一個域,排序是以關鍵字為基準進行的。關鍵字分主關鍵字和次關鍵字兩種。對要排序的數據元素集合來說,假如關鍵字滿意數據元素值不同時該關鍵字的值也肯定不同,這樣的關鍵字稱為主關鍵字。不滿意主關鍵字定義的關鍵字稱為次關鍵字。4.排序的種類:分為內部排序和外部排序兩大類。若待排序記錄都在內存中,稱為內部排序;若待排序記錄一部分在內存,一部分在外存,則稱為外部排序。注:外部排序時,要將數據分批調入內存來排序,中間結果還要剛好放入外存,明顯外部排序要困難得多。5.排序算法好壞的衡量標準:(1)時間困難度——它主要是分析記錄關鍵字的比較次數和記錄的移動次數。(2)空間困難度——算法中運用的內存協(xié)助空間的多少。(3)穩(wěn)定性——若兩個記錄A和B的關鍵字值相等,但排序后A、B的先后次序保持不變,則稱這種排序算法是穩(wěn)定的。10.2插入排序插入排序的基本思想是:每步將一個待排序的對象,按其關鍵字大小,插入到前面已經排好序的一組對象的適當位置上,直到對象全部插入為止。簡言之,邊插入邊排序,保證子序列中隨時都是排好序的。常用的插入排序有:干脆插入排序和希爾排序兩種。10.2.1干脆1、其基本思想是:依次地把待排序的數據元素按其關鍵字值的大小插入到已排序數據元素子集合的適當位置。例1:關鍵字序列T=(13,6,3,31,9,27,5,11),請寫出干脆插入排序的中間過程序列。初始關鍵字序列:【13】,6,3,31,9,27,5,11第一次排序:【6,13】,3,31,9,27,5,11其次次排序:【3,6,13】,31,9,27,5,11第三次排序:【3,6,13,31】,9,27,5,11第四次排序:【3,6,9,13,31】,27,5,11第五次排序:【3,6,9,13,27,31】,5,11第六次排序:【3,5,6,9,13,27,31】,11第七次排序:【3,5,6,9,11,13,27,31】注:方括號[]中為已排序記錄的關鍵字,下劃橫線的關鍵字表示它對應的記錄后移一個位置。2.干脆插入排序算法publicstaticvoidinsertSort(int[]a){ inti,j,temp; intn=a.Length; for(i=0;i<n-1;i++){ temp=a[i+1]; j=i; while(j>-1&&temp<a[j]){ a[j+1]=a[j]; j--; } a[j+1]=temp; }}初始關鍵字序列:【13】,6,3,31,9,27,5,11第一次排序:【6,13】,3,31,9,27,5,11其次次排序:【3,6,13】,31,9,27,5,113、干脆插入排序算法分析(1)時間效率:當數據有序時,執(zhí)行效率最好,此時的時間困難度為O(n);當數據基本反序時,執(zhí)行效率最差,此時的時間困難度為O(n2)。所以當數據越接近有序,干脆插入排序算法的性能越好。(2)空間效率:僅占用1個緩沖單元——O(1)(3)算法的穩(wěn)定性:穩(wěn)定希爾(shell)排序(又稱縮小增量排序)1、基本思想:把整個待排序的數據元素分成若干個小組,對同一小組內的數據元素用干脆插入法排序;小組的個數逐次縮小,當完成了全部數據元素都在一個組內的排序后排序過程結束。2、技巧:小組的構成不是簡潔地“逐段分割”,而是將相隔某個增量d的記錄組成一個小組,讓增量d逐趟縮短(例如依次取5,3,1),直到d=1為止。3、優(yōu)點:讓關鍵字值小的元素能很快前移,且序列若基本有序時,再用干脆插入排序處理,時間效率會高許多。例2:設待排序的序列中有12個記錄,它們的關鍵字序列T=(65,34,25,87,12,38,56,46,14,77,92,23),請寫出希爾排序的詳細實現(xiàn)過程。publicstaticvoidshellSort(int[]a,int[]d,intnumOfD){ inti,j,k,m,span; inttemp; intn=a.Length; for(m=0;m<numOfD;m++){ //共numOfD次循環(huán) span=d[m]; //取本次的增量值 for(k=0;k<span;k++){ //共span個小組 for(i=k;i<n-span;i=i+span){ temp=a[i+span]; j=i; while(j>-1&&temp<a[j]){ a[j+span]=a[j]; j=j-span; } a[j+span]=temp; } } }}算法分析:起先時d的值較大,子序列中的對象較少,排序速度較快;隨著排序進展,d值漸漸變小,子序列中對象個數漸漸變多,由于前面工作的基礎,大多數記錄已基本有序,所以排序速度仍舊很快。時間效率:O(n(log2n)2)空間效率:O(1)——因為僅占用1個緩沖單元算法的穩(wěn)定性:不穩(wěn)定練習:1.欲將序列(Q,H,C,Y,P,A,M,S,R,D,F,X)中的關鍵碼按字母升序重排,則初始d為4的希爾排序一趟的結果是?答:原始序列:Q,H,C,Y,P,A,M,S,R,D,F,Xshell一趟后:P,A,C,S,Q,D,F,X,R,H,M,Y2.以關鍵字序列(256,301,751,129,937,863,742,694,076,438)為例,寫出執(zhí)行希爾排序(取d=5,3,1)算法的各趟排序結束時,關鍵字序列的狀態(tài)。解:原始序列:256,301,751,129,937,863,742,694,076,438希爾排序第一趟d=5256301694076438863742751129937其次趟d=3076301129256438694742751863937第三趟d=107612925630143869474275186393710.3選擇排序選擇排序的基本思想是:每次從待排序的數據元素集合中選取關鍵字最?。ɑ蜃畲螅┑臄祿胤诺綌祿丶系淖钋埃ɑ蜃罱K),數據元素集合不斷縮小,當數據元素集合為空時選擇排序結束。常用的選擇排序算法:(1)干脆選擇排序(2)堆排序10.3.1干脆1、其基本思想每經過一趟比較就找出一個最小值,及待排序列最前面的位置互換即可。(即從待排序的數據元素集合中選取關鍵字最小的數據元素并將它及原始數據元素集合中的第一個數據元素交換位置;然后從不包括第一個位置的數據元素集合中選取關鍵字最小的數據元素并將它及原始數據集合中的其次個數據元素交換位置;如此重復,直到數據元素集合中只剩一個數據元素為止。)2、優(yōu)缺點優(yōu)點:實現(xiàn)簡潔缺點:每趟只能確定一個元素,表長為n時須要n-1趟例3:關鍵字序列T=(21,25,49,25*,16,08),請給出干脆選擇排序的詳細實現(xiàn)過程。原始序列:21,25,49,25*,16,08第1趟08,25,49,25*,16,21第2趟08,16,49,25*,25,21第3趟08,16,21,25*,25,49第4趟08,16,21,25*,25,49第5趟08,16,21,25*,25,49publicstaticvoidselectSort(int[]a){ inti,j,small; inttemp; intn=a.Length; for(i=0;i<n-1;i++){ small=i; //設第i個數據元素最小 for(j=i+1;j<n;j++) //找尋最小的數據元素 if(a[j]<a[small])small=j; //記住最小元素的下標 if(small!=i){ //當最小元素的下標不為i時交換位置 temp=a[i]; a[i]=a[small]; a[small]=temp; } }}3、算法分析時間效率:O(n2)——雖移動次數較少,但比較次數仍多??臻g效率:O(1)——沒有附加單元(僅用到1個temp)算法的穩(wěn)定性:不穩(wěn)定4、穩(wěn)定的干脆選擇排序算法例:關鍵字序列T=(21,25,49,25*,16,08),請給出穩(wěn)定的干脆選擇排序的詳細實現(xiàn)過程。原始序列:21,25,49,25*,16,08第1趟08,21,25,49,25*,16第2趟08,16,21,25,49,25*第3趟08,16,21,25,49,25*第4趟08,16,21,25,49,25*第5趟08,16,21,25,25*,49publicstaticvoidselectSort2(int[]a){ inti,j,small; inttemp; intn=a.Length; for(i=0;i<n-1;i++){ small=i; for(j=i+1;j<n;j++){ //找尋最小的數據元素 if(a[j]<a[small])small=j; //記住最小元素的下標 } if(small!=i){ temp=a[small]; for(j=small;j>i;j--)//把該區(qū)段尚未排序元素依次后移 a[j]=a[j-1]; a[i]=temp; //插入找出的最小元素 } }}堆排序1.什么是堆?2.怎樣建堆?3.怎樣堆排序?堆的定義:設有n個數據元素的序列k0,k1,…,kn-1,當且僅當滿意下述關系之一時,稱之為堆。說明:假如讓滿意以上條件的元素序列(k0,k1,…,kn-1)順次排成一棵完全二叉樹,則此樹的特點是:樹中全部結點的值均大于(或小于)其左右孩子,此樹的根結點(即堆頂)必最大(或最小)。例4:有序列T1=(08,25,49,46,58,67)和序列T2=(91,85,76,66,58,67,55),推斷它們是否“堆”?2.怎樣建堆?步驟:從第一個非終端結點起先往前逐步調整,讓每個雙親大于(或小于)子女,直到根結點為止。終端結點(即葉子)沒有任何子女,無需單獨調整例:關鍵字序列T=(21,25,49,25*,16,08),請建最大堆。解:為便于理解,先將原始序列畫成完全二叉樹的形式:這樣可以很清楚地從(n-1-1)/2起先調整。publicstaticvoidcreateHeap(int[]a,intn,inth){ inti,j,flag; inttemp; i=h; j=2*i+1; //j為i結點的左孩子結點的下標 temp=a[i]; flag=0; while(j<n&&flag!=1){ //找尋左右孩子結點中的較大者,j為其下標 if(j<n-1&&a[j]<a[j+1])j++; if(temp>=a[j]) //a[i]>=a[j] flag=1; //標記結束篩選條件 else{ //否則把a[j]上移 a[i]=a[j]; i=j; j=2*i+1; } } a[i]=temp; }利用上述createHeap(a,n,h)函數,初始化創(chuàng)建最大堆的過程就是從第一個非葉子結點a[i]起先,到根結點a[0]為止,循環(huán)調用createHeap(a,n,h)的過程。初始化創(chuàng)建最大堆算法如下:publicstaticvoidinitCreateHeap(int[]a){ intn=a.Length; for(inti=(n-1-1)/2;i>=0;i--) createHeap(a,n,i);}3.怎樣進行整個序列的堆排序?*基于初始堆進行堆排序的算法步驟:堆的第一個對象a[0]具有最大的關鍵碼,將a[0]及a[n-1]對調,把具有最大關鍵碼的對象交換到最終; 再對前面的n-1個對象,運用堆的調整算法,重新建立堆(調整根結點使之滿意最大堆的定義)。結果具有次最大關鍵碼的對象又上浮到堆頂,即a[0]位置; 再對調a[0]和a[n-2],然后對前n-2個對象重新調整,…如此反復,最終得到全部排序好的對象序列。例5:對剛才建好的最大堆進行排序:publicstaticvoidheapSort(int[]a){ inttemp; intn=a.Length; initCreateHeap(a); //初始化創(chuàng)建最大堆 for(inti=n-1;i>0;i--){ //當前最大堆個數每次遞減1 //把堆頂a[0]元素和當前最大堆的最終一個元素交換 temp=a[0]; a[0]=a[i]; a[i]=temp; createHeap(a,i,0); //調整根結點滿意最大堆 }}4、堆排序算法分析:時間效率:O(nlog2n)??臻g效率:O(1)。穩(wěn)定性:不穩(wěn)定。練習1:以下序列是堆的是(){75,65,30,15,25,45,20,10}B.{75,65,45,10,30,25,20,15}C.{75,45,65,30,15,25,20,10}D.{75,45,65,10,25,30,20,15}練習2:有一組數據{15,9,7,8,20,1,7*,4},建成的最小堆為()。A.{1,4,8,9,20,7,15,7*}B.{1,7,15,7*,4,8,20,9}C.{1,4,7,8,20,15,7*,9}D.以上都不對練習3:已知序列{503,87,512,61,908,170,897,275,653,462},寫出采納堆排序對該序列作非遞減排列時的排序過程。排序好的序列為:61,87,170,275,462,503,512,653,897,90810.4交換排序交換排序的基本思想是:利用交換數據元素的位置進行排序的方法。交換排序的主要算法有:1)冒泡排序2)快速排序10.4.11、基本思路:每趟不斷將記錄兩兩比較,并按“前小后大”(或“前大后小”)規(guī)則交換。2、優(yōu)點:每趟結束時,不僅能擠出一個最大值到最終面位置,還能同時部分理順其他元素;一旦下趟沒有交換發(fā)生,還可以提前結束排序。例:關鍵字序列T=(21,25,49,25*,16,08),請按從小到大的依次,寫出冒泡排序的詳細實現(xiàn)過程。初態(tài):21,25,49,25*,16,08第1趟21,25,25*,16,08,49第2趟21,25,16,08,25*,49第3趟21,16,08,25,25*,49第4趟16,08,21,25,25*,49第5趟08,16,21,25,25*,493、冒泡排序算法publicstaticvoidbubbleSort(int[]a){ inti,j,flag=1; inttemp; intn=a.Length; for(i=1;i<n&&flag==1;i++){ flag=0; for(j=0;j<n-i;j++){ if(a[j]>a[j+1]){ flag=1; temp=a[j]; a[j]=a[j+1]; a[j+1]=temp; } } }}4、冒泡排序的算法分析時間效率:O(n2)—因為要考慮最壞狀況(數據元素全部逆序),當然最好狀況是數據元素已全部排好序,此時循環(huán)n-1次,時間困難度為O(n)空間效率:O(1)—只在交換時用到一個緩沖單元穩(wěn)定性:穩(wěn)定—25和25*在排序前后的次序未變更練習:關鍵字序列T=(31,15,9,25,16,28),請按從小到大的依次,寫出冒泡排序的詳細實現(xiàn)過程。初態(tài):31,15,9,25,16,28第1趟15,9,25,16,28,31第2趟9,15,16,25,28,31第3趟9,15,16,25,28,311、基本思想:設數組a中存放了n個數據元素,low為數組的低端下標,high為數組的高端下標,從數組a中任取一個元素(通常取a[low])做為標準元素,以該標準元素調整數組a中其他各個元素的位置,使排在標準元素前面的元素均小于標準元素,排在標準元素后面的均大于或等于標準元素。這樣一次排序過程結束后,一方面將標準元素放在了將來排好序的數組中該標準元素應位于的位置上,另一方面將數組中的元素以標準元素為中心分成了兩個子數組,位于標準元素左邊子數組中的元素均小于標準元素,位于標準元素右邊子數組中的元素均大于等于或標準元素。對這兩個子數組中的元素分別再進行方法類同的遞歸快速排序。算法的遞歸出口條件是low≥high。例、關鍵字序列T=(60,55,48,37,10,90,84,36),請按從小到大的依次,寫出快速排序的詳細實現(xiàn)過程??焖倥判蛩惴ǜ鞔慰焖倥判蜻^程3、快速排序算法publicstaticvoidquickSort(int[]a,intlow,inthigh){ inti,j; inttemp; i=low; j=high; temp=a[low]; //取第一個元素為標準數據元素 while(i<j){//在數組的右端掃描 while(i<j&&temp<=a[j])j--; if(i<j){ a[i]=a[j]; i++; }//在數組的左端掃描while(i<j&&a[i]<temp)i++; if(i<j){ a[j]=a[i]; j--; }}a[i]=temp;if(low<i)quickSort(a,low,i-1); //對左端子集合遞歸if(i<high)quickSort(a,j+1,high);//對右端子集合遞歸}4、快速排序算法分析:時間效率:一般狀況下時間困難度為O(nlog2n),最壞狀況是數據元素已全部正序或反序有序,此時每次標準元素都把當前數組分成一個大小比當前數組小1的子數組,此時時間困難度為O(n2)空間效率:O(log2n)—因為遞歸要用棧穩(wěn)定性:不穩(wěn)定—因為有跳動式交換。練習:已知序列{503,87,512,61,908,170,897,275,653,462},給出采納快速排序對該序列作非遞減排序時每趟的結果。第一趟:【4628727561170】503【897908653

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論