計算機體系結構復習_第1頁
計算機體系結構復習_第2頁
計算機體系結構復習_第3頁
計算機體系結構復習_第4頁
免費預覽已結束,剩余7頁可下載查看

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領

文檔簡介

1、精品文檔一計算機系統結構的基礎知識計算機系統結構含義,分類(FLYNN)系統結構:從程序設計者的角度所看到的系統的屬性,即概念性結構和功能特性。計算機系統結構: 指機器語言程序的設計者或是編譯程序設計者所看到的計算機系統的概念性結構與功能特性。弗林 (FLYNN)分類法:單指令流、單數據流( SISD )結構單指令流、多數據流(SIMD ) 結構多指令流、單數據流( MISD ) 結構多指令流、多數據流( MIMD ) 結構計算機系統設計的原則(三條),阿姆達爾(Amdahl)定律( 一 )加速那些使用頻率高的部件 提高整個計算機性能( 二 ) Amdahl定律( 三 ) 程序訪問局部性原理A

2、mdahl 定律可表示為:Sp = T e / T0T0= T e(1f e + fe /re)Sp:加速比;Te:采用改進措施前執行某任務系統所用的時間;T0:采用改進措施后所需的時間;f e:可改進部分在原系統計算時間中所占的比例,總是小于1;r e: :性能提高的倍數(T 部件改進前 / T部件改進后),總是大于1。R c計算機性能指標參數( CPI、MIPS、吞吐率,加速比)MIPS=CPI106馮 ·諾依曼機器特點,計算機系統結構發展1、以運算器為中心,除了完成運算以外,機器內部的數據傳送都經過運算器,控制器集中控制。2、存儲器是字長固定的、順序線性編址的一維結構。3、程序

3、存儲,指令和數據都存放在存儲器中。4、指令在存儲器中按其執行順序存放,由一個順序控制器指定即將被執行的指令地址。5、指令由操作碼和地址碼組成。6、數據以二進制表示。軟件對系統結構的影響二并行主存與存儲體系存儲系統三個特性(局部性、一致性、包含性)包含性:在容量大的存儲器中,一定能找到上層存儲信息的副本。一致性:副本修改,以保持同一信息的一致性。存儲層次結構概念和性能參數(T, S,C)。1歡迎下載精品文檔通用寄存器 M1,高速緩沖存儲器 M2,主存儲器 M3,輔助存儲器 M4,脫機大容量存儲器 M5 存儲容量 S,存儲器速度 T,存儲器價格 CCACHE引入目的、特點(和虛擬存儲器比) 、需解

4、決的問題目的:提高 CPU對存儲器的訪問速度。虛擬存儲器與高速緩沖存儲器區別CACHE主-存地址映象變換概念?幾種主要方式(全相聯、直接、組相聯)特點計算地址映像是指某一數據在主存中的地址與在緩存中的地址兩者之間的關系。全相聯的地址映像規則:1) 主存與緩存分成相同大小的數據塊。2) 主存的某一數據塊可以裝入緩存的任意一塊的空間中。優點:命中率較高, Cache 的存儲空間利用率高;缺點:線路復雜,成本高,速度低。直接相聯的地址映像規則:1. 主存與緩存分成同樣大小的塊;2. 主存容量應是緩存容量的整數倍,將主存空間按緩存的容量分成區,主存中每一區的塊數與緩存的總塊數相等;3. 主存中某區的一

5、塊存入緩存時只能存入緩存中塊號相同的位置。優點:簡單;缺點:命中率低。組相聯的映像規則:1.主存與緩存分成相同大小的塊;2.主存與緩存分成相同大小的組;3. 主存容量是緩存容量的整數倍,將主存空間按緩存的大小分成區,主存中每一區的組數與緩存的組數相同。4. 組間直接相聯;組內全相聯。優點:速度快,命中率高;幾種替換算法分類;簡述LRU替換算法隨機法: (Random, RAND法 )先進先出法 (First-In First-Out, FIFO法 )近期最少使用法(Least Recently Used, LRU法)。2歡迎下載精品文檔最久沒有使用法(Least Frequently Used

6、, LFU法)LRU法是依據各塊使用的情況,總是選擇那個最近最少使用的塊被替換。這種方法比較好的反映了程序局部性規律。因為最近最少使用的塊,很可能在將來的近期也很少使用,所以LRU法的命中率比較高。缺點: 實現起來比較困難, 它不但要記錄每塊使用次數的多少, 而且要反映出近期使用的次數。CACHE寫操作的更新策略,CACHE的性能(命中率,加速比,平均訪問時間)(1)全寫法,亦稱寫直達法(WT 法 Write through):在對Cache 進行寫操作的同時,也對主存該內容進行寫入。(2)寫回法 (WB法 Write back):在 CPU執行寫操作時,只寫入Cache,不寫入主存;需要替換

7、時,把修改過的塊寫回主存。(一) Cache 的容量對命中率的影響容量越大則命中率越高。 當容量由很小開始增加時命中率增加的比較明顯當容量達到一定程度,容量增加命中率改善的并不大。(二) Cache 塊的大小對命中率的影響當塊的容量加大命中率明顯的增加, 但增加到一定值后反而出現塊增加命中率下降的現象。這是因為塊容量大到一定程度, 進入塊內的數據,已不符合程序局部性規律了;塊越大在一定量的 Cache 中包含的塊數就越小,則命中率就降低了。(三) .地址映像方式對命中率的影響( 1)直接相聯法命中率比較低。( 2)全相聯方式命中率比較高,但難以實現。( 3)組相聯方式中, 主要是分組的數目對命

8、中率的影響比較明顯。由于主存與Cache 的組之間是直接相聯方式, 當組數分的越多, 則命中率就要下降, 當組數比較少時這種影響不明顯,當組數大到一定程度,則影響就很大。(3) Cache 系統的加速比:TH cTc (1 H c )Tm1TcSp= H c Tm(1H c )Tc :Cache 的訪問周期;Tm:主存儲器的訪問周期;Hc :Cache 的命中率存儲保護原因:( 1)為了防止由于一個用戶程序出錯而破壞主存中其他用戶的程序或系統軟件;( 2)防止一個用戶程序不合法地訪問不是分配給它的主存區域,即使不會引起破壞。( 一 ) 加界保護方式( 二 ) 鍵保護方式:鎖:將主存的每一頁都設

9、置一個存儲鍵,給予一個鍵號, 此鍵號存放在快表的表目中,相當于一把“鎖” 。所有頁的存儲鍵在主存相應的快速寄存器內,每個用戶的各實頁的存儲鍵都相同。鑰匙:訪問鍵。由操作系統給定,存在程序狀態字中。過程: 每次訪問主存,首先進行鍵號比較,如果鍵號相等才允許訪問。如同一把鑰匙開一把。3歡迎下載精品文檔鎖。存放鍵與程序鍵鍵號的分配,由操作系統完成。( 三 ) 環保護方式訪問方式的保護:對內存的信息可以有三種訪問操作,即讀、寫、執行訪問方式(1) 可讀,可寫,可以執行(2) 可讀,可執行,不可寫(3) 只可讀,不可寫,不可執行(4) 只可讀,可寫,不可執行,例如數據(5) 只能執行不可讀寫,例如專用程

10、序提高存儲器頻帶寬度方法多個存儲器并行工作,并用并行訪問和交叉訪問等方法三數據表示、尋址方式與指令系統數據類型和數據表示數據類型:指一組數據值的集合,還定義了可作用于這個集合上的操作集。分類:基本數據類型,結構數據類型,抽象數據類型和訪問指針。數據表示:指在計算機中能由硬件直接辯認, 指令系統可以直接調用的數據類型。自定義數據表示定義、分類及優, 缺點自定義數據表示:由數據本身來表明數據類型,使計算機內的數據具有自定義能力。分類:(1)帶標志符的數據表示(2)數據描述符優點:( 1)簡化了指令系統。( 2)容易檢出程序編制中的錯誤。( 3)簡化了編譯程序。( 4)支持數據庫系統。( 5)簡化了

11、程序設計。( 6)便于軟件測試,支持應用軟件開發。缺點:( 1)數據字長增加。( 2)降低了指令的微觀執行速度。( 3)與其他計算機的兼容性差,硬件復雜。哈夫曼概念及在計算機中應用,操作碼編碼法指令系統編碼方法,指令系統設計功能要求(一)指令系統中指令編碼方法:(1)正交法指令中的每個分段(包括操作碼、操作數地址等)相互獨立, 操作數地址的編碼同操作碼無關,反之亦然。( 2)整體法指令中各個分段在譯碼時相互有關,操作碼同操作數地址的分界線并不清楚。( 3)混合法這種方法把上兩種方法的優點結合起來。指令系統設計和優化指令格式優化的目的:如何用最短的位數表示指令的操作信息和地址信息,用最短的時間處

12、理頻度高的指令,。4歡迎下載精品文檔使二者之間有最佳配合以減少指令字中冗余信息以及用最少信息位來表示所需的操作信息和地址信息。兩種指令系統風格,特點(RISC、 CISC)( 一 ) 復雜指令集計算機(CISC)1、指令的控制執行是采用微程序控制技術,有專用的寄存器。2、控制器十分復雜,占用了大量CPU芯片面積,有些復雜指令用的很少,難以用優化編譯生成高效目標代碼。3、處理器的執行效率不高。4、指令系統與軟件之間語義差別越來越大,軟件設計任務十分繁重,整個設計風格不是十分經濟有效的。缺點:指令系統龐大、硬件復雜、執行速度低、編譯程序復雜、長、部分指令使用效率低。( 二 )精簡指令系統計算機(R

13、ISC)基本思想: 通過減少指令總數和簡化指令的功能來降低硬件設計的復雜程度,提高指令執行速度,使指令簡單,有效可行。1、指令格式簡單化、規整化(寄存器- 寄存器型)2、基本是單周期操作(指令功能和執行周期權衡選擇)3、分開的存取指令數據,引入多級Cache4、面向寄存器堆的結構5、充分提高流水線效率(用各種技術減少相關阻塞)6、采用硬邏輯控制方式(少數采用微程序設計)7、采用優化編譯技術,很好地支持高級語言簡述 RISC 的設計思想起源和主要技術(一) RISC設計思想的起源20%-80%定律系統設計中硬件和軟件之間折衷VLSI 工藝技術發展(一)流水線結構和指令調度(二)寄存器窗口(三)優

14、化編譯技術四重疊、流水和向量流水處理機流水概念,分級,分類,特點流水線技術: 將一個重復的時序過程分成若干個子過程,每個子過程都可有效的在其專用功能段上和其它子過程同時執行的一種技術。1、流水線的分級: (按處理的級別分級)操作部件級 (arithmetic pipelining):將復雜的算邏運算組成流水工作方式;指令級 (instruction pipelining):把一條指令解釋過程分成多個子過程;處理機級或宏流水線級(macro pipelining):由兩個以上處理機串行地對同一數據流進行處理, 每個處理機完成某一專門任務,各個處理機所得到的結果需存放在與下一個處理機所共享的存儲器

15、中。2、流水線的分類:按功能分類:單功能流水線、多功能流水線單功能流水線(unifunctionpipelining):只能實現一種固定的專門功能的流水線(如。5歡迎下載精品文檔CRAY-1)。多功能流水線(multifunction pipelining):通過各站間的不同連接方式可以同時或不同時地實現多種功能的流水線(如TI-ASC)。按工作方式分類:靜態流水線、動態流水線靜態流水線 (static pipelining):在同一時間內各功能段只能按一種運算(功能)的連接方式工作。動態流水線 (dynamic pipelining):在同一時間內各功能段允許按多種不同運算(功能)的連接方式

16、工作。特點:靜態流水線僅當指令都是同一類型時才能連續不斷地執行。當從一種功能方式變為另一種功能方式時,必須先排空流水線,然后再切換成另一種功能進行流水處理。靜態流水線的功能不能頻繁地變換,否則它的效率將很低。動態流水線可以提高流水線的吞吐率和設備的利用率。按連接方式(流水線中是否有反饋回路)分類:線性流水線、非線性流水線。線性流水線 (linearpipelining):從輸入到輸出,每個功能段只允許經過一次,不存在反饋回路。一般的流水線均屬于這一類。非線性流水線(non-linearpipelining):存在反饋回路,從輸入到輸出過程中,某些功能段將數次通過流水線,這種流水線常用于進行遞歸

17、運算。3、流水線特點:1 )流水一定重疊,比重疊更苛刻。2 )一條流水線通常由多個流水段組成。3 )每段有專用功能部件,各部件順序連接,不斷流。4 )流水線有建立時間、滿載時間、排空時間,5 )各段時間盡量短、一致,不一致時最慢子過程為瓶頸。6 )給出的最大吞吐率等指標,為滿負載最佳指標。流水線性能指標及分析、計算(Tp、 E、Sp 等)任務數 nTP從開始流入到n個任務全部流出的時間n個任務的總的加權時空區m個段的總的加權時空區Sp=完成任務所需周期數/ 實際所需周期數流水線三種沖突(資源,數據,控制相關)的概念和處理方法資源相關是指當有多條指令進入流水線后在同一機器周期內爭用同一功能部件所

18、發生的沖突。解決方法:( 1)使指令停頓一拍進入流水線,以解決相關。( 2)重復設置一個存儲器。數據相關: 當一條指令需要用到前面指令的執行結果,而前面的指令均在流水線中重疊執行,還未產生相應的結果時,就會引起“數據相關”。解決數據相關的方法: (可采用軟件和硬件技術)時間推后法旁路技術或相關專用通路技術(定向技術)定向技術:將一個計算結果直接傳送到所有需要它的功能單元的輸入端。6歡迎下載精品文檔控制相關主要由無條件轉移和條件轉移引起。(轉移指令概率占1/4 左右,不可忽視)解決控制相關主要使用的技術:加快和提前形成條件碼:有的指令的條件碼并不一定要等執行完畢得到運算結果后才能形成;靜態轉移預

19、測技術:在硬件和軟件設計完成后,轉移預測方向則確定。猜測法:按一個方向流水,預測成功或不成功方向;預取轉移目標:向兩個分支方向預取指令;加快短循環程序處理 :設置特殊循環指令、利用硬件向后檢測若干條指令( IBM360/91 :向后檢測 8 條);線性和非線性流水線的調度(1) 先進的流水調度方法 - 動態調度靜態調度: 借助軟件對指令執行順序進行調度,以減少由于流水線中存在相關沖突而引起流水線的停頓時間。目前比較流行。動態調度:通過硬件重新安排指令的執行順序以減少流水的停頓。一個周期能完成多條指令的計算機(多發射結構的RISC)、三種超級計算機對一個周期能發射多條指令計算機有超標量、超流水、

20、 超長指令字計算機,此外還有數據流計算機也屬于多發射結構。向量的處理方法1. 水平處理法 ( 橫向 )d1=a1*(b 1+c1)d2=a *(b+c)222··dn=a *(b+c)nnn2. 垂直處理法(縱向)適合于流水處理Bi +Ci- >Ei (i=1到 n)Ai * E i ->D i (i=1到 n)3. 分組縱橫處理法分成 k 組 ,每組長度為m,組內垂直處理,組間水平處理。n=k*m+r(r為第 k+1 組剩余分量 )Bi+CiEi (1到 m)Bi+CiEi (m+1 到 2m)Ei*AiDi (1到 m)Ei*AiDi (m+1 到 2m)增

21、強向量處理功能的方法,特別是鏈接技術五. 并行處理機與多處理機并行概念、粒度、分類概念:在同一時刻或同一時間間隔內完成多個性質相同或不同的任務。處理數據的并行性:位串字串-通常指傳統的串行單處理機。7歡迎下載精品文檔位并字串 -通常指傳統的并行單處理機。字并位串 -同時對多個字的同一位(稱位片)進行處理,開始進入并行處理領域。全并行 -同時對多個字的全部或部分位組進行處理。信息加工步驟和階段:存儲器操作并行 -并行存儲器系統和以相聯存儲器為核心構成的相聯處理機。處理器操作步驟并行- 可以是一條指令的取指、 分析、 執行等操作步驟, 也可以是具體運算,如流水計算機。處理器操作并行 -為支持向量、

22、 數組運算, 可以通過重復設置處理單元進行,如并行處理機指令、任務、作業并行- 較高級并行,屬于 MIMD計算機。并行性粒度:每次并行處理的規模大小。用字母G表示G=TW/TCTW:所有處理器進行計算的時間總和;TC:所有處理器進行通信的時間總和。(設系統共有P 個處理器)當 TC較大時,通信量大,則G較小處理粒度較細。反之對于粗粒度的并行,通信量較小。單機并行發展的3 條技術途徑提高計算機系統的并行性的技術途徑:時間重疊( Time Interleaving ):在并行性概念中引入時間因素。讓多個處理過程在時間上相互錯開,輪流重疊地使用同一套硬件設備的各個部分,以加快硬件周轉而贏得速度。資源

23、重復( Resource Replication ):并行性概念中引入空間因素。通過重復設置的硬件資源來提高系統可靠性或性能。 例如,通過使用兩臺或多臺完全相同的計算機完成同樣的任務來提高可靠性。資源共享( Resource Sharing):利用軟件的方法讓多個用戶按一定時間順序輪流地使用同一套資源,以提高其利用率,這樣相應地提高整個系統的性能。例如多道程序分時系統.三種單級互連網及兩種多級互連網功能、工作方式立方體網PM2I 單級互聯網混洗交換單級互聯網絡STARAN網omega網絡靜態互連網結構?多處理機互連結構(總線、交叉開關、多端口存儲器、多級網)靜態網絡常用來實現集中式系統的多系統之間或分布式系統的多個計算機結點間固定連接。它一旦構成后就固定不變。總線結構:把所有功能模塊(或部件、或計算機)連接到一條公共通信通路上,又稱為分時或公共總線。交叉開關網絡: 包含一組縱橫開關陣列,把縱向的處理機P 及 I/O 通道與橫向的存儲器模塊 M連接起來, 使每個處理器都有有它單獨可用的通路與存儲器模塊相連,這樣可以加大頻帶寬度,每個交叉點都有開關、多路控制轉換及仲裁部件。多端口存儲器互連方式:每個存貯器模塊有多個存

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
  • 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
  • 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論