微處理器系統(tǒng)結構與嵌入式系統(tǒng)-第二章-結構組成與工作原理_第1頁
微處理器系統(tǒng)結構與嵌入式系統(tǒng)-第二章-結構組成與工作原理_第2頁
微處理器系統(tǒng)結構與嵌入式系統(tǒng)-第二章-結構組成與工作原理_第3頁
微處理器系統(tǒng)結構與嵌入式系統(tǒng)-第二章-結構組成與工作原理_第4頁
微處理器系統(tǒng)結構與嵌入式系統(tǒng)-第二章-結構組成與工作原理_第5頁
已閱讀5頁,還剩45頁未讀, 繼續(xù)免費閱讀

下載本文檔

版權說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權,請進行舉報或認領

文檔簡介

1、2.1 計算機系統(tǒng)的基本結構與組成計算機系統(tǒng)的基本結構與組成層次模型 Hiberarchy結構Architecture、組成Organization與實現(xiàn)Realization2.2 計算機系統(tǒng)的工作原理計算機系統(tǒng)的工作原理馮諾依曼計算機架構模型機:系統(tǒng)結構、指令集、工作流程2.3 微處理器體系結構的改革微處理器體系結構的改革改進:指令集(RISC/CISC)、分層存儲器 、高速總線/接口改變:流水線、超標量、超長指令字、多機/核、多線程2.4 計算機體系結構分類計算機體系結構分類2.5 計算機性能評測計算機性能評測Performance 字長、存儲容量、運算速度2.1.1 -計算機系統(tǒng)的層次

2、結構計算機系統(tǒng)的層次結構 (a)圖自下而上反映了系統(tǒng)逐級)圖自下而上反映了系統(tǒng)逐級生成生成的過程,自上而下反映了系統(tǒng)的過程,自上而下反映了系統(tǒng)求求解解問題的過程;問題的過程; 軟硬件的邏輯等價性軟硬件的邏輯等價性可以表現(xiàn)為:硬件軟化(如可以表現(xiàn)為:硬件軟化(如RISC思想)、軟件硬思想)、軟件硬化(如化(如CISC思想)、固件化(如微程序)思想)、固件化(如微程序) ; (b)圖中的)圖中的虛擬機虛擬機:與某種特殊編程語言對應的假想硬件機器:與某種特殊編程語言對應的假想硬件機器微體系結構層微體系結構層(微程序或硬連邏輯)(微程序或硬連邏輯)操作系統(tǒng)層操作系統(tǒng)層語言處理層(解釋、編譯)語言處理層

3、(解釋、編譯)用戶程序層(語言編程)用戶程序層(語言編程)系統(tǒng)分析層(數(shù)學模型、算法)系統(tǒng)分析層(數(shù)學模型、算法)硬核硬核級級數(shù)字邏輯層(硬件)數(shù)字邏輯層(硬件)指令系統(tǒng)層(機器語言指令)指令系統(tǒng)層(機器語言指令)應用語言虛擬機應用語言虛擬機高級語言虛擬機高級語言虛擬機匯編語言虛擬機匯編語言虛擬機操作系統(tǒng)虛擬機操作系統(tǒng)虛擬機機器語言級機器語言級微程序級微程序級寄存器級(硬件)寄存器級(硬件)硬件系統(tǒng):異常處理機構、指令系統(tǒng)、硬件系統(tǒng):異常處理機構、指令系統(tǒng)、CPU、存儲器、存儲器、I/O及通信子系統(tǒng)及通信子系統(tǒng)系統(tǒng)軟件:操作系統(tǒng)、編譯器、數(shù)據(jù)庫管理系系統(tǒng)軟件:操作系統(tǒng)、編譯器、數(shù)據(jù)庫管理系統(tǒng)、

4、統(tǒng)、Web瀏覽器、設備驅動、中斷服務程序瀏覽器、設備驅動、中斷服務程序應用軟件應用軟件2.1.2 體系結構、組成與實現(xiàn)體系結構、組成與實現(xiàn)n體系結構體系結構Architecture 關心的是計算機概念結構與功能特性關心的是計算機概念結構與功能特性如:確定指令集中是否有乘法指令;如:確定指令集中是否有乘法指令;n計算機組成計算機組成Organization從硬件角度關注物理機器的組織從硬件角度關注物理機器的組織,關心的是邏輯設計、硬關心的是邏輯設計、硬件實現(xiàn)、互連組織等件實現(xiàn)、互連組織等 如:乘法指令由專用乘法器還是用加法器實現(xiàn)如:乘法指令由專用乘法器還是用加法器實現(xiàn)n計算機實現(xiàn)計算機實現(xiàn)Rea

5、lization底層的集成電路設計技術、微組裝技術、冷卻技術等底層的集成電路設計技術、微組裝技術、冷卻技術等如:加法器底層的物理器件類型及微組裝技術如:加法器底層的物理器件類型及微組裝技術2021-11-44/ 50計算機的體系結構計算機的體系結構 1946年年,美國賓夕法尼亞大學莫爾學院的物理學博士,美國賓夕法尼亞大學莫爾學院的物理學博士Mauchley和電氣工程師和電氣工程師Eckert領導的小組研制成功世界上第領導的小組研制成功世界上第一臺數(shù)字式電子計算機一臺數(shù)字式電子計算機ENIAC 。 著名的美籍匈牙利數(shù)學家著名的美籍匈牙利數(shù)學家Von Neumann參加了為改進參加了為改進ENIA

6、C而舉行的一系列專家會議,研究了新型計算機的體系結構。而舉行的一系列專家會議,研究了新型計算機的體系結構。 1949年年,英國劍橋大學的威爾克斯等人在,英國劍橋大學的威爾克斯等人在EDSAC 機上實現(xiàn)機上實現(xiàn)了馮了馮諾依曼模式。諾依曼模式。 直至今天馮直至今天馮諾依曼體系結構依然是絕大諾依曼體系結構依然是絕大多數(shù)數(shù)字計算機的基礎。多數(shù)數(shù)字計算機的基礎。2021-11-45/ 50計算機的組成(計算機的組成(1)計算機的組成(計算機的組成(2)總線結構總線結構2021-11-47/ 50計算機的組成(計算機的組成(3)同步數(shù)字系統(tǒng)同步數(shù)字系統(tǒng)2021-11-48/ 50計算機的實現(xiàn)計算機的實現(xiàn)

7、半導體技術半導體技術 制造技術制造技術 封裝技術封裝技術 裝配技術裝配技術 電源技術電源技術 冷卻技術冷卻技術 2021-11-49/ 50體系結構角度的多層結構體系結構角度的多層結構硬件向上提供的接口:硬件向上提供的接口: 指令系統(tǒng)指令系統(tǒng) 異常事件異常事件 端口定義端口定義2021-11-410/ 50組織角度的多層結構組織角度的多層結構11/322021-11-42021-11-42021-11-411/ 502.2 計算機系統(tǒng)的工作原理計算機系統(tǒng)的工作原理2.2.1 馮馮諾依曼體系結構諾依曼體系結構l硬件組成硬件組成n五大部分五大部分運算器、存儲器、控制器、輸入設備、輸出設備運算器、存

8、儲器、控制器、輸入設備、輸出設備n以存儲器為中心以存儲器為中心l信息表示:二進制信息表示:二進制 計算機內(nèi)部的控制信息和數(shù)據(jù)信息均采用計算機內(nèi)部的控制信息和數(shù)據(jù)信息均采用二進制二進制表示,并表示,并存放在同存放在同一個存儲器一個存儲器中。中。l工作原理:存儲程序工作原理:存儲程序/指令指令(控制控制)驅動驅動 編制好的程序編制好的程序(包括指令和數(shù)據(jù)包括指令和數(shù)據(jù))預先經(jīng)由輸入設備輸入并預先經(jīng)由輸入設備輸入并保存在保存在存儲器存儲器中;中; 計算機開始工作后,在不需要人工干預的情況下由控制器計算機開始工作后,在不需要人工干預的情況下由控制器自動自動、高速地依次從存儲器中取出指令并加以執(zhí)行。、高

9、速地依次從存儲器中取出指令并加以執(zhí)行。2.2.2模型機體系結構模型機體系結構基于基于總線總線的的馮馮諾依曼架構諾依曼架構模型機模型機n總線子系統(tǒng)總線子系統(tǒng):作為公共通道連接各子部件,用于實現(xiàn)各:作為公共通道連接各子部件,用于實現(xiàn)各部件之間的數(shù)據(jù)、信息等的傳輸和交換部件之間的數(shù)據(jù)、信息等的傳輸和交換n存儲器子系統(tǒng)存儲器子系統(tǒng):用來存放當前的運行程序和數(shù)據(jù):用來存放當前的運行程序和數(shù)據(jù)n輸入輸出子系統(tǒng):用于完成計算機與外部的信息交換輸入輸出子系統(tǒng):用于完成計算機與外部的信息交換nCPU子系統(tǒng)子系統(tǒng):集成了運算器、控制器和寄存器的超大規(guī)模:集成了運算器、控制器和寄存器的超大規(guī)模集成電路芯片集成電路芯

10、片(VLSI)2021-11-413/ 50模型機總線結構模型機總線結構按傳輸信息的不同,可將總線分為數(shù)據(jù)總線按傳輸信息的不同,可將總線分為數(shù)據(jù)總線DB、地址總線、地址總線AB和控制總線和控制總線CB三類:三類:地址總線通常是地址總線通常是單向單向的,由的,由主設備主設備(如如CPU)發(fā)出,用于選擇發(fā)出,用于選擇讀寫對象讀寫對象(如某個特定的存儲單元或外部設備如某個特定的存儲單元或外部設備);數(shù)據(jù)總線用于數(shù)據(jù)交換,通常是數(shù)據(jù)總線用于數(shù)據(jù)交換,通常是雙向雙向的;的;控制總線包括真正的控制總線包括真正的控制控制信號線信號線(如讀如讀/寫信號寫信號)和一些和一些狀態(tài)狀態(tài)信信號線號線(如是否已將數(shù)據(jù)送

11、上總線如是否已將數(shù)據(jù)送上總線),用于實現(xiàn)對設備的監(jiān)視和,用于實現(xiàn)對設備的監(jiān)視和控制??刂啤PURAMROMI/O接口接口外設外設ABDBCB2021-11-414/ 50模型機內(nèi)存儲器模型機內(nèi)存儲器存儲器組織由許多存儲器組織由許多字節(jié)單元字節(jié)單元組成,每個單元都有一個唯一的組成,每個單元都有一個唯一的編號(存儲單元編號(存儲單元地址地址),保存的信息稱為存儲單元),保存的信息稱為存儲單元內(nèi)容內(nèi)容。訪問訪問(讀或寫讀或寫)存儲單元存儲單元 :存儲單元地址經(jīng)地址譯碼后產(chǎn)生相:存儲單元地址經(jīng)地址譯碼后產(chǎn)生相應的選通信號,同時在控制信號的作用下讀出存儲單元內(nèi)容應的選通信號,同時在控制信號的作用下讀出

12、存儲單元內(nèi)容到數(shù)據(jù)緩沖器,或將數(shù)據(jù)緩沖器中的內(nèi)容寫入選定的單元。到數(shù)據(jù)緩沖器,或將數(shù)據(jù)緩沖器中的內(nèi)容寫入選定的單元。算術邏輯單元算術邏輯單元ALU累加器累加器ACC累加鎖存器累加鎖存器暫存暫存器器標志寄存器標志寄存器FR通用寄存器組通用寄存器組堆棧指針堆棧指針SP程序計數(shù)器程序計數(shù)器PC微微 操操 作作 控控 制制 電電 路路指令譯碼器指令譯碼器ID指令寄存器指令寄存器IR 操作碼操作碼 , 地址碼地址碼脈沖分配器脈沖分配器時鐘脈沖源時鐘脈沖源控制總線控制總線CB地址總線地址總線AB數(shù)據(jù)總線數(shù)據(jù)總線DB內(nèi)部總線內(nèi)部總線地址緩沖器地址緩沖器數(shù)據(jù)緩沖器數(shù)據(jù)緩沖器運算器運算器寄存器組寄存器組控制器控

13、制器模型機模型機CPU子系統(tǒng)子系統(tǒng)2021-11-416/ 502.2.3模型機指令系統(tǒng)模型機指令系統(tǒng)指令是發(fā)送到指令是發(fā)送到CPU的命令,指示的命令,指示CPU執(zhí)行一個特定的處理,如執(zhí)行一個特定的處理,如從存儲器取數(shù)據(jù)、對數(shù)據(jù)進行邏輯運算等。從存儲器取數(shù)據(jù)、對數(shù)據(jù)進行邏輯運算等。CPU可以處理可以處理的全部指令集合稱為的全部指令集合稱為指令集指令集(Instruction Set)。指令集結。指令集結構構(ISA,Instruction Set Architecture) 是體系結構的主是體系結構的主要內(nèi)容之一,對要內(nèi)容之一,對CPU的基本組織會產(chǎn)生非常大的影響。的基本組織會產(chǎn)生非常大的影響

14、。ISA功能設計實際就是功能設計實際就是確定軟硬件的功能分配確定軟硬件的功能分配。指令通常包含指令通常包含操作碼和操作數(shù)操作碼和操作數(shù)兩部分。操作碼指明要完成操作兩部分。操作碼指明要完成操作的性質(zhì),如加、減、乘、除、數(shù)據(jù)傳送、移位等;操作數(shù)的性質(zhì),如加、減、乘、除、數(shù)據(jù)傳送、移位等;操作數(shù)指明參加上述規(guī)定操作的數(shù)據(jù)或數(shù)據(jù)所存放的地址。指明參加上述規(guī)定操作的數(shù)據(jù)或數(shù)據(jù)所存放的地址。匯編語言源程序匯編語言源程序機器語言程序機器語言程序(目標代碼)(目標代碼)匯編(匯編程序)匯編(匯編程序)高級語言源程序高級語言源程序編譯或解釋(編譯程序)編譯或解釋(編譯程序)模型機常用匯編指令模型機常用匯編指令2

15、.2.4 模型機工作原理模型機工作原理計算機的工作本質(zhì)上就是計算機的工作本質(zhì)上就是執(zhí)行程序執(zhí)行程序的過程。的過程。l順序執(zhí)行順序執(zhí)行指令執(zhí)行的基本過程可以分為指令執(zhí)行的基本過程可以分為取指令取指令(fetch)、分析指令、分析指令(decode)和執(zhí)行指令和執(zhí)行指令(execute)三個階段。三個階段。l非順序執(zhí)行非順序執(zhí)行轉移(jump):執(zhí)行條件/無條件轉移指令,不返回過程(procedure)調(diào)用:主程序調(diào)用子程序后返回斷點中斷(interrupt):外界突發(fā)事件處理完后返回斷點異常( exception): 程序本身產(chǎn)生的某些例外處理完后重新執(zhí)行陷阱(trap) : 程序本身產(chǎn)生某些例

16、外條件處理完后返回斷點2021-11-419/812021-11-419/ 50程序的執(zhí)行程序的執(zhí)行過程過程取指令、分析指令、執(zhí)行指令取指令、分析指令、執(zhí)行指令ABDBALU累加器累加器ACC暫存器暫存器標志寄存器標志寄存器FR寄存器組寄存器組 操作控制器操作控制器OC指令譯碼器指令譯碼器ID指令寄存器指令寄存器IR 操作碼操作碼, 地址碼地址碼內(nèi)部總線內(nèi)部總線地址緩沖器地址緩沖器數(shù)據(jù)緩沖器數(shù)據(jù)緩沖器程序計數(shù)程序計數(shù)器器PC地地址址譯譯碼碼讀控制讀控制B0H5CH04H2EH地址地址1001H1002H1003H內(nèi)容內(nèi)容1000H內(nèi)存儲器內(nèi)存儲器MOV 5CH, R1ADD R1, 2EH,

17、R21CPU外外CPU內(nèi)內(nèi)2021-11-420/ 502.3 微處理器體系結構的改進微處理器體系結構的改進2.3.1 馮馮諾依曼體系結構的改進諾依曼體系結構的改進l改進改進CPU指令集指令集 存儲器子系統(tǒng)存儲器子系統(tǒng) 輸入輸入/輸出子系統(tǒng)輸出子系統(tǒng) l改變改變改變串行執(zhí)行模式,發(fā)展改變串行執(zhí)行模式,發(fā)展并行技術并行技術;1.改變控制方式,發(fā)展數(shù)據(jù)、需求、模式等其它驅動方式;改變控制方式,發(fā)展數(shù)據(jù)、需求、模式等其它驅動方式; 3-6章重點章重點指令功能、指令格式、尋址方式指令功能、指令格式、尋址方式 分層結構分層結構高速總線高速總線+多種接口方式多種接口方式 馮馮諾依曼型計算機的本諾依曼型計算

18、機的本質(zhì)特點也造成了其瓶頸:質(zhì)特點也造成了其瓶頸: 指令執(zhí)行的指令執(zhí)行的串行性串行性 存儲器讀取的存儲器讀取的串行性串行性不同的指令集設計策略:不同的指令集設計策略:CISC與與RISCCISC(Complex Instruction Set Computer,復雜指令集計算機),復雜指令集計算機)不斷增強指令的功能以及設置更復雜的新指令取代原先由程序段完成的功能,從而實現(xiàn)軟件功能的硬化。RISC(Reduced Instruction Set Computer,精簡指令集計算機),精簡指令集計算機)通過減少指令種類和簡化指令功能來降低硬件設計復雜度,從而提高指令的執(zhí)行速度。*22/86現(xiàn)代計

19、算機:現(xiàn)代計算機:RISC+CISC2021-11-422/ 502021-11-423/ 50CISC的特點及設計思想的特點及設計思想美國加州大學美國加州大學Berkeley分校的研究結果表分校的研究結果表明:明: 許多復雜指令很少被使用,許多復雜指令很少被使用,“2-8原則原則”控制器硬件復雜(指令多,控制器硬件復雜(指令多,且具有不定長格式和復雜的且具有不定長格式和復雜的數(shù)據(jù)類型),占用了大量芯數(shù)據(jù)類型),占用了大量芯片面積,且容易出錯;片面積,且容易出錯;指令操作繁雜,速度慢;指令操作繁雜,速度慢;指令規(guī)整性不好,不利于指令規(guī)整性不好,不利于采用流水線技術提高性能。采用流水線技術提高性

20、能。*23/682021-11-424/ 50RISC的特點及設計思想的特點及設計思想 RISC機的設計應當遵循以下五個原則:機的設計應當遵循以下五個原則: 指令條數(shù)少,格式簡單,易于譯碼;指令條數(shù)少,格式簡單,易于譯碼; 提供足夠的寄存器,只允許提供足夠的寄存器,只允許load 和和store指令訪問內(nèi)存;指令訪問內(nèi)存; 指令由硬件直接執(zhí)行,指令由硬件直接執(zhí)行, 在單個周期內(nèi)完成;在單個周期內(nèi)完成; 充分利用流水線;充分利用流水線; 依賴優(yōu)化編譯器的作用;依賴優(yōu)化編譯器的作用; *24/68CISC與與RISC的數(shù)據(jù)流的數(shù)據(jù)流IRIDREGALUMEM開始退出IRIDALUMEMREG微操作

21、通道開始退出單通數(shù)據(jù)通道RISC:Load/Store結構結構CISC:尋址方式復雜:尋址方式復雜*25/862021-11-425/ 50分層的存儲子系統(tǒng)分層的存儲子系統(tǒng)如何以合理的價格搭建出容量和速度都滿足要求的存儲系統(tǒng)如何以合理的價格搭建出容量和速度都滿足要求的存儲系統(tǒng),始終是計算機體系結構設計中的關鍵問題之一。,始終是計算機體系結構設計中的關鍵問題之一。現(xiàn)代計算機系統(tǒng)通常把不同的存儲設備按一定的體系結構組現(xiàn)代計算機系統(tǒng)通常把不同的存儲設備按一定的體系結構組織起來,以解決織起來,以解決存儲容量、存取速度和價格存儲容量、存取速度和價格之間的矛盾。之間的矛盾。設計目標:設計目標:整個存儲系統(tǒng)

22、速度接整個存儲系統(tǒng)速度接近近M1而價格和容量接近而價格和容量接近Mn2021-11-426/ 50其他改善存儲器帶寬的方法其他改善存儲器帶寬的方法并行存儲器并行存儲器雙端口存儲器雙端口存儲器哈佛體系結構哈佛體系結構DSP程序程序數(shù)據(jù)數(shù)據(jù)I/O接口接口外設外設程序地址程序地址數(shù)據(jù)讀地址數(shù)據(jù)讀地址數(shù)據(jù)寫地址數(shù)據(jù)寫地址程序讀總線程序讀總線數(shù)據(jù)讀總線數(shù)據(jù)讀總線程序程序/數(shù)據(jù)寫數(shù)據(jù)寫數(shù)據(jù)數(shù)據(jù)程序程序2021-11-427/ 502021-11-428/ 50現(xiàn)代高速總線現(xiàn)代高速總線高速并行總線高速并行總線高速總線串行化高速總線串行化多級總線結構多級總線結構北橋北橋南橋南橋前端總線前端總線Front Si

23、de Bus輸入輸出管理方式輸入輸出管理方式2021-11-430/ 502.3.2計算機體系結構的演進:并行處理技術計算機體系結構的演進:并行處理技術指令級并行技術指令級并行技術ISP流水線流水線、超標量超標量、超長指令字超長指令字系統(tǒng)級并行技術系統(tǒng)級并行技術SLP多處理器(多處理器(多機多機/多核多核)、多磁盤)、多磁盤線程級并行技術線程級并行技術TLP同時同時多線程多線程SMT電路級并行技術電路級并行技術CLP組相聯(lián)組相聯(lián)cache、先行進位加法器、先行進位加法器 并行處理技術實現(xiàn)多個處理器或處理器模塊的并并行處理技術實現(xiàn)多個處理器或處理器模塊的并行性,其基本思想包括行性,其基本思想包括

24、時間重疊時間重疊(time interleaving)、資源重復資源重復(resource replicaiton)和資源共享和資源共享(resource sharing)。2.3.3 流水線技術流水線技術 可通過分可通過分割邏輯,割邏輯,插入緩沖插入緩沖寄存器(寄存器(流水線流水線Reg)來)來構建構建2021-11-432/ 50指令時空圖指令時空圖順序順序執(zhí)行執(zhí)行4級流級流水線水線執(zhí)行執(zhí)行流水線滿載流水線滿載2021-11-433/ 50更細的流水線更細的流水線取指(取指(FI)指令譯碼(指令譯碼(DI)計算操作數(shù)地址(計算操作數(shù)地址(CO)取操作數(shù)(取操作數(shù)(FO)執(zhí)行指令(執(zhí)行指令(

25、EI)寫操作數(shù)(寫操作數(shù)(WO)34/862021-11-434/ 50流水線流水線CPU的特點的特點優(yōu)點:優(yōu)點: 通過指令級并行來提高性能。缺點:缺點:增加了硬件成本。流水寄存器會引入延遲和時鐘偏移,這些額外開銷會使每條指令的執(zhí)行時間有所增加,同時限制了流水線的深度。 1.流水線中各段的操作存在關聯(lián)(dependence)時可能會引起流水線中斷,從而影響流水線的性能和效率。*35/862021-11-435/ 50流水線沖突流水線沖突理想流水線的性能:每個時鐘周期完成一條指令理想流水線的性能:每個時鐘周期完成一條指令實際流水機器中可能存在實際流水機器中可能存在冒險冒險(hazard)導致停頓

26、:導致停頓: 數(shù)據(jù)沖突(數(shù)據(jù)沖突(如后面的計算要用到前面的結果)如后面的計算要用到前面的結果)定向技術可將結果數(shù)據(jù)從其產(chǎn)生的地方直接傳送到所有需要它的功定向技術可將結果數(shù)據(jù)從其產(chǎn)生的地方直接傳送到所有需要它的功能部件能部件編譯器可利用流水線調(diào)度(編譯器可利用流水線調(diào)度(scheduling)技術來重新組織指令順序)技術來重新組織指令順序結構沖突(結構沖突(硬件資源不夠)硬件資源不夠)增加額外的同類型資源增加額外的同類型資源改變資源的設計使其能被同時使用改變資源的設計使其能被同時使用控制沖突(控制沖突(分支等跳轉指令引起分支等跳轉指令引起 )可采用分支預測及預測執(zhí)行技術最大限度地使處理器各部分保

27、持運可采用分支預測及預測執(zhí)行技術最大限度地使處理器各部分保持運行狀態(tài)。行狀態(tài)。多端口的寄存器堆哈佛結構存儲器、超標量*36/862021-11-436/ 50流水線數(shù)據(jù)沖突及亂序執(zhí)行流水線數(shù)據(jù)沖突及亂序執(zhí)行2021-11-437/ 50流水線結構沖突及超標量流水線流水線結構沖突及超標量流水線?有有5個執(zhí)行單元的超標量流水線個執(zhí)行單元的超標量流水線有有2套硬件的套硬件的超標量流水超標量流水線線CPU 共用一個取指單元的共用一個取指單元的5段雙流水線段雙流水線*2021-11-438/ 502.3.4超標量超標量CPU的體系結構的體系結構超標量技術:超標量技術:可在一個時鐘周期內(nèi)對多條指令進行并可

28、在一個時鐘周期內(nèi)對多條指令進行并行處理,使行處理,使CPI小于小于1;特點:特點:處理器中有兩個或兩個以上的相同的功能部件;處理器中有兩個或兩個以上的相同的功能部件; 要求操作數(shù)之間必須沒有相關性;要求操作數(shù)之間必須沒有相關性;整數(shù)指令整數(shù)指令浮點指令浮點指令*2021-11-439/ 50超標量處理機超標量處理機一般概念性結構一般概念性結構instruction fetching多個流水線讀取及轉移預測邏輯多個流水線讀取及轉移預測邏輯instruction decoding并行譯碼器,預譯碼技術并行譯碼器,預譯碼技術instruction dispatching動態(tài)規(guī)劃動態(tài)規(guī)劃instruc

29、tion execution多個流水線功能單元多個流水線功能單元instruction completion暫存結果數(shù)據(jù)暫存結果數(shù)據(jù)instruction retiring真正更新真正更新Reg和和Mem中的結果數(shù)據(jù)中的結果數(shù)據(jù)* 超標量結構機器的例子超標量結構機器的例子 兩條輸入流水線三條執(zhí)行流水線每個時鐘周期可每個時鐘周期可從存儲器中獲取從存儲器中獲取兩條指令兩條指令用于執(zhí)行不需要訪用于執(zhí)行不需要訪問存儲器的指令問存儲器的指令可處理所有需要或不需可處理所有需要或不需要訪問存儲器的指令要訪問存儲器的指令可用于進行乘、除類可用于進行乘、除類較復雜的算術運算較復雜的算術運算決定應使用哪一決定應使

30、用哪一條執(zhí)行流水線條執(zhí)行流水線2021-11-441/ 502021-11-442/ 50 和超標量處理機不同,超長指令字和超標量處理機不同,超長指令字VLIW(Very Long Instruction Word)依靠編譯器依靠編譯器在編譯時找出指令之間潛在的在編譯時找出指令之間潛在的并行性,并通過指令調(diào)度把可能出現(xiàn)的數(shù)據(jù)沖突減少到最小,并行性,并通過指令調(diào)度把可能出現(xiàn)的數(shù)據(jù)沖突減少到最小,最后把能并行執(zhí)行的多條指令組裝成一條很長的指令,然后由最后把能并行執(zhí)行的多條指令組裝成一條很長的指令,然后由處理機中多個處理機中多個相互獨立的執(zhí)行部件相互獨立的執(zhí)行部件分別執(zhí)行長指令中的一個操分別執(zhí)行長指

31、令中的一個操作,即相當于同時執(zhí)行多條指令。作,即相當于同時執(zhí)行多條指令。 VLIW處理機能否成功,很大程度上取決于代碼壓縮的效率,處理機能否成功,很大程度上取決于代碼壓縮的效率,其其編譯程序和體系結構編譯程序和體系結構的的關系非常密切,缺乏對傳關系非常密切,缺乏對傳統(tǒng)軟件和硬件的兼容,因統(tǒng)軟件和硬件的兼容,因而不大適用一般應用領域。而不大適用一般應用領域。 VLIW處理機處理機*2021-11-443/ 502.3.5 多機并行系統(tǒng)多機并行系統(tǒng)大規(guī)模并行處理機(大規(guī)模并行處理機(MPP)是是一種價格昂貴的超級計算機,它由許多一種價格昂貴的超級計算機,它由許多CPU通過高速專用互聯(lián)網(wǎng)絡連接。通過

32、高速專用互聯(lián)網(wǎng)絡連接。機群(機群(cluster)由多臺同構或異構的獨立計算機通過高性能網(wǎng)絡或局域由多臺同構或異構的獨立計算機通過高性能網(wǎng)絡或局域網(wǎng)連在一起協(xié)同完成特定的并行計算任務。網(wǎng)連在一起協(xié)同完成特定的并行計算任務。刀片(刀片(blade)通常指包含一個或多個通常指包含一個或多個CPU、內(nèi)存以及網(wǎng)絡接口的服務器、內(nèi)存以及網(wǎng)絡接口的服務器主板。通常一個刀片柜共享其它外部主板。通常一個刀片柜共享其它外部I/O和電源,而輔助存儲器則有距離刀片和電源,而輔助存儲器則有距離刀片柜較近的存儲服務器提供。柜較近的存儲服務器提供。網(wǎng)格(網(wǎng)格(Network)是一組由高速網(wǎng)絡連接的不同的計算機系統(tǒng),可以相

33、是一組由高速網(wǎng)絡連接的不同的計算機系統(tǒng),可以相互合作也可獨立工作。網(wǎng)格計算機將接受中央服務器分配的任務,然后在不忙互合作也可獨立工作。網(wǎng)格計算機將接受中央服務器分配的任務,然后在不忙的時候(如晚上或周末)執(zhí)行這些任務。的時候(如晚上或周末)執(zhí)行這些任務。2021-11-444/ 50多核處理器多核處理器多線程技術多線程技術單片多處理器單片多處理器(Chip MulitProcessor,CMP)問題:晶體管數(shù)量、芯片面積及芯片發(fā)熱量問題:晶體管數(shù)量、芯片面積及芯片發(fā)熱量多線程處理器多線程處理器(Multithreaded Processor)細粒度多線程細粒度多線程(Fine-Grail Mu

34、ltithreading)在每個指令在每個指令中切換線程,處理器必須能在每個時鐘周期切換線中切換線程,處理器必須能在每個時鐘周期切換線程。其優(yōu)點是可以隱藏停頓引起的吞吐量損失;缺程。其優(yōu)點是可以隱藏停頓引起的吞吐量損失;缺點是單個線程處理速度變慢了。點是單個線程處理速度變慢了。粗粒度多線程粗粒度多線程(Coarse-Grail Multithreading) 僅當遇僅當遇到開銷大的阻塞時才切換線程其缺陷在于流水線啟到開銷大的阻塞時才切換線程其缺陷在于流水線啟動開銷引起吞吐量損失,特別是對于短的阻塞動開銷引起吞吐量損失,特別是對于短的阻塞2021-11-445/ 502.4 計算機體系結構的分類

35、計算機體系結構的分類 Flynn分類:根據(jù)分類:根據(jù)指令流和數(shù)據(jù)流指令流和數(shù)據(jù)流的多少進行分類的多少進行分類單指令單數(shù)據(jù)單指令單數(shù)據(jù)SISD單指令多數(shù)據(jù)單指令多數(shù)據(jù)SIMD多指令單數(shù)據(jù)多指令單數(shù)據(jù)MISD多指令多數(shù)據(jù)多指令多數(shù)據(jù)MIMDCU控制部件控制部件PU處理部件處理部件MM存儲單元存儲單元CS為控制流為控制流DS為數(shù)據(jù)流為數(shù)據(jù)流IS為指令流為指令流傳統(tǒng)的順序處理機、傳統(tǒng)的順序處理機、標量流水線處理機、標量流水線處理機、超標量流水線處理機超標量流水線處理機陣列處理機、陣列處理機、向量處理機向量處理機無實際機型對應無實際機型對應多處理機系統(tǒng)多處理機系統(tǒng)2.5 計算機系統(tǒng)的性能測定計算機系統(tǒng)的性能測定 計算機系統(tǒng)的性能由硬件性能和程序特性決定,計算機系統(tǒng)的性能由硬件性能和程序特性決定,通??衫猛ǔ?衫脴藴蕼y試程序標準測試程序來測定性能。來測定性能。用用MIPS (Million Instructions Per Second,每秒百萬條指令每秒百萬條指令)或或MFLOPS(每秒百萬次浮點操作每

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
  • 4. 未經(jīng)權益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負責。
  • 6. 下載文件中如有侵權或不適當內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

評論

0/150

提交評論