




版權說明:本文檔由用戶提供并上傳,收益歸屬內容提供方,若內容存在侵權,請進行舉報或認領
文檔簡介
1、精品Question4Asingle-issueprocessorusestomasulo'salgorithminitsfloating-pointunit,whichhasoneadderandonemultiplier,eachwithitsownsetofreservationstation,thereisonlyoneCDB,andbroadcastonthisCDBtakesanentirecycle.theprocessorisexecutingthefollowingsequenceofinstructionand,foreachinstruction,weshowth
2、ecycleinwhichtheinstructionisfetched,decoded,issued,beginstoexecute,andwritesresult.單發射處理器在其浮點單元中使用托馬斯算法,其具有一個加法器和一個乘法器,每個具有其自己的一組保留站,只有一個CDB并且在該CDBt廣播需要整個周期。處理器正在執行以下指令序列,并且對于每個指令,我們示出指令被取出,解碼,發出,開始執行和寫入結果的周期。instructionfetchdecodeissueexecuteWriteresultI1MULR1,R2,R212348I2ADDR1,R1,R2234910I3MULR2,
3、R2,R3345813I4ADDR3,R1,R14561112I5MULR1,R1,R15671216I6ADDR2,R3,R46711?I7ADDR1,R5,?781317181、whatisthelatencyofthemultiplier?42、Isthemultiplierpipelined?N3、Howmanyreservationstationaretherefortheadder?24、InwhichcycledoesI6begintoexecute?135、Whichregisterdoes?RepresentinI7R16、IftheprioryforusingCDBdepe
4、ndsonthetypeofinstruction,betweenADDandMULthepriorityforusingtheCDBgoesto?ADDQuestion8(書本92頁)感謝下載載;load R1 from address 0+R2 ;R1=R1+1.Loop:LDR1,0(R2)DADDIR1,R1,#1SDR1,0,(R2)DADDIR2,R2,#4DSUBR4,R3,R2BNEZR4,Loop;storeR1ataddress0+R2;R2=R2+4;R4=R3-R2;branchtoLoopifR4!=0AssumethattheinitialvalueofR3isR2
5、+396.答案:(1)依題意可得,指令序列執行的流水線時空圖如下:1234567891011121314151617181920211IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB1IFIFIDEXME時鐘周期為:17*98+18=1684(2)依題意可得,指令序列執行的流水線時空圖如下:1234567891011121314151IFIDEXMEWB2IFIDSEXMEWB3IFSIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB7IFMissMissIFIDEXMEWB時鐘周
6、期為:10*98+11=991(3)依題意可得,指令序列執行的流水線時空圖如下:12345678910111IFIDEXMEWB2IFIDEXMEWB3IFIDEXMEWB4IFIDEXMEWB5IFIDEXMEWB6IFIDEXMEWB1IFIDEXMEWB時鐘周期為:6*98+10=598Question99a)Whatistheeffectiveaccesstimeofacachememorysysteminwhichthereisa2-waysetassociativecache,havingthefollowingparameters:Parameter:Value:numberof
7、sets1024setslinesize16wordscacheaccesstime15ns/linemainmemoryaccesstime70ns/wordmainmemoryaddressspacesize256Mwordscachehitrate95%Labelthefieldsofthememoryaddressbelowusedtoaccessthecacheandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:_14_bitsIndex:_10_bitsOffset:_
8、4_bits9b)Whatistheeffectiveaccesstimeofacachememorysysteminwhichthereisadirectmappedlevel1(L1)cacheandafullyassociativelevel2(L2)cache,havingthefollowingparameters:Parameter:Value:L1numberofsets128setsL1linesize4wordsL1cacheaccesstime10ns/lineL2linesize8wordsL2cacheaccesstime20ns/linemainmemoryacces
9、stime70ns/wordmainmemorysize256MwordsL1cachehitrate95%L2cachehitrate89%LabelthefieldsofthememoryaddressbelowusedtoaccesstheL1cacheandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:19bitsIndex:7bitsOffset:2bitsLabelthefieldsofthememoryaddressbelowusedtoaccesstheL2cach
10、eandindicatethesizeofeachfield(innumberofbits).Assumethatmemoryisword-addressed.Tag:25bitsIndex:0bitsOffset:3bitsQuestion11一個簡單的共享內存cache-coherent機有四個處理器,沒有"虛擬到物理"的翻譯和16位(物理)地址。每個處理器有一個L1數據緩存,沒有L2高速緩存。每個L1緩存是有四個64字節的塊(每個緩存的大小是256字節)的直接變換,他們使用MESI一致性協議來保持一致的。每個緩存的初始狀態(十六進制符號標記所示):P0P1P2P3st
11、atagstattagstattagstattagteIeee如0FS0FS01S01果按順序M01E02M03E04執行下面I0FI0FE0FI0F的內存訪M00E02S04I06問,將會發生什么?特別是,指定每個其他的緩存發生在由于總線廣播、數據從哪里來(如果在緩存中沒有準備好),和新狀態塊的請求者的緩存。P0寫一個字到地址00fcP1讀一個字到地址0f8cP2讀一個字到地址0f8cP3寫一個字到地址0444答案:P0P1P2P3statetagstatetagstatetagstatetagIOFSOFSOFSOFM01E02M03M04IOFIOFEOFIOFM00E02S04I06Q
12、uestion13statelagdataB0II100WIDM1ZB,0068B2|110,001DB3S001S山住dataB0120oo20B1£10ftco091110oo1Q明)1180010理由1修9II1000010B1IS1080003M1100030B311180010POP1<-P2>Memory答案:A:P0B0( S,120,00,20)B:P0 B0 (M,120,00, 80)C:P2B0 (M,120,00,80)D: P1B2 (S,110,00,30)E: P0B1 (M,108,00,48)F: P0 B2 (M,130,00 , 78
13、)P1 B0 (I,120,00, 20)P0 B0 (I,120,00, 80)P2 B2 (S,110,00 , 30)P1 B1 (I , 108, ,0,08P1 B0 (I,120,00, 80)P2 B1 (I , 108,00,08 )40%先將該功能部件改進(加速1 .處理器中某功能部件占總應用程序執行時間的比例為10倍),則整個應用程序的加速比為多少?(D)A.1.4B.2.5C.2.18D.1.562 .在計算機系統設計中,比較好的方法是:(D)A. 從上向下設計 B.C. 從兩頭向中間設計D.3 .對系統程序員不透明的是:(A. Cache存儲器C.指令緩沖寄存器4 .系
14、列機軟件應做到:( BA.向前兼容,并向上兼容C. 向前兼容,并向下兼容5.屬計算機系統結構考慮的應是A.主存采用CMOSE是TTLC.主存容量和編址方式D從下向上設計從中間開始向上、向下設計D )B.系列機各檔不同的數據通路寬度D. 虛擬存儲器)B.向后兼容,力爭向上兼容D.向后兼容,力爭向下兼容:C )。B .主存采用多體交叉還是單體.主存頻寬的確定6. 最能確保提高虛擬存儲器訪問主存的命中率的改進途徑是(D)。A.增大輔存容量.采用FIFO替換算法并增大頁面C.改用LRU替換算法并增大頁面D.改用LRU替換算法并增大頁面數7. 靜態流水線是指(C)。A.只有一種功能的流水線B.功能不能改
15、變的流水線C.同時只能完成一種功能的多功能流水線D.可同時執行多種功能的流水線8. 假設用軟件方法在A計算機上實現B計算機的指令系統,則B稱為(C)。A.仿真機B.宿主機C.虛擬機D.目標機9. 計算機中優化使用的操作碼編碼方法是(D)。A.哈夫曼編碼B.ASCII碼C.BCD碼D.擴展操作碼10. 在采用基準測試程序來測試評價機器的性能時,下列方法按照評價準確性遞增的順序排列是(B)。A: 1)實際的應用程序方法B: 2)核心程序方法C: 3)玩具基準測試程序(小測試程序)D: 4)綜合基準測試程序E: (1)(2)(3)(4)F: (2)(3)(4)(1)G: (3)(4)(1)(2)H:
16、 (4)(3)(2)(1)11. 10.在系統結構設計中,提高軟件功能實現的比例會(C)。A、提高解題速度B、減少需要的存貯容量C提高系統的靈活性D、提高系統的性能價格比12. CPI是量化計算機性能的一個重要指標,關于CPI說法正確的是(C)A.CPI由計算機的結構決定B. CPI由運行在計算機系統上的應用程序決定C. CPI由計算機的結構和應用程序共同決定D.CPI由計算機的時鐘周期決定13. 以下不屬于計算機性能公式的變量是(D)A.ICB.時鐘周期C.CPID.MIPS14. 未曾實現的商業計算機結構類型是(C)A.SISDB.SIMDC.MISDD.MIMD15. 關于近10年CPU
17、從單核轉向多核處理器的解釋正確的是(D)A. 指令級并行技術已經發展到極限B. CPU的工作電壓很難再下降C.提高時鐘頻率會帶來CPU的散熱極限問題D.上述理由全部正確16. 圖像處理器GPU屬于哪種結構(B)A.SISDB.SIMDC.MISDD.MIMD17. 以下不屬于Flynn體系結構類型的是(C)A.SISDB.SIMDC.SIMTD.MISD18. CPI是量化計算機性能的一個重要指標,關于CPI說法正確的是(B)A.CPI由計算機的結構決定B. CPI由運行在計算機系統上的應用程序決定C. CPI由計算機的結構和應用程序共同決定D.CPI由計存儲器系統決定分析:CPI=TC/IC
18、19. 與存儲器-存儲器結構指令集結構相比,寄存器-寄存器結構(D).A.CPI大B.完成同一個算法需要的指令數更少C.指令的功能更復雜D.固定長度的指令編碼方式20. 計算機系統的執行時間的通用公式為:CPUtime=yx時鐘周期xCPI,此處y是(B)A. 程序執行的周期數B. 被執行的指令總數C. 包括訪問存缺失在內的指令平均執行時間D. 每個周期內執行的指令數21. RISC與CISC不同處有(C)A.RISC指令復雜B.CISC指令效率高C.RISC指令數量少D.以上說法均錯誤22. 關于MIPS的指令集結構類型說法正確的是(A)A. 寄存器-寄存器B. 寄存器-存儲器C. 存儲器-
19、存儲器D. 以上說法均錯23. 流水線技術可以(A)A.提高吞吐率B.降低吞吐率C.降低響應時間D.增加響應時間24. 流水線通過哪種方式提高系統的性能(C)A.減少指令的響應時間B.消除指令相關C.開發指令級的并行D.降低CACHE勺缺失率25. 惡化流水線的處理器性能的原因是(D)A.流水線每級處理時間不同B. 連續的指令間的相關C. 流水線的結構相關D.以上全部正確26. 流水線技術可以(D)A. 提高吞吐率和不改變響應時間B. 提高吞吐率和降低響應時間C. 降低吞吐率和降低響應時間D. 提高吞吐率和增加響應時間27. 在k級單流水線中執行n個任務,所消耗的時鐘周期數(A)A.k+n-1
20、B.nk+1C.kD.以上說法全部錯誤28. 關于靜態指令調度和指令動態調度說法錯誤的是(C)A. 編譯器相比于硬件有更多的時間處理復雜的調度算法B. 編譯器靜態調度的前提是假設指令間存在比時間更復雜的沖突C. 編譯器靜態調度需要比動態調度更多的關于沖突的精確歷史數據D. 以上說法都錯誤29. 保留站項在流水線的哪一級釋放(A)A. 寫結果B.發射C.執行D.確認30.使用獨立的指令CACH醫口數據CACHE勺理由是(D)A.數據和指令存在在不同的存儲器。B. 每個核的指令不同但數據共享C. 存儲器的方法模式不同D. 減少指令和數據訪存的沖突31. 關于全相聯CACH脫法正確的是(C)A. 等
21、價于一個1組1路組相聯CACHEB. 等價于一個多組1路組相聯CACHEC. 等價于一個1組多路直接映像CACHED. 等價于一個多組1路組直接映像CACHE32. 關于強制性不命中說法正確的是(A)A.塊第一次被訪存所以不在CACHED.B. 程序執行過程中由于cache容量有限不能保存所有塊C. 因為采用組相聯和直接映像所以發生沖突被替換掉D. 以上說法全錯33. 在采用單流水線、順序執行和順序提交結果的處理器中,那種情況會導致數據冒險(C)A.寫后寫B.讀后寫C.寫后讀D.讀后讀34. 為什么亂序執行的處理器采用順序方式提交指令執行結果?(D)A.確保精確異常B.確保多CACHE勺一致性
22、C.糾正和恢復分支預測錯誤的現場D.A和C都正確35. 在塊替換策略中,采用替換最近很少使用方法的理由是(A)A. 充分利用了程序的時間和空間局部性原理B. 充分利用了程序的局部性原理C. 充分利用了程序的空間局部性原理D. 沒用充分利用了程序的時間和空間局部性原理36. 在4路組相聯緩存中,一個新的塊的位置被映像到(C)A. 任何位置B. 塊地址與組數取余運算的結果選組號,然后固定在組中的固定位置C. 塊地址與組數取余運算的結果選組號,然后存放在組中的任何位置D. 以上說法都不對37. 關于最近20年內發生的事情說法正確的是(A)A. 處理器和存儲器性能都提高了,但是處理器提高更多。B. 存
23、儲器性能提高但處理器沒有。C. 處理器和存儲器性能都提高了,但是存儲器提高更多。D. 處理器性能提高但存儲器沒有。38. 相比于寫直達發,寫回法的優勢在于?(A)A.減少存儲器訪存次數B.減少不命中的開銷C.減少命中時間D.降低缺失率39. 假設指令的處理必須使用五個功能部件,這五個部件的執行時間分別為:10ns,8ns,10ns,10nsand7ns.如果使用流水線技術,流水線寄存器的時間開銷為1ns采用流水線與非流水線的加速比為(A)A.4.1B.5C.4.5D.340. 下列說法錯誤是:(B)A. 分支預測轉移比預測分支不轉移困難,因為需要提前指導分支轉移目標指令的地址。B. 預測分支轉
24、移和不轉移的準確率都為50%。C.根據BTB可以在取指令前判斷該指令是否為分支指令。D.流水線的深度會增加分支預測錯誤的開銷時間。41. 寄存器換名技術可以消除(D)A. 寫后寫冒險B. 讀后寫冒險C. 寫后讀冒險D. A和C全部正確42. 以下說法錯誤的是(D)A. 第一級緩存的容量小于第二級緩存的容量B. 第一級緩存的響應時間小于第二級緩存的響應時間C. 第一級緩存的被訪問次數小于第二級緩存的訪問次數D. 第一級緩存和第二級緩存都采用相同的地址映像方法: 10 ns, 81 ns43. 假設指令的處理必須使用五個功能部件,這五個部件的執行時間分別為ns,10ns,10nsand7ns.如果
25、使用流水線技術,流水線寄存器的時間開銷為采用流水線與非流水線的加速比為(A)A.4.1B.5C.4.5D.344. 為什么亂序執行的處理器采用順序方式提交指令執行結果?(D)A.確保精確異常B.確保多CACHE勺一致性C. 糾正和恢復分支預測錯誤的現場D. A和C都正確45. 在前瞻執行中,ROB的項釋放處在那一級(C)A.譯碼B.發射C.執行D.確認46. 以下說法正確的是?(D)A.直接映像cache與只有1個組多路組相聯CACH萼價B.直接映像cache與只有1個組的全相聯CACH若價C.直接映像cache與只有1個組1路組相聯CACH萼價D.以上說法都錯47. 下列哪種地址映像方式不適
26、合使用位預測技術(D)A. 全相聯B. 4路組全相聯C. 8路組全相聯D. 直接映像48. 在監聽協議中,那種情況下主存的信息不是最新的(C)A. 對共享狀態數據進行寫操作后的寫直達cachesB. 寫回caches有數據被標記為獨享狀態C. 寫回caches有數據被標記為修改狀態D. 寫回caches有數據被標記為共享狀態49. 下列哪種技術并沒用通過采用開發并行度方法提高系統的性能(B)A. 增加流水線深度提高工作頻率B. 采用小緩存減少訪存響應時間C.增加功能部件提高吞吐率D.采用多核處理器50. 假設有一單級非流水線處理器其機器周期為5ns,如果采用4級流水線實現該處理器,其機器周期為
27、2ns,后者與前者的加速比是(D)A.3B.2.5C.2D.0.551. 流水線寄存器發射出一條加法指令,同時也沒收到氣泡和停頓信息停頓信號,此時在指令隊列的尾部存在一條XOR!算指令,則等待發射的是(A)AaddBxorC氣泡D停頓52. 對于以下代碼:Intsum=0;for(intj=0;j<1000;j+)sum=sum+arri下列那個變量利用了程序的空間局部性原理()和時間局部性原理(B)A.jB.sumC.elementsofarrD.以上都不正確53. 在使用虛擬存儲系統中,應用程序所使用的地址是(D)A. 主存空間B. 物理地址C. 地址空間D. 虛擬地址54. 某計算
28、機的Cache-主存層次采用組相聯映象方式,塊大小為128字節,Cache容量為64塊,按4塊分組,主存容量為4096塊。那么主存地址共需(A)位。A.19B.18C.20D.以上都不對55. 基本的MIPS整數流水線中,訪存地址的計算發生在流水線的第(C)段。A1B2C3D456. RISC執行程序的速度比CISC要快的原因是(C)。A.RISC的指令系統中指令條數較少B.程序在RISC上編譯生成的目標程序較短。C.RISC的指令平均執行周期數較少。D.RISC只允許load和store指令訪存。57.通過編譯器重新安排指令的執行順序以減少流水的停頓方法,稱之為(D)。A.線性流水線B.非線
29、性流水線C.動態調度D.靜態調度判斷題1. ADistributedMemoryMultiprocessorisalsocalledaSymmetricMultiprocessor(SMP).分布式內存的多處理器也稱為對稱多處理器(SMP)。(T)2. Supposeweexpectatleastan80Xparallelspeedupfrom100processors.Atmost0.25%oftheexecutionoftheoriginalprogrammaybesequential(i.e.,non-parallelizable).假設我們希望至少一個從80年80x并行加速處理器。最多
30、0.25%的原始程序的執行順序(即。non-parallelizable)。(T)3. Supposeaconditionalbranchalternatesbetweentakenandnottakeneverytimeitisexecuted.Aone-bitBHTpredictorislikelytohaveamispredictionrateof100%onthisbranch.假設一個條件分支之間的交替而不是采取每次執行時。一個一比特的二叔丁基對甲酚預測可能會對這個分支的錯誤預測率為100%(T)4. Supposeaconditionalbranchistakenthefirst1
31、000timesitisexecuted,andnottakenthesecond1000times.Aone-bitBHTpredictorislikelytohaveperformancesimilartoacorrelatingbranchpredictoronthisbranch.假設條件分支被執行第一的1000倍,而不是采取第二個1000次。一比特的二叔丁基對甲酚預測可能是性能類似于相關分支預測在這個分支。(F)5. InTomasulo'salgorithmwithspeculation,whenabranchismispredicted,thedatawrittentom
32、emoryandtheregisterfileasaresultofthatbrancharerolledbacktotheirpreviousvalues.與投機Tomasulo的算法,當一個分支預測錯誤,數據寫入內存和寄存器文件的分支被回滾到之前的值。(T)6. ASingle-Instruction-Multiple-Data(SIMD)modelofcomputationischaracterizedbyindependentthreadscomputingonprivatememories.單指令多數據(SIMD)計算模型計算的特點是獨立的線程在私人記憶。(T)7. Areturna
33、ddresspredictorislikelytomispredictwhenthereisdeeprecursion.(F)深度遞歸的時候,返回地址預測相當于誤預測。8. Computerarchitecturedesignneedstoprovidesupporttocompiler.計算機體系結構設計需要為編譯器提供支持。(T)9. IntheMIPSPipeling,'UpdatingthePC'iscompletedinEXstage.在MIPSPipeling,更新電腦”是在前階段完成。(F)10. Forforwardingyouneedonlylookatthe
34、dataavailableintheMEMstage.轉發你只需要看數據在ME版段。(F)11. IntheMIPSpipeline,bothreadingandwritingtheregisterfilecanbedoneduringhalfaclockcycleperiod.Inparticularreadingisdoneinthefirsthalfwhilewritingisdoneinthesecondhalf.在MIPS管道,讀寫寄存器文件可以半個時鐘周期期間完成。在上半年完成特定的閱讀寫作是在下半年完成。(F)12. InTomasulo'salgorithmwithsp
35、eculation,instructionsmaycompleteoutoforder.與投機Tomasulo的算法,說明可能完成的訂單。(F)13. Thereorderbufferenablespreciseexceptionsandinterrupts.重新排序緩沖區支持精確的異常和中斷。(T)14. Criticalwordfirstreducethecachemisspenalty.關鍵字首先減少緩存錯過點球。(T)15. TheLRU(least-recentlyused)replacementpolicyworksbecauseprogramsexhibittemporalloc
36、ality.LRU(最近最少使用)替代政策工作,因為項目展覽時間局部性。(T)16. Adistributedsharedmemory(DSM)multiprocessorusuallyhasnon-uniformmemoryaccess.分布式共享內存(DSM)多處理器通常有非一致內存訪問。(T)17. Computerarchitectureisintendtocoverthreeaffectsofhardware,organizationandISA.計算機體系結構是打算覆蓋硬件的三個影響,組織和ISA。(T)18. Comparedwithmemory-memoryarchitectu
37、re,register-registerarchitecturehashigherCPI.與memory-memory架構相比,注冊登記體系結構具有較高的CPI。(F)19. ForforwardingyouneedonlylookatthedataavailableintheWBStage.轉發你只需要看數據在白平衡階段。(F)20. Datahazardrisewhenaninstructiondependsontheresultsofapreviousinstructioninawaythatisexposedbytheoverlappingofinstructionsinthepipe
38、line.數據風險上升,當一個指令的結果依賴于前一個指令的方式公開的重疊在管道的指令。(T)21. Doublingtheassociativityofacachewithoutchangingitsoverallcapacityorblocksizewillincreasethetagsizebyonebit.翻倍的結合性緩存不改變其整體能力或塊大小將增加標簽的大小。(T)22. TheMIPSCPUhasaRISCISA.(T)23. CPIisalwaysanumbergreaterthanorequalto1,becauseaninstructioncan'tbeexecute
39、dinlessthanonecycle.CPI總是大于或等于1,因為一個指令不能被執行在不到一個周期。(F)24. Splittingtheshorteststageofafive-stagepipelinewillresultinahigherclockrate.分裂的最短階段五級管道將導致更高的時鐘頻率。(F)25. Thereare3typesofpipelinehazards:structure,data,andcontrolhazards.有3種管道危險:結構、數據和控制危害。(T)26. InTomasulo'salgorithmwithspeculation,whenab
40、ranchismispredicted,thedatawrittentomemoryandtheregisterfileasaresultofthatbrancharerolledbacktotheirpreviousvalues.與投機Tomasulo的算法,當一個分支預測錯誤,數據寫入內存和寄存器文件的分支被回滾到之前的值。(T)27. Atwo-bitpredictorperformsbetterthanasinglebitpredictoreveniftheconditionalbranchisexecutedexactlyonce.低廉的預測性能優于單一位預測即使條件分支完全執行一次
41、。(F)28. Adirect-mappedcacheofsizeNhasthesamemissrateasa2-wayset-associativecacheofsizeN/2.direct-mapped緩存大小為N的缺頁率具有相同的雙向set-associative緩存的大小為N/2。(T)29. ACISCarchitecturehasafixedinstructionlength.CISC體系結構有一個固定白指令長度。(F)30. Splittingtheshorteststageofafive-stagepipelinewillresultinahigherclockrate.分裂的
42、最短階段五級管道將導致更高的時鐘頻率。(F)31. Datahazardsarecausedbyhardwareconflict.數據危害是由硬件引起的沖突。(F)32. MergingwriteBufferreducethecachemisspenalty.合并寫緩沖減少緩存錯過點球。(T)33. CPIisalwaysanumbergreaterthanorequalto1,becauseaninstructioncan'tbeexecutedinlessthanonecycle.CPI總是大于或等于1,因為一個指令不能被執行在不到一個周期。()34. Supposeacondit
43、ionalbranchalternatesbetweentakenandnottakeneverytimeitisexecuted.Aone-bitBHTpredictorislikelytohaveamispredictionrateof100%onthisbranch.假設一個條件分支之間的交替而不是采取每次執行時。一個一比特的二叔丁基對甲酚預測可能會對這個分支的錯誤預測率為100%(T)35. Registerrenamingeliminatesstallsduetoflow(WAR)dependencesonregisters.寄存器重命名消除攤位由于流(戰爭)依賴性寄存器。(T)36
44、. Adynamicbranchpredictorisalwaysbetterthanastaticone.一個動態分支預測總是比靜態的好。(F)37. Translationlook-asidebuffers(TLBs)arecachesthatholdvirtualaddresstophysicaladdresstranslations.轉換后援緩沖區(tlb)緩存,虛擬地址到物理地址的翻譯。(T)簡答題(紅色為A卷試題)1、RISC機器的設計原則答:指令條數少、指令功能簡單。確定指令系統時,只選取使用頻度很高的指令,在此基礎上補充一些最有用的指令(如支持操作系統和高級語言實現的指令);采
45、用簡單而又統一的指令格式,并減少尋址方式,指令字長都為32位或64位;指令的執行在單周期內完成(采用流水線技術后);采用load-store結構,即只有load和store指令才能訪問存儲器,其他指令的操作都是在寄存器之間完成的;大多數指令都采用硬連接邏輯來實現;強調優化編譯器的作用,為高級語言程序生成優化的代碼;充分利用流水技術來提高性2、MIPS機器五級流水線(哪五級,每級的功能)答:包括:取指令(IF),指令譯碼/讀寄存器(ID),執行/有效地址計算(EX0,存儲器訪問/分支完成(MEM,寫回(WB。取指令(IF):以PC中的值作為地址從存儲器中取出一條指令,放入指令寄存器(IR);同時
46、PC值加4,然后放入NPC指令譯碼/讀寄存器(ID):對指令進行譯碼,并以指令中的rs和rt字段作為地址訪問通用寄存器組,把讀出的操作數分別放入A和B中。同時IR的低16位進行符號擴展,然后存入Immio在這一級,ALU對在前一級準備好的操作數進行計算。存儲器訪問/分支完成(MEM:所有指令都要在該級進行更新。除了分支指令,其他指令都是做:PONPC在該級處理的指令只有load、store和分支三種指令;寫回(WB:把在前面4級中得到的結果寫入通用寄存器組。3、降低Cache命中時間的方法。(任意列出三種,并給出解釋)答:降低Cache的命中時間:采用容量小、結構簡單的Cache:硬件越簡單,
47、速度就越快。應使Cache容量足夠小,以便可以與處理器做在同一芯片上,避免因片外訪問而增加時間開銷。還要保持Cache結構的簡單性,例如采用直接映像Cache,優點是可以讓標識檢測和數據傳送同時進行,從而有效減少命中時間;采用虛擬Cache:是指直接用虛擬地址進行訪問的Cache,其標識存儲器中存放的是虛擬地址,進行地址檢測用的也是虛擬地址。虛擬Cache的優點:在命中時不需要地址轉換,因而也就省去了地址轉換的時間。另外,即使不命中,地址轉換和訪問Cache也是并行進行的,其速度比物理Cache快很多。采用蹤跡Cache:蹤跡Cache中存放的是CPU所執行過的動態指令序列,其中包含了由分支預測展開了的指令。該分支預測是否正確需要在取到該指令時進行確認。能夠提高指令Cache的空間利用率,避免因分支成功發生跳轉處于該塊之后的指令用不到,跳轉到的塊的位置之前的指令用不到浪費空間。4、什么是Cache的一致性,怎樣維護Cache的一致性。(MS太MES太監聽式協議)答:Cache的一致性:如果允許共享數據進入Cache,就可能出現多個處理器的Cache中都有同一存儲塊的副本的情況,當其中某個處理器對其Cache中的數據進行修改后,就會使得其Cache中的數據與其他Cache
溫馨提示
- 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
- 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯系上傳者。文件的所有權益歸上傳用戶所有。
- 3. 本站RAR壓縮包中若帶圖紙,網頁內容里面會有圖紙預覽,若沒有圖紙預覽就沒有圖紙。
- 4. 未經權益所有人同意不得將文件中的內容挪作商業或盈利用途。
- 5. 人人文庫網僅提供信息存儲空間,僅對用戶上傳內容的表現方式做保護處理,對用戶上傳分享的文檔內容本身不做任何修改或編輯,并不能對任何下載內容負責。
- 6. 下載文件中如有侵權或不適當內容,請與我們聯系,我們立即糾正。
- 7. 本站不保證下載資源的準確性、安全性和完整性, 同時也不承擔用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。
最新文檔
- 2025-2030鐵礦行業競爭格局分析及投資前景與戰略規劃研究報告
- 2025-2030連鎖超市行業競爭格局分析及投資前景與戰略規劃研究報告
- 2025-2030超聲內鏡引導下細針穿刺活檢行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 2025-2030袖珍顯微鏡行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 2025-2030痛經寶顆粒行業市場發展分析及投資前景研究報告
- 2025-2030電子書行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 2025-2030生物食品添加劑市場前景分析及投資策略與風險管理研究報告
- 2025-2030玻璃碳行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 2025-2030游泳衣行業市場現狀供需分析及重點企業投資評估規劃分析研究報告
- 2025-2030洗滌用品行業市場深度調研及前景趨勢與投資研究報告
- 2025年新媒體傳播與營銷知識考試試卷及答案
- 2023-2024學年河北省邯鄲市大名縣一中高一下學期5月月考英語試題及答案
- 2025年視覺傳達設計專業能力考試試題及答案
- 《家具設計》課件
- 國家開放大學2025年《機電控制工程基礎》形考任務1-4答案
- 出納人員面試題及答案
- 2025年隨州國有資本投資運營集團有限公司招聘筆試參考題庫附帶答案詳解
- 低血糖休克護理
- 白內障患者的護理查房
- 古建筑修繕加固施工方案
- 抗生素分級管理規范
評論
0/150
提交評論