FPGA寶貴實(shí)戰(zhàn)經(jīng)驗(yàn)及Verilog編程規(guī)范教案資料_第1頁
FPGA寶貴實(shí)戰(zhàn)經(jīng)驗(yàn)及Verilog編程規(guī)范教案資料_第2頁
FPGA寶貴實(shí)戰(zhàn)經(jīng)驗(yàn)及Verilog編程規(guī)范教案資料_第3頁
FPGA寶貴實(shí)戰(zhàn)經(jīng)驗(yàn)及Verilog編程規(guī)范教案資料_第4頁
FPGA寶貴實(shí)戰(zhàn)經(jīng)驗(yàn)及Verilog編程規(guī)范教案資料_第5頁
已閱讀5頁,還剩10頁未讀 繼續(xù)免費(fèi)閱讀

下載本文檔

版權(quán)說明:本文檔由用戶提供并上傳,收益歸屬內(nèi)容提供方,若內(nèi)容存在侵權(quán),請進(jìn)行舉報(bào)或認(rèn)領(lǐng)

文檔簡介

1、Good is good, but better carries it.精益求精,善益求善。FPGA寶貴實(shí)戰(zhàn)經(jīng)驗(yàn)及Verilog編程規(guī)范-規(guī)范很重要工作過的朋友肯定知道,公司里是很強(qiáng)調(diào)規(guī)范的,特別是對于大的設(shè)計(jì)(無論軟件還是硬件),不按照規(guī)范走幾乎是不可實(shí)現(xiàn)的。邏輯設(shè)計(jì)也是這樣:如果不按規(guī)范做的話,過一個(gè)月后調(diào)試時(shí)發(fā)現(xiàn)有錯(cuò),回頭再看自己寫的代碼,估計(jì)很多信號(hào)功能都忘了,更不要說檢錯(cuò)了;如果一個(gè)項(xiàng)目做了一半一個(gè)人走了,接班的估計(jì)得從頭開始設(shè)計(jì);如果需要在原來的版本基礎(chǔ)上增加新功能,很可能也得從頭來過,很難做到設(shè)計(jì)的可重用性。在邏輯方面,我覺得比較重要的規(guī)范有這些:1.設(shè)計(jì)必須文檔化。要將設(shè)計(jì)思路

2、,詳細(xì)實(shí)現(xiàn)等寫入文檔,然后經(jīng)過嚴(yán)格評審?fù)ㄟ^后才能進(jìn)行下一步的工作。這樣做乍看起來很花時(shí)間,但是從整個(gè)項(xiàng)目過程來看,絕對要比一上來就寫代碼要節(jié)約時(shí)間,且這種做法可以使項(xiàng)目處于可控、可實(shí)現(xiàn)的狀態(tài)。2.代碼規(guī)范。a.設(shè)計(jì)要參數(shù)化。比如一開始的設(shè)計(jì)時(shí)鐘周期是30ns,復(fù)位周期是5個(gè)時(shí)鐘周期,我們可以這么寫:parameterCLK_PERIOD=30;parameterRST_MUL_TIME=5;parameterRST_TIME=RST_MUL_TIME*CLK_PERIOD;.rst_n=1b0;#RST_TIMErst_n=1b1;.#CLK_PERIOD/2clk|/clk|-|-10)禁止

3、用計(jì)數(shù)器分頻后的信號(hào)做其它模塊的時(shí)鐘,而要用改成時(shí)鐘使能的方式,否則這種時(shí)鐘滿天飛的方式對設(shè)計(jì)的可靠性極為不利,也大大增加了靜態(tài)時(shí)序分析的復(fù)雜性。如FPGA的輸入時(shí)鐘是25M的,現(xiàn)在系統(tǒng)內(nèi)部要通過RS232與PC通信,要以rs232_1xclk的速率發(fā)送數(shù)據(jù)。不要這樣做:always(posedgers232_1xclkornegedgerst_n)begin.end而要這樣做:always(posedgeclk_25mornegedgerst_n)begin.elseif(rs232_1xclk=1b1).end11)狀態(tài)機(jī)要寫成3段式的(這是最標(biāo)準(zhǔn)的寫法),即.always(posedge

4、clkornegedgerst_n).current_state=next_state;.always(current_state.).case(current_state).s1:if.next_state=s2;.always(posedgeclkornegedgerst_n).elsea=1b0;c=1b0;c=1b0;/賦默認(rèn)值case(current_state)s1:a=1b0;/由于上面賦了默認(rèn)值,這里就不用再對b、c賦值了(b、c在該狀態(tài)為0,不會(huì)產(chǎn)生鎖存器,下同)s2:b=1b1;s3:c=1b1;default:.3.ALTERA參考設(shè)計(jì)準(zhǔn)則1)EnsureClock,Pr

5、eset,andClearconfigurationsarefreeofglitches.2)NeveruseClocksconsistingofmorethanonelevelofcombinatoriallogic.3)Carefullycalculatesetuptimesandholdtimesformulti-Clocksystems.4)Synchronizesignalsbetweenflipflopsinmulti-Clocksystemswhenthesetupandholdtimerequirementscannotbemet.5)EnsurethatPresetandCl

6、earsignalsdonotcontainraceconditions.6)Ensurethatnootherinternalraceconditionsexist.7)Registerallglitch-sensitiveoutputs.Synchronizeallasynchronousinputs.9)Neverrelyondelaychainsforpin-to-pinorinternaldelays.10)DonotrelyonPower-OnReset.UseamasterResetpintoclearallflipflops.11)Removeanystuckstatesfro

7、mstatemachinesorsynchronouslogic.其它方面的規(guī)范一時(shí)沒有想到,想到了再寫,也歡迎大家補(bǔ)充。=時(shí)序是設(shè)計(jì)出來的我的boss有在華為及峻龍工作的背景,自然就給我們講了一些華為及altera做邏輯的一些東西,而我們的項(xiàng)目規(guī)范,也基本上是按華為的那一套去做。在工作這幾個(gè)月中,給我感觸最深的是華為的那句話:時(shí)序是設(shè)計(jì)出來的,不是仿出來的,更不是湊出來的。在我們公司,每一個(gè)項(xiàng)目都有很嚴(yán)格的評審,只有評審?fù)ㄟ^了,才能做下一步的工作。以做邏輯為例,并不是一上來就開始寫代碼,而是要先寫總體設(shè)計(jì)方案和邏輯詳細(xì)設(shè)計(jì)方案,要等這些方案評審?fù)ㄟ^,認(rèn)為可行了,才能進(jìn)行編碼,一般來說這部分工

8、作所占的時(shí)間要遠(yuǎn)大于編碼的時(shí)間。總體方案主要是涉及模塊劃分,一級模塊和二級模塊的接口信號(hào)和時(shí)序(我們要求把接口信號(hào)的時(shí)序波形描述出來)以及將來如何測試設(shè)計(jì)。在這一級方案中,要保證在今后的設(shè)計(jì)中時(shí)序要收斂到一級模塊(最后是在二級模塊中)。什么意思呢?我們在做詳細(xì)設(shè)計(jì)的時(shí)候,對于一些信號(hào)的時(shí)序肯定會(huì)做一些調(diào)整的,但是這種時(shí)序的調(diào)整最多只能波及到本一級模塊,而不能影響到整個(gè)設(shè)計(jì)。記得以前在學(xué)校做設(shè)計(jì)的時(shí)候,由于不懂得設(shè)計(jì)時(shí)序,經(jīng)常因?yàn)橛幸惶幮盘?hào)的時(shí)序不滿足,結(jié)果不得不將其它模塊信號(hào)的時(shí)序也改一下,搞得人很郁悶。在邏輯詳細(xì)設(shè)計(jì)方案這一級的時(shí)候,我們已經(jīng)將各級模塊的接口時(shí)序都設(shè)計(jì)出來了,各級模塊內(nèi)部是怎

9、么實(shí)現(xiàn)的也基本上確定下來了。由于做到這一點(diǎn),在編碼的時(shí)候自然就很快了,最重要的是這樣做后可以讓設(shè)計(jì)會(huì)一直處于可控的狀態(tài),不會(huì)因?yàn)槟骋惶幍腻e(cuò)誤引起整個(gè)設(shè)計(jì)從頭進(jìn)行。如何提高電路工作頻率對于設(shè)計(jì)者來說,我們當(dāng)然希望我們設(shè)計(jì)的電路的工作頻率(在這里如無特別說明,工作頻率指FPGA片內(nèi)的工作頻率)盡量高。我們也經(jīng)常聽說用資源換速度,用流水的方式可以提高工作頻率,這確實(shí)是一個(gè)很重要的方法,今天我想進(jìn)一步去分析該如何提高電路的工作頻率。我們先來分析下是什么影響了電路的工作頻率。我們電路的工作頻率主要與寄存器到寄存器之間的信號(hào)傳播時(shí)延及clockskew有關(guān)。在FPGA內(nèi)部如果時(shí)鐘走長線的話,clocksk

10、ew很小,基本上可以忽略,在這里為了簡單起見,我們只考慮信號(hào)的傳播時(shí)延的因素。信號(hào)的傳播時(shí)延包括寄存器的開關(guān)時(shí)延、走線時(shí)延、經(jīng)過組合邏輯的時(shí)延(這樣劃分或許不是很準(zhǔn)確,不過對分析問題來說應(yīng)該是沒有可以的),要提高電路的工作頻率,我們就要在這三個(gè)時(shí)延中做文章,使其盡可能的小。我們先來看開關(guān)時(shí)延,這個(gè)時(shí)延是由器件物理特性決定的,我們沒有辦法去改變,所以我們只能通過改變走線方式和減少組合邏輯的方法來提高工作頻率。1.通過改變走線的方式減少時(shí)延。以altera的器件為例,我們在quartus里面的timingclosurefloorplan可以看到有很多條條塊塊,我們可以將條條塊塊按行和按列分,每一個(gè)

11、條塊代表1個(gè)LAB,每個(gè)LAB里有8個(gè)或者是10個(gè)LE。它們的走線時(shí)延的關(guān)系如下:同一個(gè)LAB中(最快)同列或者同行不同行且不同列。我們通過給綜合器加適當(dāng)?shù)募s束(不可貪心,一般以加5%裕量較為合適,比如電路工作在100Mhz,則加約束加到105Mhz就可以了,貪心效果反而不好,且極大增加綜合時(shí)間)可以將相關(guān)的邏輯在布線時(shí)盡量布的靠近一點(diǎn),從而減少走線的時(shí)延。(注:約束的實(shí)現(xiàn)不完全是通過改進(jìn)布局布線方式去提高工作頻率,還有其它的改進(jìn)措施)2.通過減少組合邏輯的減少時(shí)延。上面我們講了可以通過加約束來提高工作頻率,但是我們在做設(shè)計(jì)之初可萬萬不可將提高工作頻率的美好愿望寄托在加約束上,我們要通過合理的

12、設(shè)計(jì)去避免出現(xiàn)大的組合邏輯,從而提高電路的工作頻率,這才能增強(qiáng)設(shè)計(jì)的可移植性,才可以使得我們的設(shè)計(jì)在移植到另一同等速度級別的芯片時(shí)還能使用。我們知道,目前大部分FPGA都基于4輸入LUT的,如果一個(gè)輸出對應(yīng)的判斷條件大于四輸入的話就要由多個(gè)LUT級聯(lián)才能完成,這樣就引入一級組合邏輯時(shí)延,我們要減少組合邏輯,無非就是要輸入條件盡可能的少,這樣就可以級聯(lián)的LUT更少,從而減少了組合邏輯引起的時(shí)延。我們平時(shí)聽說的流水就是一種通過切割大的組合邏輯(在其中插入一級或多級D觸發(fā)器,從而使寄存器與寄存器之間的組合邏輯減少)來提高工作頻率的方法。比如一個(gè)32位的計(jì)數(shù)器,該計(jì)數(shù)器的進(jìn)位鏈很長,必然會(huì)降低工作頻率

13、,我們可以將其分割成4位和8位的計(jì)數(shù),每當(dāng)4位的計(jì)數(shù)器計(jì)到15后觸發(fā)一次8位的計(jì)數(shù)器,這樣就實(shí)現(xiàn)了計(jì)數(shù)器的切割,也提高了工作頻率。在狀態(tài)機(jī)中,一般也要將大的計(jì)數(shù)器移到狀態(tài)機(jī)外,因?yàn)橛?jì)數(shù)器這東西一般是經(jīng)常是大于4輸入的,如果再和其它條件一起做為狀態(tài)的跳變判據(jù)的話,必然會(huì)增加LUT的級聯(lián),從而增大組合邏輯。以一個(gè)6輸入的計(jì)數(shù)器為例,我們原希望當(dāng)計(jì)數(shù)器計(jì)到111100后狀態(tài)跳變,現(xiàn)在我們將計(jì)數(shù)器放到狀態(tài)機(jī)外,當(dāng)計(jì)數(shù)器計(jì)到111011后產(chǎn)生個(gè)enable信號(hào)去觸發(fā)狀態(tài)跳變,這樣就將組合邏輯減少了。上面說的都是可以通過流水的方式切割組合邏輯的情況,但是有些情況下我們是很難去切割組合邏輯的,在這些情況下我

14、們又該怎么做呢?狀態(tài)機(jī)就是這么一個(gè)例子,我們不能通過往狀態(tài)譯碼組合邏輯中加入流水。如果我們的設(shè)計(jì)中有一個(gè)幾十個(gè)狀態(tài)的狀態(tài)機(jī),它的狀態(tài)譯碼邏輯將非常之巨大,毫無疑問,這極有可能是設(shè)計(jì)中的關(guān)鍵路徑。那我們該怎么做呢?還是老思路,減少組合邏輯。我們可以對狀態(tài)的輸出進(jìn)行分析,對它們進(jìn)行重新分類,并根據(jù)這個(gè)重新定義成一組組小狀態(tài)機(jī),通過對輸入進(jìn)行選擇(case語句)并去觸發(fā)相應(yīng)的小狀態(tài)機(jī),從而實(shí)現(xiàn)了將大的狀態(tài)機(jī)切割成小的狀態(tài)機(jī)。在ATA6的規(guī)范中(硬盤的標(biāo)準(zhǔn)),輸入的命令大概有20十種,每一個(gè)命令又對應(yīng)很多種狀態(tài),如果用一個(gè)大的狀態(tài)機(jī)(狀態(tài)套狀態(tài))去做那是不可想象的,我們可以通過case語句去對命令進(jìn)行

15、譯碼,并觸發(fā)相應(yīng)的狀態(tài)機(jī),這樣做下來這一個(gè)模塊的頻率就可以跑得比較高了。總結(jié):提高工作頻率的本質(zhì)就是要減少寄存器到寄存器的時(shí)延,最有效的方法就是避免出現(xiàn)大的組合邏輯,也就是要盡量去滿足四輸入的條件,減少LUT級聯(lián)的數(shù)量。我們可以通過加約束、流水、切割狀態(tài)的方法提高工作頻率。=做邏輯的難點(diǎn)在于系統(tǒng)結(jié)構(gòu)設(shè)計(jì)和仿真驗(yàn)證剛?cè)ス镜臅r(shí)候BOSS就和我講,做邏輯的難點(diǎn)不在于RTL級代碼的設(shè)計(jì),而在于系統(tǒng)結(jié)構(gòu)設(shè)計(jì)和仿真驗(yàn)證方面。目前國內(nèi)對可綜合的設(shè)計(jì)強(qiáng)調(diào)的比較多,而對系統(tǒng)結(jié)構(gòu)設(shè)計(jì)和仿真驗(yàn)證方面似乎還沒有什么資料,這或許也從一個(gè)側(cè)面反映了國內(nèi)目前的設(shè)計(jì)水平還比較低下吧。以前在學(xué)校的時(shí)候,總是覺得將RTL級代碼

16、做好就行了,仿真驗(yàn)證只是形式而已,所以對HDL的行為描述方面的語法不屑一顧,對testbench也一直不愿意去學(xué)-因?yàn)橛X得畫波形圖方便;對于系統(tǒng)結(jié)構(gòu)設(shè)計(jì)更是一點(diǎn)都不懂了。到了公司接觸了些東西才發(fā)現(xiàn)完全不是這樣。其實(shí)在國外,花在仿真驗(yàn)證上的時(shí)間和人力大概是花在RTL級代碼上的兩倍,現(xiàn)在仿真驗(yàn)證才是百萬門級芯片設(shè)計(jì)的關(guān)鍵路徑。仿真驗(yàn)證的難點(diǎn)主要在于怎么建模才能完全和準(zhǔn)確地去驗(yàn)證設(shè)計(jì)的正確性(主要是提高代碼覆蓋),在這過程中,驗(yàn)證速度也是很重要的。驗(yàn)證說白了也就是怎么產(chǎn)生足夠覆蓋率的激勵(lì)源,然后怎么去檢測錯(cuò)誤。我個(gè)人認(rèn)為,在仿真驗(yàn)證中,最基本就是要做到驗(yàn)證的自動(dòng)化。這也是為什么我們要寫testben

17、ch的原因。在我現(xiàn)在的一個(gè)設(shè)計(jì)中,每次跑仿真都要一個(gè)小時(shí)左右(這其實(shí)算小設(shè)計(jì))由于畫波形圖無法做到驗(yàn)證自動(dòng)化,如果用通過畫波形圖來仿真的話,一是畫波形會(huì)畫死(特別是對于算法復(fù)雜的、輸入呈統(tǒng)計(jì)分布的設(shè)計(jì)),二是看波形圖要看死,三是檢錯(cuò)率幾乎為零。那么怎么做到自動(dòng)化呢?我個(gè)人的水平還很有限,只能簡單地談下BFM(busfunctionmodel,總線功能模型)。以做一個(gè)MAC的core為例(背板是PCI總線),那么我們需要一個(gè)MAC_BFM和PCI_BFM及PCI_BM(PCIbehaviormodel)。MAC_BFM的主要功能是產(chǎn)生以太網(wǎng)幀(激勵(lì)源),隨機(jī)的長度和幀頭,內(nèi)容也是隨機(jī)的,在發(fā)送的

18、同時(shí)也將其復(fù)制一份到PCI_BM中;PCI_BFM的功能則是仿PCI總線的行為,比如被測收到了一個(gè)正確幀后會(huì)向PCI總線發(fā)送一個(gè)請求,PCI_BFM則會(huì)去響應(yīng)它,并將數(shù)據(jù)收進(jìn)來;PCI_BM的主要功能是將MAC_BFM發(fā)送出來的東西與PCI_BFM接收到的東西做比較,由于它具有了MAC_BFM的發(fā)送信息和PCI_BFM的接收信息,只要設(shè)計(jì)合理,它總是可以自動(dòng)地、完全地去測試被測是否工作正常,從而實(shí)現(xiàn)自動(dòng)檢測。華為在仿真驗(yàn)證方面估計(jì)在國內(nèi)來說是做的比較好的,他們已建立起了比較好的驗(yàn)證平臺(tái),大部分與通信有關(guān)的BFM都做好了,聽我朋友說,現(xiàn)在他們只需要將被測放在測試平臺(tái)中,并配置好參數(shù),就可以自動(dòng)地檢測被測功能的正確與否。在功能仿真做完后,由于我們做在是FPGA的設(shè)計(jì),在設(shè)計(jì)時(shí)已經(jīng)基本保證RTL級代碼在綜合結(jié)果和功能仿真結(jié)果的一致性,只要綜合布局布線后的靜態(tài)時(shí)序報(bào)告沒有違反時(shí)序約束的警告,就可以下到板子上去調(diào)試了。事實(shí)上,在華為中興,他們做FPG

溫馨提示

  • 1. 本站所有資源如無特殊說明,都需要本地電腦安裝OFFICE2007和PDF閱讀器。圖紙軟件為CAD,CAXA,PROE,UG,SolidWorks等.壓縮文件請下載最新的WinRAR軟件解壓。
  • 2. 本站的文檔不包含任何第三方提供的附件圖紙等,如果需要附件,請聯(lián)系上傳者。文件的所有權(quán)益歸上傳用戶所有。
  • 3. 本站RAR壓縮包中若帶圖紙,網(wǎng)頁內(nèi)容里面會(huì)有圖紙預(yù)覽,若沒有圖紙預(yù)覽就沒有圖紙。
  • 4. 未經(jīng)權(quán)益所有人同意不得將文件中的內(nèi)容挪作商業(yè)或盈利用途。
  • 5. 人人文庫網(wǎng)僅提供信息存儲(chǔ)空間,僅對用戶上傳內(nèi)容的表現(xiàn)方式做保護(hù)處理,對用戶上傳分享的文檔內(nèi)容本身不做任何修改或編輯,并不能對任何下載內(nèi)容負(fù)責(zé)。
  • 6. 下載文件中如有侵權(quán)或不適當(dāng)內(nèi)容,請與我們聯(lián)系,我們立即糾正。
  • 7. 本站不保證下載資源的準(zhǔn)確性、安全性和完整性, 同時(shí)也不承擔(dān)用戶因使用這些下載資源對自己和他人造成任何形式的傷害或損失。

最新文檔

評論

0/150

提交評論