流水線
這里先用通俗易懂的語(yǔ)言描述一下流水線設(shè)計(jì)思想。假設(shè)小A要從成都到哈爾濱旅游,如果直接坐火車過(guò)去恐怕要累得受不了;如果在旅程中間加幾站,比如到西安、北京、天津找個(gè)客棧休息一下,路上就更加精力充沛了。
對(duì)于信號(hào)而言也是一樣,加入一個(gè)狀態(tài)為1的信號(hào)x需要從寄存器A傳輸?shù)郊拇嫫鰾,這條路線上只有組合邏輯(沒有休息的地方),那么x必須保證在路上的時(shí)間保持1不變,如果傳到一半值變?yōu)?了那就出錯(cuò)了。所以,A到B的延時(shí)就決定了系統(tǒng)的工作頻率不能高于多少(否則會(huì)出錯(cuò)),系統(tǒng)的最大工作頻率也是由最長(zhǎng)路徑上的延時(shí)決定的。
但是,假設(shè)在A到B這條路上,增加幾個(gè)寄存器(信號(hào)休息的“客棧”),相當(dāng)于將路徑拆分為幾段,信號(hào)x就不必再害怕丟失狀態(tài)??s短了路徑,也就縮短了延時(shí),也就提高了系統(tǒng)可以工作的最高頻率。這個(gè)過(guò)程就稱作“設(shè)計(jì)流水線化”。
無(wú)流水的FIR濾波器設(shè)計(jì)
1.搭建模型
《FPGA數(shù)字信號(hào)處理系列》中詳細(xì)討論過(guò)各種FIR濾波器的實(shí)現(xiàn)方法。本設(shè)計(jì)采用直接型FIR濾波器,并行結(jié)構(gòu),在Simulink中添加block按下圖連接:

上面的設(shè)計(jì)與本系列第2篇中的設(shè)計(jì)基本相同,除了將Digital FIR Filter替換為了自己設(shè)計(jì)的子系統(tǒng)。子系統(tǒng)設(shè)計(jì)方法如下:先按照直接型FIR結(jié)構(gòu)連接好各個(gè)block(如下圖),將所有的block選中,點(diǎn)擊Simulink工具欄的Diagram->Subsystem&Model Reference->Create subsystem from selection。

濾波器系數(shù)與本系列第2篇中相同,系統(tǒng)設(shè)置20MHz采樣率,1.5MHz通帶截止頻率、8.5MHz阻帶截止頻率,對(duì)1MHz+9MHz的疊加信號(hào)濾波。上圖中所有加法器(AddSub)和乘法器(Mult)中的Latency都為0,即純組合邏輯。
為了System Generator在時(shí)序分析時(shí)檢測(cè)到整個(gè)系統(tǒng)的時(shí)序,在FIR濾波器的輸入和輸出部分增加了一個(gè)Delay單元(在HDL模型中相當(dāng)于寄存器)。
2.仿真驗(yàn)證與時(shí)序分析
運(yùn)行仿真,濾波前后頻譜結(jié)果如下,與第2篇中基本相同,濾除了9Mhz的頻率分量,只留下了1MHz的正弦波信號(hào):

點(diǎn)擊System Generator block中的Generate,運(yùn)行時(shí)序分析:

可以看到整個(gè)設(shè)計(jì)中最長(zhǎng)的路徑包含了1個(gè)乘法器和10個(gè)加法器,即直接從濾波器的輸入到數(shù)據(jù),線路延時(shí)有20.418ns,即系統(tǒng)最高運(yùn)行頻率不到50Mhz。
加法器流水線化
1.搭建模型
接下來(lái)將該設(shè)計(jì)流水線處理,來(lái)提高系統(tǒng)的運(yùn)行速度。首先將加法器流水線化,有兩種方法可以選擇:1.在加法器之間加入Delay模塊;2.將加法器的Latency設(shè)置為1,即一級(jí)流水。本設(shè)計(jì)采用更方便的第2中方法,修改子系統(tǒng)按下圖連接:

Vivado中絕大多數(shù)IP核都是可以流水線化的,通過(guò)設(shè)置Latency實(shí)現(xiàn)。需要清楚的是,當(dāng)加法器的輸出有延時(shí)之后(需要計(jì)算時(shí)間),加法器同抽頭延時(shí)鏈之間的數(shù)據(jù)就不同步了,必須做如下修改:
加法器增加了一級(jí)延時(shí),抽頭延時(shí)鏈相應(yīng)也要多增加一級(jí)延時(shí),即將Delay模塊的Latency設(shè)置為2;
FIR結(jié)構(gòu)中在第一個(gè)乘法器的輸出部分省略了一個(gè)加法器(相當(dāng)于第一個(gè)乘法器的結(jié)果+0),因此為了數(shù)據(jù)同步需要增加一個(gè)延遲為1的delay block。
2.時(shí)序分析
運(yùn)行仿真,結(jié)果與上面相同,表明設(shè)計(jì)正確。再次點(diǎn)擊System Generator block中的Generate,重新導(dǎo)出設(shè)計(jì)并運(yùn)行時(shí)序分析:

我們可以看到,在加法器流水線化之后(相當(dāng)于加法器的輸出結(jié)果會(huì)用一級(jí)寄存器緩存),整個(gè)設(shè)計(jì)中的最長(zhǎng)路徑變?yōu)榱俗詈蟮?個(gè)乘法器+1個(gè)加法器,該路徑延時(shí)降低為了8.079ns,相當(dāng)于系統(tǒng)最高頻率提升到了大約125Mhz,比上一個(gè)設(shè)計(jì)提高了2倍多。
乘法器流水線化
1.搭建模型
既然上一個(gè)設(shè)計(jì)中的最長(zhǎng)路徑中包含一個(gè)純組合邏輯的乘法器,那我們就把乘法器也流水線化,再把路徑做進(jìn)一步拆分好了。將乘法器的Latency設(shè)置為3(表示三級(jí)流水),子系統(tǒng)連接圖為:

2.時(shí)序分析
運(yùn)行仿真,結(jié)果與上面相同,表明設(shè)計(jì)正確。再次點(diǎn)擊System Generator block中的Generate,重新導(dǎo)出設(shè)計(jì)并運(yùn)行時(shí)序分析:

我們可以看到,在乘法器三級(jí)流水線化之后(相當(dāng)于在計(jì)算乘法的整個(gè)過(guò)程中插入了三級(jí)寄存器作為緩存),整個(gè)設(shè)計(jì)中的最長(zhǎng)路徑變?yōu)榱顺朔ㄆ鞯妮敵龅郊臃ㄆ鬟@一段(不包含乘法運(yùn)算),該路徑延時(shí)降低為了3.401ns,相當(dāng)于系統(tǒng)最高頻率提升到了大約294Mhz,比最初的設(shè)計(jì)已經(jīng)提高了大約6倍。
最后
總而言之,流水線化就是拆分組合邏輯路徑,在路徑中插入寄存器緩存中間結(jié)果的過(guò)程。當(dāng)一個(gè)設(shè)計(jì)不滿足我們期望的工作頻率時(shí),就需要從其延時(shí)最長(zhǎng)的路徑開始分析,將路徑劃分為多段,中間插入寄存器緩存。當(dāng)然,流水線化會(huì)增加額外的資源消耗,選擇“面積”還是選擇“速度”正是設(shè)計(jì)者需要作出的考量。
原文標(biāo)題:FPGA學(xué)習(xí)-流水線設(shè)計(jì)方法詳解
文章出處:【微信公眾號(hào):FPGA設(shè)計(jì)論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
審核編輯:湯梓紅
-
FPGA
+關(guān)注
關(guān)注
1650文章
22217瀏覽量
628002 -
濾波器
+關(guān)注
關(guān)注
162文章
8220瀏覽量
184298 -
FIR
+關(guān)注
關(guān)注
4文章
151瀏覽量
34936
原文標(biāo)題:FPGA學(xué)習(xí)-流水線設(shè)計(jì)方法詳解
文章出處:【微信號(hào):gh_9d70b445f494,微信公眾號(hào):FPGA設(shè)計(jì)論壇】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
如何設(shè)計(jì)低通FIR濾波器
怎么利用FPGA實(shí)現(xiàn)FIR濾波器?
FIR濾波器的特性是什么
什么是fir數(shù)字濾波器 什么叫FIR濾波器
基于流水線技術(shù)的并行高效FIR濾波器設(shè)計(jì)
基于流水線的并行FIR濾波器設(shè)計(jì)
高階FIR正交鏡像濾波器的設(shè)計(jì)
詳解FIR濾波器和IIR濾波器的區(qū)別
基于FPGA的硬件加速器的FIR流水結(jié)構(gòu)濾波器實(shí)現(xiàn)、設(shè)計(jì)及驗(yàn)證
線性相位FIR濾波器設(shè)計(jì)
FIR濾波器的FPGA設(shè)計(jì)與實(shí)現(xiàn)

無(wú)流水的FIR濾波器設(shè)計(jì)
評(píng)論