開始之前,我們首先來看一下什么是時鐘門控(clock gating)技術(shù),顧名思義就是利用邏輯門技術(shù)控制時鐘的通斷。
那么為什么需要控制時鐘的通斷呢?主要基于以下幾個原因。首先,隨著工藝的發(fā)展和設(shè)計(jì)規(guī)模的增大,時鐘樹上產(chǎn)生的功耗占整個SoC功耗的比例越來越高,有時幾乎能占到50%左右。關(guān)于時鐘樹,可能前端的同學(xué)不熟悉,簡單說幾句,SoC的時鐘一般是參考時鐘經(jīng)過PLL和數(shù)字分頻器輸出的,后面可能要連接驅(qū)動成千上萬的寄存器clock端。
這時候任何一個單一的cell都不可能有這么大的驅(qū)動能力,因此要插入大量的buffer,而且為了保證到每個寄存器的延時一樣,clock tree還要做balance。整個的時鐘樹大概長成下圖這樣,第一級buffer叫root,中間的buffer叫branch,最后一級的buffer叫l(wèi)eaf:

圖1 時鐘樹示意圖
如果我們的芯片在不工作時,PLL依然有clock輸出的話,那整個時鐘樹依然產(chǎn)生很大的功耗。
接下來我們再看一下邊沿觸發(fā)器的結(jié)構(gòu)圖。從圖上我們能看出即使D端保持不動,clock端變化也會消耗一些能量。想深入研究的同學(xué)可自行推導(dǎo)(可以忽略兩個復(fù)位信號)。

圖2 邊沿D觸發(fā)器
那么當(dāng)D端長時間不變時,是不是可以把CP端的變化隔離掉以降低功耗呢?答案是肯定的。
最簡單的辦法就是把clock信號和一個EN信號做“與”操作,如下圖:

圖3 簡單的時鐘門控邏輯
這個方法雖然簡單,但是如果我們不能保證EN信號相對clock的到來時間和保持時間,那么就很可能不能產(chǎn)生門控時鐘或者產(chǎn)生毛刺(glitch)。為了解決這個問題,人們提出了基于鎖存器的時鐘門控邏輯。由于鎖存器能捕捉到EN信號并使它保持到產(chǎn)生完整的時鐘脈沖,因此EN信號只需要在時鐘活躍沿附近保持穩(wěn)定即可。使用這種技術(shù),每次只需要改變門的一個輸入端來打開或關(guān)閉時鐘就能保證電路的輸出不含有任何毛刺或者尖峰脈沖了。

圖4 基于鎖存器的時鐘門控
現(xiàn)在的芯片生產(chǎn)商會提供時鐘門控的標(biāo)準(zhǔn)單元,為了DFT測試的需要,標(biāo)準(zhǔn)門控單元還會帶著test_en這種輸入信號,今天為了不跑題就不介紹相關(guān)內(nèi)容了。
接下來就是架構(gòu)師和邏輯設(shè)計(jì)工程師關(guān)心的問題了,怎么設(shè)計(jì)門控邏輯。在SoC設(shè)計(jì)中,可以實(shí)現(xiàn)三種粒度的時鐘門控設(shè)計(jì),首先是粗粒度的設(shè)計(jì),架構(gòu)師要決定如何在時鐘產(chǎn)生單元增加門控邏輯,根據(jù)SoC工作情況來判決是否關(guān)斷某個時鐘輸出。這里提供一個思路,先根據(jù)功能劃分出clock domain,然后再根據(jù)每個模塊/IP之間的關(guān)系制定一張表,用于決定每個時鐘域的開啟和關(guān)閉狀態(tài)。
有了這張表就相當(dāng)于有了一個狀態(tài)機(jī),根據(jù)狀態(tài)機(jī)的當(dāng)前狀態(tài)決定時鐘是否關(guān)閉。至于狀態(tài)跳轉(zhuǎn)的判決,可以是硬判決也可以是軟判決。硬判決的好處是相對速度快;缺點(diǎn)是靈活性較差,而且設(shè)計(jì)相對復(fù)雜,往往需要模塊/IP有接口信號可用。軟判決剛好相反,優(yōu)點(diǎn)是靈活性高;缺點(diǎn)是延遲比較大,不適于頻繁開關(guān),對于某些設(shè)計(jì)來說,實(shí)現(xiàn)軟判決還要增加處理器,畢竟不是所有SoC都有CPU/MCU/DSP的。
其次是中等粒度的設(shè)計(jì),模塊設(shè)計(jì)師來決定是否關(guān)斷內(nèi)部子模塊的時鐘輸入。這里沒啥好說的,完全取決于模塊的功能和實(shí)現(xiàn)方案了。
最后,可以在邏輯綜合階段,由綜合工具自動插入門控單元。前面兩條依賴具體設(shè)計(jì),最后一條不完全依賴設(shè)計(jì),再多說幾句。如果RTL代碼寫成下圖左邊的樣子,在邏輯綜合時不打開插CG的選項(xiàng),綜合出的電路如中圖所示;而打開插入CG的選項(xiàng),就會綜合出下圖右邊的電路。由于CG單元本身也會產(chǎn)生功耗,一般一個CG單元后面要接多個寄存器才能達(dá)到節(jié)省功耗的效果。一般在綜合時會通過選項(xiàng)選擇3或4個。

圖5 綜合插入CG的示意圖
對于綜合工具,其插入CG的判定很簡單,就是看有沒有上圖代碼中的enbale邏輯。如果沒有就不插。所以如果邏輯設(shè)計(jì)師想要寫出滿足低功耗需求的RTL代碼,就要盡量在代碼中使用類似上圖的enable邏輯??赡苡邢矚g刨根問底的同學(xué)要提問了“如果我的某段邏輯就沒有enable怎么辦?”這種情況下,可以試著向前或者向后找一找,有沒有哪些邏輯可以借用過來。比如下圖例子,綠色虛線代表可以增加的邏輯。RTL低功耗設(shè)計(jì)方法有很多,大家可以百度一下,或者等我以后寫(此處有坑)。

圖6 前向借用邏輯產(chǎn)生時鐘門控信號
最后,要說明一個關(guān)于clock gating的誤區(qū)。時鐘門控固然可以節(jié)省功耗,但并不是越多越好。當(dāng)CG cell達(dá)到一定數(shù)量時,再增加CG cell對功耗節(jié)省的效果就不明顯了。而且如前面所說,CG cell本身也是要產(chǎn)生功耗的,數(shù)量太多的話肯定要消耗不少,而且還會占用大量的面積,過猶不及。(再一次體現(xiàn)出做SoC的balance藝術(shù),還是那句話,沒有完美的SoC,只有完美的tradeoff)

圖7 CG數(shù)量與節(jié)省功耗的關(guān)系
結(jié)束前總結(jié)一下,clock gating技術(shù)對整體SoC設(shè)計(jì)的影響。
表1 低功耗技術(shù)總結(jié)

-
寄存器
+關(guān)注
關(guān)注
31文章
5587瀏覽量
128984 -
分頻器
+關(guān)注
關(guān)注
43文章
536瀏覽量
52240 -
SoC設(shè)計(jì)
+關(guān)注
關(guān)注
1文章
151瀏覽量
19470 -
時鐘門控
+關(guān)注
關(guān)注
0文章
8瀏覽量
7034 -
PLL電路
+關(guān)注
關(guān)注
0文章
94瀏覽量
7018
發(fā)布評論請先 登錄
XOR自門控與時鐘門控的不同之處
fpga門控時鐘問題
什么是時鐘門控?如何去實(shí)線時鐘門控的設(shè)計(jì)呢
基于門控時鐘的CMOS電路低功耗設(shè)計(jì)
門控時鐘與時鐘偏移研究
通常有兩種不同的時鐘門控實(shí)現(xiàn)技術(shù)
什么是門控時鐘 門控時鐘降低功耗的原理
門控時鐘實(shí)現(xiàn)低功耗的原理
什么是門控時鐘?如何生成門控時鐘?
時鐘門控的作用
一文詳解門控時鐘
FPGA原型驗(yàn)證系統(tǒng)的時鐘門控
FPGA原型平臺門控時鐘自動轉(zhuǎn)換
為什么需要時鐘門控?時鐘門控終極指南

什么是時鐘門控技術(shù)?為什么需要控制時鐘的通斷呢?
評論