99热国产女同,91精品欧美激情,噜噜吧噜吧噜吧噜噜网a

在絕大部分使用電池供電和插座供電的系統(tǒng)中，功耗成為需要考慮的第一設(shè)計要素。Xilinx決定使用20nm工藝的UltraScale器件來直面功耗設(shè)計的挑戰(zhàn)，本文描述了在未來的系統(tǒng)設(shè)計中，使用Xilinx 20nm工藝的UltraScale FPGA來降低功耗的19種途徑。

1、制造工藝：TSMC使用20SoC工藝來生產(chǎn)Xilinx 20nm的UltraScale器件，該工藝采用TSMC第二代gate-last HKMG（high-K絕緣層+金屬柵極）技術(shù)和第三代SiGe （silicon-germanium）應(yīng)變技術(shù)來實現(xiàn)在低功耗時提高性能。跟TSMC 28nm工藝相比，20SoC工藝技術(shù)能做到器件密度增加1.9倍，同時速度提升30%。

2、電壓調(diào)整：TSMC 20SoC工藝有兩種模式，一種是高性能模式（Vcc = 0.95V），還有一種是低功耗模式（Vcc = 0.9V）。20SoC高性能模式與TSMC 28HP和28HPL工藝相比，能提供更高的性能以及更低的靜態(tài)功耗。低功耗模式跟TSMC 28HP工藝相比，靜態(tài)功耗要低65%，使用TSMC 20SoC工藝制造的器件的Vcc空間使得Xilinx能選擇功耗分布曲線上的合適的部分，即在Vcc降低到0.9V時，在性能上仍然有不錯的表現(xiàn)，但此時的動態(tài)功耗卻可以下降大約10%。

使用Xilinx 20nm工藝的UltraScale FPGA來降低功耗的19種途徑

20nm工藝UltraScale器件，性能和功耗對比：非常顯著的優(yōu)勢

3、選擇功耗最低的器件：Xilinx 20nm UltraScale FPGA中，在0.95V或者0.9V下都可以工作的器件被定義為-1L，這是基于它們在0.95V下的速度等級來定義的。-1L UltraScale器件的性能和0.95V，速度等級為-1的器件性能相同，和工作在0.9V，速度等級為-1的器件性能也一致，但是-1L的定義表示，這類器件的靜態(tài)功耗是特別低。在0.9V時，光是Vcc的下降就可以使得靜態(tài)功耗下降大約30%。相比其他UltraScale FPGA器件，Xilinx對-1L器件的速度和漏電有著更加嚴(yán)格的定義標(biāo)準(zhǔn)，換句話說，只有那些漏電最低、性能最高的UltraScale器件才能稱為-1L器件。

4、管理3D IC的工藝變動：20nm UltraScale FPGA規(guī)模較大，實際上是3D IC，采用了Xilinx第二代堆疊硅片互聯(lián)（SSI）技術(shù)，它可以把一個封裝里的多個FPGA die連接起來。Xilinx通過在一個封裝中組合較高和較低漏電的die（都在說明書中）來控制整個3D IC的靜態(tài)漏電功耗，結(jié)果是整個封裝器件的漏電功耗要遠(yuǎn)遠(yuǎn)低于只使用一個die（具備相同可編程邏輯容量）的封裝。

5、通過3D IC集成來縮減I/O功耗：和傳統(tǒng)的多芯片設(shè)計相比，在具備相同的I/O帶寬的情況下，基于SSI的3D IC技術(shù)可以使I/O互連功耗減小100倍。這個激動人心的結(jié)果就是通過把所有的連接都保留在芯片內(nèi)部來實現(xiàn)的，與把信號驅(qū)動到芯片外部相比，這種做法的功耗顯著降低，這種設(shè)計理念可以在低功耗的情況下獲得令人難以置信的高速度。

6、低功耗設(shè)計不僅僅停留在工藝級別：在20nm工藝節(jié)點上，Xilinx從每一個角度去聚焦功耗效率?；趧討B(tài)功耗能減少的百分比，Xilinx對很多選項都進(jìn)行了評估，每一項都會產(chǎn)生相應(yīng)的風(fēng)險以及實現(xiàn)的時間。每一個降低功耗的技術(shù)，它在性能、成本、設(shè)計流程方法以及總體進(jìn)度方面的影響也會被評估，被挑選出來的選項最終實現(xiàn)在所有Xilinx 20nm UltraScale器件中。

7、類似ASIC的時鐘設(shè)計使得功耗降低：跟所有以往的FPGA架構(gòu)相比，UltraScale架構(gòu)中的時鐘布線和時鐘buffer進(jìn)行了徹底地重新設(shè)計，可以提供更大程度的靈活性。在縱橫兩個方向上，大量的時鐘布線和時鐘分布路徑產(chǎn)生了許許多多的全局時鐘buffer，數(shù)量是以往架構(gòu)中的20倍以上，那個架構(gòu)有著無數(shù)個布局的選項。實際上，在一個UltraScale FPGA中，時鐘網(wǎng)絡(luò)的“中心點”（時鐘偏移開始累積的起始點）可以被放在任何一個時鐘域。和ASIC相同的是，哪里需要時鐘，哪里的時鐘網(wǎng)絡(luò)才開始工作。UltraScale架構(gòu)可以向可編程邏輯設(shè)備提供偏移最小、性能最快的時鐘網(wǎng)絡(luò)，這些時鐘網(wǎng)絡(luò)只有在源需要向目的發(fā)送時鐘信號時才產(chǎn)生功耗。

使用Xilinx 20nm工藝的UltraScale FPGA來降低功耗的19種途徑

UltraScale 類ASIC時鐘設(shè)計

8、精細(xì)化的時鐘門控：可以通過精細(xì)化的時鐘門控技術(shù)來進(jìn)一步降低動態(tài)時鐘功耗。在一個設(shè)計中，當(dāng)相關(guān)邏輯不需要工作的時候，可以動態(tài)門控關(guān)閉時鐘驅(qū)動。這個特性可以靜態(tài)或者以一個時鐘周期的粒度來動態(tài)執(zhí)行。最大的20nm UltraScale器件中，除了常見的全局門控時鐘之外，還有數(shù)以千計的末梢門控時鐘。時鐘樹功耗（CV2f）實際上大部分是發(fā)生在橫向buffer和時鐘樹末梢時鐘這一級，因為在這一級上，驅(qū)動了數(shù)以千計的負(fù)載，這一級上的時鐘門控可以使得動態(tài)功耗消減非常明顯。另外，降低扇出可以減小時鐘buffer功耗，因為這個時候，時鐘buffer僅僅驅(qū)動幾個負(fù)載，這也能降低時鐘樹的功耗。因為有著大量的可門控的時鐘，一些基于20nm UltraScale器件的設(shè)計可以節(jié)省10-15%的時鐘樹功耗，當(dāng)然，這還要取決于時鐘的使能率。

9、充分使用每一個CLB來減少CLB的使用數(shù)量：UltraScale架構(gòu)采用了加強的可配置邏輯單元（CLB），可以效率更高地使用這些可用的CLB資源。對于可能的封裝選項而言，CLB結(jié)構(gòu)上的許多改變提供了更多的靈活性。每一個6-輸入LUT都是由兩個觸發(fā)器組成，每個觸發(fā)器都有專用的輸入和輸出信號，使得一個CLB中的所有部件既可以一起使用，也可以完全獨立?？刂菩盘栐跀?shù)量和靈活性上的提高使得觸發(fā)器更加易用，包括：可用的時鐘使能信號數(shù)量翻倍；可選擇“忽略”時鐘使能和復(fù)位端口的輸入；可選擇復(fù)位信號反向，使得同一個CLB中的觸發(fā)器的復(fù)位信號電平既可以是高有效，也可以是低有效；一個額外的時鐘信號用于移位寄存器和分布式RAM?？偠灾?，這些加強特性可以讓Vivado設(shè)計套件把更多的設(shè)計部件（經(jīng)常是在功能上相互沒有關(guān)系）封裝在一個CLB中。通過對器件總體利用上的最大化來消耗盡可能最低的功耗。

使用Xilinx 20nm工藝的UltraScale FPGA來降低功耗的19種途徑

充分使用每一個UltraScale CLB來減少CLB的使用數(shù)量

10、更少的CLB意味著CLB之間的布線更少：CLB利用率的顯著提高使得設(shè)計的封裝更緊密，性能更高。緊密的封裝最終體現(xiàn)為更短的連線長度，因此連線電容更小，這有助于一個設(shè)計的總體功耗的降低。

11、關(guān)掉不用的Block RAM：UltraScale架構(gòu)支持電源門控，可以關(guān)掉不用的Block RAM。降低Block RAM的靜態(tài)漏電功耗對降低整個器件的漏電功耗非常有幫助。

12、Block RAM級聯(lián)降低動態(tài)功耗：UltraScale 的Block RAM支持高速存儲器級聯(lián)（用于數(shù)據(jù)級聯(lián)布線）以及輸出復(fù)用，這樣可以實現(xiàn)速度更快、動態(tài)功耗更低的大容量Block RAM陣列。多個Block RAM可以級聯(lián)到一起而不影響B(tài)lock RAM的時序，這個特性可以在任何特定時刻使工作的Block RAM數(shù)量最小化，這樣可以進(jìn)一步降低動態(tài)功耗。

13、使用更少的DSP Slice：盡管Virtex-7 FPGA的DSP Slice性能已經(jīng)是業(yè)界的領(lǐng)導(dǎo)者，Xilinx還是在UltraScale架構(gòu)中，對DSP Slice性能進(jìn)行了較大的提升。這樣，在布線更少、DSP外部邏輯資源使用更少的同時，實現(xiàn)更快的數(shù)字信號處理。舉例來說，用UltraScale架構(gòu)中DSP模塊的27x18位寬的乘法器來實現(xiàn)IEEE Std 754雙精度算法，所用的DSP模塊資源比用Xilinx 7系列器件來實現(xiàn)相同功能要減少三分之二。

14、降低I/O功耗：對于總體功耗而言，I/O功耗已經(jīng)成為一個重要的組成部分。隨著可編程器件的技術(shù)改進(jìn)，內(nèi)核功耗已經(jīng)有了很大的減少，但是直到最近（隨著Xilinx 7系列可編程器件的出現(xiàn)），I/O功耗的降低卻并不明顯，特別是對于一些存儲器密集型的應(yīng)用來說，大量的I/O帶來的功耗會占到一個設(shè)計的總體功耗的50%。Xilinx在7系列FPGA中，通過可編程的電壓轉(zhuǎn)換速率和驅(qū)動強度來降低I/O功耗，UltraScale器件采用了相同的節(jié)省功耗的方法。

15、使用DDR4存儲器：UltraScale架構(gòu)升級了存儲器接口，支持多個DDR3/4兼容的SDRAM存儲器控制器，并且把DDR物理層接口（PHY）模塊集成到片內(nèi)。當(dāng)從DDR3到DDR4轉(zhuǎn)變時，你可以看到功耗上有20%的下降，原因是DDR4工作在一個更低的1.2V的電壓下。

16、降低高速串行收發(fā)器功耗：Xilinx 20nm UltraScale器件的SerDes都為了高性能和低抖動而進(jìn)行了優(yōu)化設(shè)計，能提供一些低功耗操作的特性。UltraScale架構(gòu)中，對GTH收發(fā)器進(jìn)行了重新設(shè)計，跟7系列FPGA中的GTX和GTH收發(fā)器相比，可以削減50%的總體的功耗。

17、在不需要DFE的時候關(guān)閉它：許多無背板的應(yīng)用場合不需要在SerDes收發(fā)器中使用判決反饋均衡器（DFE）電路。因為DFE需要消耗額外的功耗，因此，當(dāng)SerDes端口用作其它用途時，Xilinx UltraScale器件允許設(shè)計人員關(guān)閉DFE。為了節(jié)省功耗，你可以關(guān)掉DFE電路，而使用線性均衡器（LE），跟DFE相比，因為LE自身更低的Rx增益和最小化的電路，所以功耗要小很多。

18、增加硬IP模塊：用集成的硬核模塊來代替軟IP，可以降低10倍的功耗。Xilinx實現(xiàn)了一個集成的Interlaken IP核用于片間的連接，可以達(dá)到150Gbps。Xilinx的IP核是基于業(yè)界領(lǐng)導(dǎo)和最廣泛的部署來實現(xiàn)的，對Interlaken接口協(xié)議規(guī)范rev1.2的實現(xiàn)具有靈活性、高性能和低功耗的特點，可以支持12.5Gbps和25Gbps的收發(fā)器。結(jié)合了UltraScale架構(gòu)的收發(fā)器技術(shù)以及靈活的協(xié)議層，集成IP核可以實現(xiàn)片間互連的管腳個數(shù)和功耗的最小化。同相同的軟IP解決方案相比，集成IP核的延遲更小，這樣可以預(yù)先知道IP的性能。

使用Xilinx 20nm工藝的UltraScale FPGA來降低功耗的19種途徑

使用硬IP核節(jié)省功耗

19、把降低功耗的思想深入到設(shè)計工具中：Vivado設(shè)計套件直接可以支持UltraScale架構(gòu)的許多降功耗的特性，比如說，Vivado設(shè)計套件為了能夠把設(shè)計的一部分進(jìn)行電源門控，會產(chǎn)生一些邏輯來驅(qū)動時鐘末梢buffer的開關(guān)。這個工具還會自動產(chǎn)生邏輯來支持對Block RAM的靜態(tài)和動態(tài)功耗的門控，能推斷出是否要把Block RAM進(jìn)行級聯(lián)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

Xilinx

Xilinx

+關(guān)注

關(guān)注
73

文章
2192

瀏覽量
129821
UltraScale

UltraScale

+關(guān)注

關(guān)注
0

文章
125

瀏覽量
32216

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

使用Xilinx 20nm工藝的UltraScale FPGA來降低功耗的19種途徑

評論