chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

傳統(tǒng)用于數(shù)字設(shè)計的CPU是否已經(jīng)達到了容量極限?

傅里葉的貓 ? 來源:傅里葉的貓 ? 2024-04-17 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自Synopsys的官方文章:

在數(shù)字設(shè)計的Implementation過程中,從RTL到GDSII的每一步都是高度計算密集型的。在SoC層面,為了最小化互連的延遲,我們需要評估數(shù)百個partition的各種布局方案。一旦確定了布局方案,接下來就是進行每個partition內(nèi)的其余步驟,以實現(xiàn)全芯片的implementation和signoff。由于每一步的計算需求已經(jīng)很高,并且還要乘以partition的數(shù)量,這就引發(fā)了一個問題:傳統(tǒng)用于數(shù)字設(shè)計的CPU是否已經(jīng)達到了容量極限?GPU是否能夠滿足計算需求?

如今,GPU以其處理人工智能機器學(xué)習(xí)、游戲和高性能計算等要求最為苛刻的工作負載而聞名。隨著芯片越來越大、越來越復(fù)雜,也許也是時候考慮用GPU來完成數(shù)字芯片設(shè)計的Implementation了。

CPU在EDA工作負載中的容量挑戰(zhàn)

CPU長期以來被認為是計算機的“大腦”。擁有數(shù)十億個晶體管和多個處理核心,如今的CPU非常適合完成廣泛的任務(wù),并且能夠快速完成。另一方面,GPU最初是為特定目的設(shè)計的,但隨著時間的推移,它們也轉(zhuǎn)變?yōu)橥ㄓ玫牟⑿?a target="_blank">處理器。

一般來講,EDA工具都是在基于x86處理器的CPU上運行的。然而,隨著多芯片設(shè)計等復(fù)雜架構(gòu)變得越來越普遍,我們正在接近CPU計算容量的限制??紤]到芯片設(shè)計團隊始終面臨的上市時間壓力,利用額外的工具和技術(shù)來加速芯片設(shè)計過程的任何方面都是有意義的。在驗證和分析方面,新思科技的PrimeSim和VCS仿真流程已經(jīng)從GPU加速中受益。雖然數(shù)字設(shè)計流程中的每個任務(wù)并不是都非常適合GPU,但有些任務(wù)確實可以加速。

最先進的高性能數(shù)據(jù)中心x86 CPU核心平均有64到128個核心,每個box最多約有200個核心。需要更多核心的任務(wù)需要分布在許多box上;如果網(wǎng)絡(luò)不夠快,這會產(chǎn)生一些開銷。RTL到GDSII流程和優(yōu)化技術(shù)包含許多相互依賴性。為了使流程中的每個任務(wù)能夠成功并行執(zhí)行,作業(yè)分布在CPU box之間的數(shù)據(jù)共享必須非??焖?,延遲要小。然而,實際上,網(wǎng)絡(luò)延遲會妨礙周轉(zhuǎn)時間,使得完整的RTL到GDSII流程的分布式并行化變得不那么有吸引力。

另一方面,GPU核心可以輕松擴展。每個核心執(zhí)行的操作更少,而且非常微小,以至于你可以在一個插座中擁有數(shù)萬個核心,以提供巨大的處理能力,同時保持可管理的占用空間。能夠從大規(guī)模并行性中受益的任務(wù)非常適合GPU。然而,這樣的任務(wù)也必須是主要單向的,因為任何決策和迭代都會減慢進程和/或需要回到CPU進行“如果那么”決策。這排除了許多RTL到GDSII數(shù)字implementation流程中的任務(wù),盡管并非所有任務(wù)都不適合。

使用GPU加速加快布局過程

在數(shù)字設(shè)計流程中,自動布局是已經(jīng)展示出在GPU上運行前景的一項任務(wù)。在商業(yè)環(huán)境中運行的原型中,新思科技的Fusion Compiler GPU加速布局技術(shù)相比CPU,已經(jīng)展示出顯著的周轉(zhuǎn)時間優(yōu)勢:

使用GPU放置一個3nm GPU流處理器設(shè)計,包含1.4M個可放置的標(biāo)準(zhǔn)單元和20個可放置的硬宏,僅需38秒,相比之下,CPU驅(qū)動的布局需要13分鐘

使用GPU放置一個12nm汽車CPU設(shè)計,包含2.9M個可放置的標(biāo)準(zhǔn)單元和200個可放置的硬宏,僅需82秒,相比之下,CPU驅(qū)動的布局需要19分鐘

結(jié)合新思科技DSO.ai的AI驅(qū)動自動設(shè)計空間優(yōu)化,我們預(yù)計將在相同的完成時間線上將AI驅(qū)動的搜索空間擴大15倍到20倍。這樣做可以使設(shè)計團隊實現(xiàn)更好的功耗、性能和面積(PPA)結(jié)果。

在許多方面,由于對最終設(shè)計PPA的高影響,布局和 floorplanning 是涉及最廣泛探索的implementation步驟。我們可以想象,即使GPU計算資源通常與強大的CPU計算集群分開,單個designer使用基于GPU的布局技術(shù)也能具有很高的生產(chǎn)力。然而,在RTL到GDSII 的implementation流程的其余部分中,通過CPU和GPU集群之間移動設(shè)計數(shù)據(jù)引入的延遲可能會限制吞吐量優(yōu)勢。

新的數(shù)據(jù)中心SoC正在設(shè)計中,CPU和GPU資源之間具有統(tǒng)一內(nèi)存,用于TB級工作負載。這些新興架構(gòu)消除了利用GPU加速所需的設(shè)計數(shù)據(jù)移動,并將允許我們考慮在數(shù)字設(shè)計流程中應(yīng)用GPU加速的其他位置,特別是當(dāng)設(shè)計師可以將GPU與AI驅(qū)動的implementation工具配對時,可以進行更快、更廣泛的探索和更好的結(jié)果。隨著像新思科技.ai這樣的AI驅(qū)動的全棧EDA流程解決方案產(chǎn)生更好的PPA結(jié)果、更快的達到目標(biāo)時間和更高的工程生產(chǎn)力,人們只能想象GPU加速的加入將如何進一步改變芯片設(shè)計。

總結(jié)

雖然芯片設(shè)計過程中的仿真部分對于在GPU上運行并不陌生,但很快數(shù)字設(shè)計流程的各個方面也將有機會利用GPU加速。對于大型芯片或復(fù)雜架構(gòu)(如多芯片設(shè)計),CPU在運行RTL到GDSII流程時所需的計算容量正在耗盡,無法達到期望的速度。憑借其可擴展性和處理能力,GPU有可能提供更快的周轉(zhuǎn)時間和更好的芯片結(jié)果。使用GPU驅(qū)動的放置器進行的原型實驗已經(jīng)將布局速度提高了多達20倍。隨著AI集成到EDA流程中,加入GPU可以形成一個強大的組合,以提高PPA(功耗、性能和面積)和上市時間。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片設(shè)計
    +關(guān)注

    關(guān)注

    15

    文章

    1146

    瀏覽量

    56616
  • 人工智能
    +關(guān)注

    關(guān)注

    1814

    文章

    49951

    瀏覽量

    263588
  • RTL
    RTL
    +關(guān)注

    關(guān)注

    1

    文章

    393

    瀏覽量

    62510
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8546

    瀏覽量

    136517
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6474

原文標(biāo)題:GPU可以加速芯片設(shè)計的Implementaion嗎?

文章出處:【微信號:傅里葉的貓,微信公眾號:傅里葉的貓】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    華為數(shù)字能源圓滿完成智能組串式構(gòu)網(wǎng)型儲能極限耐火試驗

    華為數(shù)字能源在國際權(quán)威的獨立保障和風(fēng)險管理機構(gòu)DNV和第三方認證機構(gòu)TüV南德的全程見證下,圓滿完成基于最新版UL9540A的華為智能組串式構(gòu)網(wǎng)型儲能大規(guī)模極限耐火試驗。
    的頭像 發(fā)表于 01-07 09:49 ?192次閱讀

    備用電池的容量和環(huán)境兼容性對電能質(zhì)量在線監(jiān)測裝置的精度有何影響?

    備用電池的 容量 和 環(huán)境兼容性 均通過 影響供電穩(wěn)定性 間接作用于電能質(zhì)量在線監(jiān)測裝置的精度 —— 容量決定供電 “持續(xù)穩(wěn)定性”,環(huán)境兼容性決定供電 “動態(tài)穩(wěn)定性”,兩者共同保障裝置核心元件
    的頭像 發(fā)表于 11-27 18:00 ?1249次閱讀
    備用電池的<b class='flag-5'>容量</b>和環(huán)境兼容性對電能質(zhì)量在線監(jiān)測裝置的精度有何影響?

    【「高速數(shù)字設(shè)計(基礎(chǔ)篇)」閱讀體驗】第六章 去耦電容的容量需求分析

    去耦電容容量別瞎猜!《高速數(shù)字設(shè)計》第6章教你量化計算,精準(zhǔn)選型 在高速數(shù)字電路設(shè)計中,去耦電容選多大容量是個難點。《高速數(shù)字設(shè)計》第6章“
    發(fā)表于 11-19 20:48

    串聯(lián)諧振試驗裝置的核心工作邏輯是什么?和傳統(tǒng)耐壓設(shè)備比優(yōu)勢在哪?

    ,通常 50-100 倍)。? 對比傳統(tǒng)工頻耐壓設(shè)備,優(yōu)勢堪稱 “降維打擊”:傳統(tǒng)設(shè)備需大電源容量(如測 3km 10kV 電纜需 500kVA 以上),體積堪比冰箱且重量超 200kg;而武漢特高壓串聯(lián)
    發(fā)表于 10-11 15:40

    高壓二極管應(yīng)用中,是否有足夠銅箔/散熱片,結(jié)溫是否接近極限?

    MDD辰達半導(dǎo)體FAE,我們往往會追溯到一個核心問題——是否有足夠銅箔/散熱片支撐散熱,器件結(jié)溫是否已經(jīng)接近極限。一、結(jié)溫與器件可靠性的關(guān)系結(jié)溫(Tj)是指二極管P
    的頭像 發(fā)表于 09-17 11:42 ?661次閱讀
    高壓二極管應(yīng)用中,<b class='flag-5'>是否</b>有足夠銅箔/散熱片,結(jié)溫<b class='flag-5'>是否</b>接近<b class='flag-5'>極限</b>?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 會方便很多
    發(fā)表于 09-17 06:36

    CCG3PA是否支持發(fā)起B(yǎng)IST 共享容量消息?

    我正在使用CCG3PA ,我想發(fā)起B(yǎng)IST 共享容量消息。我檢查了 CCG3PA 的 API 文檔和 PD 堆棧,但找不到任何與啟動BIST 共享容量模式相關(guān)的枚舉或 API。 CCG3PA是否支持發(fā)起B(yǎng)IST 共享
    發(fā)表于 07-23 07:07

    極限電流與氧分壓傳感器區(qū)別解析

    極限電流型氧傳感器與氧分壓型氧傳感器在原理、結(jié)構(gòu)及應(yīng)用上存在顯著差異,具體區(qū)別如下:工作原理01極限電流型氧傳感器:基于電化學(xué)泵原理,施加外部電壓使氧氣在電極間遷移,當(dāng)電壓足夠高時,電流達到
    的頭像 發(fā)表于 05-19 13:26 ?649次閱讀
    <b class='flag-5'>極限</b>電流與氧分壓傳感器區(qū)別解析

    SMA 連接器功率容量的演進:從傳統(tǒng)設(shè)計到新型材料的突破

    SMA連接器功率容量傳統(tǒng)設(shè)計的艱難摸索到新型材料驅(qū)動下的突破發(fā)展,是一部不斷創(chuàng)新、持續(xù)進取的科技進步史。伴隨材料科學(xué)與制造技術(shù)的持續(xù)革新,德索的SMA連接器功率容量也將不斷躍上新臺階,為微波、射頻等前沿領(lǐng)域注入源源不斷的發(fā)展動
    的頭像 發(fā)表于 05-14 09:10 ?518次閱讀
    SMA 連接器功率<b class='flag-5'>容量</b>的演進:從<b class='flag-5'>傳統(tǒng)</b>設(shè)計到新型材料的突破

    自動駕駛安全程度達到99%是否就足夠了?

    [首發(fā)于智駕最前沿微信公眾號]五一假期,閑來無事,想到一個問題,現(xiàn)在監(jiān)管部門對于自動駕駛的要求已經(jīng)非常嚴(yán)苛,那自動駕駛要達到什么程度才算足夠安全?如果達到99%,是否就可以商用了?抑或
    的頭像 發(fā)表于 05-03 08:42 ?619次閱讀

    從RF到HDMI:傳統(tǒng)接口的現(xiàn)代優(yōu)化

    射頻(RF)、復(fù)合視頻(RCA)、S-Video和視頻色差是幾種傳統(tǒng)的視頻接口。盡管這些接口在一些舊設(shè)備或特定應(yīng)用場景中仍然被使用,但隨著數(shù)字技術(shù)的發(fā)展,它們的使用頻率已經(jīng)顯著下降?,F(xiàn)代顯示設(shè)備
    的頭像 發(fā)表于 04-15 11:50 ?1404次閱讀
    從RF到HDMI:<b class='flag-5'>傳統(tǒng)</b>接口的現(xiàn)代優(yōu)化

    多芯光纖MCF(Multicore Fiber)互聯(lián)

    隨著人工智能AI技術(shù)的迅猛發(fā)展,數(shù)據(jù)處理需求和通信容量的增長達到了前所未有的規(guī)模。特別是在大數(shù)據(jù)分析、深度學(xué)習(xí)和云計算等領(lǐng)域,通信系統(tǒng)對高速、高帶寬的要求越來越高。傳統(tǒng)單模光纖
    發(fā)表于 04-01 11:33

    華為完成智能組串式構(gòu)網(wǎng)型儲能極限燃燒試驗

    近日,華為數(shù)字能源在國際權(quán)威的獨立保障和風(fēng)險管理機構(gòu)DNV及戰(zhàn)略客戶的全程見證下,圓滿完成了智能組串式構(gòu)網(wǎng)型儲能的極限燃燒試驗,以打破行業(yè)傳統(tǒng)安全邊界的創(chuàng)新理念和真實場景極限驗證,為儲
    的頭像 發(fā)表于 02-24 14:15 ?866次閱讀

    DLPLCRC410EVM是否提供觸發(fā)信號接口用于后續(xù)的同步測量?是否也需要利用FPGA對觸發(fā)信號進行編程?

    使用額外的DDR將要投影的圖案預(yù)先加載 在軟件上則需要使用VHDL或其他硬件描述語言對APPSFPGA進行編程 不知道上述理解是否正確? 另外,我的問題在于: 1. 該EVM是否提供觸發(fā)信號接口用于后續(xù)
    發(fā)表于 02-19 07:04

    云 GPU 加速計算:突破傳統(tǒng)算力瓶頸的利刃

    數(shù)字化時代,數(shù)據(jù)呈爆炸式增長,傳統(tǒng)的算力已難以滿足復(fù)雜計算任務(wù)的需求。無論是人工智能的深度學(xué)習(xí)、大數(shù)據(jù)的分析處理,還是科學(xué)研究中的模擬計算,都對算力提出了極高的要求。而云 GPU 加速計算的出現(xiàn)
    的頭像 發(fā)表于 02-17 10:36 ?599次閱讀