chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

傳統(tǒng)用于數(shù)字設(shè)計(jì)的CPU是否已經(jīng)達(dá)到了容量極限?

傅里葉的貓 ? 來源:傅里葉的貓 ? 2024-04-17 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

本文翻譯自Synopsys的官方文章:

在數(shù)字設(shè)計(jì)的Implementation過程中,從RTL到GDSII的每一步都是高度計(jì)算密集型的。在SoC層面,為了最小化互連的延遲,我們需要評(píng)估數(shù)百個(gè)partition的各種布局方案。一旦確定了布局方案,接下來就是進(jìn)行每個(gè)partition內(nèi)的其余步驟,以實(shí)現(xiàn)全芯片的implementation和signoff。由于每一步的計(jì)算需求已經(jīng)很高,并且還要乘以partition的數(shù)量,這就引發(fā)了一個(gè)問題:傳統(tǒng)用于數(shù)字設(shè)計(jì)的CPU是否已經(jīng)達(dá)到了容量極限?GPU是否能夠滿足計(jì)算需求?

如今,GPU以其處理人工智能機(jī)器學(xué)習(xí)、游戲和高性能計(jì)算等要求最為苛刻的工作負(fù)載而聞名。隨著芯片越來越大、越來越復(fù)雜,也許也是時(shí)候考慮用GPU來完成數(shù)字芯片設(shè)計(jì)的Implementation了。

CPU在EDA工作負(fù)載中的容量挑戰(zhàn)

CPU長(zhǎng)期以來被認(rèn)為是計(jì)算機(jī)的“大腦”。擁有數(shù)十億個(gè)晶體管和多個(gè)處理核心,如今的CPU非常適合完成廣泛的任務(wù),并且能夠快速完成。另一方面,GPU最初是為特定目的設(shè)計(jì)的,但隨著時(shí)間的推移,它們也轉(zhuǎn)變?yōu)橥ㄓ玫牟⑿?a target="_blank">處理器。

一般來講,EDA工具都是在基于x86處理器的CPU上運(yùn)行的。然而,隨著多芯片設(shè)計(jì)等復(fù)雜架構(gòu)變得越來越普遍,我們正在接近CPU計(jì)算容量的限制。考慮到芯片設(shè)計(jì)團(tuán)隊(duì)始終面臨的上市時(shí)間壓力,利用額外的工具和技術(shù)來加速芯片設(shè)計(jì)過程的任何方面都是有意義的。在驗(yàn)證和分析方面,新思科技的PrimeSim和VCS仿真流程已經(jīng)從GPU加速中受益。雖然數(shù)字設(shè)計(jì)流程中的每個(gè)任務(wù)并不是都非常適合GPU,但有些任務(wù)確實(shí)可以加速。

最先進(jìn)的高性能數(shù)據(jù)中心x86 CPU核心平均有64到128個(gè)核心,每個(gè)box最多約有200個(gè)核心。需要更多核心的任務(wù)需要分布在許多box上;如果網(wǎng)絡(luò)不夠快,這會(huì)產(chǎn)生一些開銷。RTL到GDSII流程和優(yōu)化技術(shù)包含許多相互依賴性。為了使流程中的每個(gè)任務(wù)能夠成功并行執(zhí)行,作業(yè)分布在CPU box之間的數(shù)據(jù)共享必須非??焖?,延遲要小。然而,實(shí)際上,網(wǎng)絡(luò)延遲會(huì)妨礙周轉(zhuǎn)時(shí)間,使得完整的RTL到GDSII流程的分布式并行化變得不那么有吸引力。

另一方面,GPU核心可以輕松擴(kuò)展。每個(gè)核心執(zhí)行的操作更少,而且非常微小,以至于你可以在一個(gè)插座中擁有數(shù)萬個(gè)核心,以提供巨大的處理能力,同時(shí)保持可管理的占用空間。能夠從大規(guī)模并行性中受益的任務(wù)非常適合GPU。然而,這樣的任務(wù)也必須是主要單向的,因?yàn)槿魏螞Q策和迭代都會(huì)減慢進(jìn)程和/或需要回到CPU進(jìn)行“如果那么”決策。這排除了許多RTL到GDSII數(shù)字implementation流程中的任務(wù),盡管并非所有任務(wù)都不適合。

使用GPU加速加快布局過程

在數(shù)字設(shè)計(jì)流程中,自動(dòng)布局是已經(jīng)展示出在GPU上運(yùn)行前景的一項(xiàng)任務(wù)。在商業(yè)環(huán)境中運(yùn)行的原型中,新思科技的Fusion Compiler GPU加速布局技術(shù)相比CPU,已經(jīng)展示出顯著的周轉(zhuǎn)時(shí)間優(yōu)勢(shì):

使用GPU放置一個(gè)3nm GPU流處理器設(shè)計(jì),包含1.4M個(gè)可放置的標(biāo)準(zhǔn)單元和20個(gè)可放置的硬宏,僅需38秒,相比之下,CPU驅(qū)動(dòng)的布局需要13分鐘

使用GPU放置一個(gè)12nm汽車CPU設(shè)計(jì),包含2.9M個(gè)可放置的標(biāo)準(zhǔn)單元和200個(gè)可放置的硬宏,僅需82秒,相比之下,CPU驅(qū)動(dòng)的布局需要19分鐘

結(jié)合新思科技DSO.ai的AI驅(qū)動(dòng)自動(dòng)設(shè)計(jì)空間優(yōu)化,我們預(yù)計(jì)將在相同的完成時(shí)間線上將AI驅(qū)動(dòng)的搜索空間擴(kuò)大15倍到20倍。這樣做可以使設(shè)計(jì)團(tuán)隊(duì)實(shí)現(xiàn)更好的功耗、性能和面積(PPA)結(jié)果。

在許多方面,由于對(duì)最終設(shè)計(jì)PPA的高影響,布局和 floorplanning 是涉及最廣泛探索的implementation步驟。我們可以想象,即使GPU計(jì)算資源通常與強(qiáng)大的CPU計(jì)算集群分開,單個(gè)designer使用基于GPU的布局技術(shù)也能具有很高的生產(chǎn)力。然而,在RTL到GDSII 的implementation流程的其余部分中,通過CPU和GPU集群之間移動(dòng)設(shè)計(jì)數(shù)據(jù)引入的延遲可能會(huì)限制吞吐量?jī)?yōu)勢(shì)。

新的數(shù)據(jù)中心SoC正在設(shè)計(jì)中,CPU和GPU資源之間具有統(tǒng)一內(nèi)存,用于TB級(jí)工作負(fù)載。這些新興架構(gòu)消除了利用GPU加速所需的設(shè)計(jì)數(shù)據(jù)移動(dòng),并將允許我們考慮在數(shù)字設(shè)計(jì)流程中應(yīng)用GPU加速的其他位置,特別是當(dāng)設(shè)計(jì)師可以將GPU與AI驅(qū)動(dòng)的implementation工具配對(duì)時(shí),可以進(jìn)行更快、更廣泛的探索和更好的結(jié)果。隨著像新思科技.ai這樣的AI驅(qū)動(dòng)的全棧EDA流程解決方案產(chǎn)生更好的PPA結(jié)果、更快的達(dá)到目標(biāo)時(shí)間和更高的工程生產(chǎn)力,人們只能想象GPU加速的加入將如何進(jìn)一步改變芯片設(shè)計(jì)。

總結(jié)

雖然芯片設(shè)計(jì)過程中的仿真部分對(duì)于在GPU上運(yùn)行并不陌生,但很快數(shù)字設(shè)計(jì)流程的各個(gè)方面也將有機(jī)會(huì)利用GPU加速。對(duì)于大型芯片或復(fù)雜架構(gòu)(如多芯片設(shè)計(jì)),CPU在運(yùn)行RTL到GDSII流程時(shí)所需的計(jì)算容量正在耗盡,無法達(dá)到期望的速度。憑借其可擴(kuò)展性和處理能力,GPU有可能提供更快的周轉(zhuǎn)時(shí)間和更好的芯片結(jié)果。使用GPU驅(qū)動(dòng)的放置器進(jìn)行的原型實(shí)驗(yàn)已經(jīng)將布局速度提高了多達(dá)20倍。隨著AI集成到EDA流程中,加入GPU可以形成一個(gè)強(qiáng)大的組合,以提高PPA(功耗、性能和面積)和上市時(shí)間。



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 芯片設(shè)計(jì)
    +關(guān)注

    關(guān)注

    15

    文章

    1108

    瀏覽量

    56181
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49487

    瀏覽量

    258008
  • RTL
    RTL
    +關(guān)注

    關(guān)注

    1

    文章

    392

    瀏覽量

    62014
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8528

    瀏覽量

    135848
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    306

    瀏覽量

    6320

原文標(biāo)題:GPU可以加速芯片設(shè)計(jì)的Implementaion嗎?

文章出處:【微信號(hào):傅里葉的貓,微信公眾號(hào):傅里葉的貓】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    串聯(lián)諧振試驗(yàn)裝置的核心工作邏輯是什么?和傳統(tǒng)耐壓設(shè)備比優(yōu)勢(shì)在哪?

    ,通常 50-100 倍)。? 對(duì)比傳統(tǒng)工頻耐壓設(shè)備,優(yōu)勢(shì)堪稱 “降維打擊”:傳統(tǒng)設(shè)備需大電源容量(如測(cè) 3km 10kV 電纜需 500kVA 以上),體積堪比冰箱且重量超 200kg;而武漢特高壓串聯(lián)
    發(fā)表于 10-11 15:40

    高壓二極管應(yīng)用中,是否有足夠銅箔/散熱片,結(jié)溫是否接近極限?

    MDD辰達(dá)半導(dǎo)體FAE,我們往往會(huì)追溯到一個(gè)核心問題——是否有足夠銅箔/散熱片支撐散熱,器件結(jié)溫是否已經(jīng)接近極限。一、結(jié)溫與器件可靠性的關(guān)系結(jié)溫(Tj)是指二極管P
    的頭像 發(fā)表于 09-17 11:42 ?227次閱讀
    高壓二極管應(yīng)用中,<b class='flag-5'>是否</b>有足夠銅箔/散熱片,結(jié)溫<b class='flag-5'>是否</b>接近<b class='flag-5'>極限</b>?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包?

    github 上的 nano版本已經(jīng)更新到了4.1.1,是否能提供4.1.1版本的mdk pack包, 會(huì)方便很多
    發(fā)表于 09-17 06:36

    CCG3PA是否支持發(fā)起B(yǎng)IST 共享容量消息?

    我正在使用CCG3PA ,我想發(fā)起B(yǎng)IST 共享容量消息。我檢查了 CCG3PA 的 API 文檔和 PD 堆棧,但找不到任何與啟動(dòng)BIST 共享容量模式相關(guān)的枚舉或 API。 CCG3PA是否支持發(fā)起B(yǎng)IST 共享
    發(fā)表于 07-23 07:07

    極限電流與氧分壓傳感器區(qū)別解析

    極限電流型氧傳感器與氧分壓型氧傳感器在原理、結(jié)構(gòu)及應(yīng)用上存在顯著差異,具體區(qū)別如下:工作原理01極限電流型氧傳感器:基于電化學(xué)泵原理,施加外部電壓使氧氣在電極間遷移,當(dāng)電壓足夠高時(shí),電流達(dá)到
    的頭像 發(fā)表于 05-19 13:26 ?392次閱讀
    <b class='flag-5'>極限</b>電流與氧分壓傳感器區(qū)別解析

    SMA 連接器功率容量的演進(jìn):從傳統(tǒng)設(shè)計(jì)到新型材料的突破

    SMA連接器功率容量傳統(tǒng)設(shè)計(jì)的艱難摸索到新型材料驅(qū)動(dòng)下的突破發(fā)展,是一部不斷創(chuàng)新、持續(xù)進(jìn)取的科技進(jìn)步史。伴隨材料科學(xué)與制造技術(shù)的持續(xù)革新,德索的SMA連接器功率容量也將不斷躍上新臺(tái)階,為微波、射頻等前沿領(lǐng)域注入源源不斷的發(fā)展動(dòng)
    的頭像 發(fā)表于 05-14 09:10 ?358次閱讀
    SMA 連接器功率<b class='flag-5'>容量</b>的演進(jìn):從<b class='flag-5'>傳統(tǒng)</b>設(shè)計(jì)到新型材料的突破

    自動(dòng)駕駛安全程度達(dá)到99%是否就足夠了?

    [首發(fā)于智駕最前沿微信公眾號(hào)]五一假期,閑來無事,想到一個(gè)問題,現(xiàn)在監(jiān)管部門對(duì)于自動(dòng)駕駛的要求已經(jīng)非常嚴(yán)苛,那自動(dòng)駕駛要達(dá)到什么程度才算足夠安全?如果達(dá)到99%,是否就可以商用了?抑或
    的頭像 發(fā)表于 05-03 08:42 ?408次閱讀

    華為完成智能組串式構(gòu)網(wǎng)型儲(chǔ)能極限燃燒試驗(yàn)

    近日,華為數(shù)字能源在國際權(quán)威的獨(dú)立保障和風(fēng)險(xiǎn)管理機(jī)構(gòu)DNV及戰(zhàn)略客戶的全程見證下,圓滿完成了智能組串式構(gòu)網(wǎng)型儲(chǔ)能的極限燃燒試驗(yàn),以打破行業(yè)傳統(tǒng)安全邊界的創(chuàng)新理念和真實(shí)場(chǎng)景極限驗(yàn)證,為儲(chǔ)
    的頭像 發(fā)表于 02-24 14:15 ?658次閱讀

    按照DAC7811手冊(cè)上接,輸出誤差達(dá)到了10%,請(qǐng)問這是怎么回事?

    按照DAC7811手冊(cè)上接,輸出誤差達(dá)到了10%,請(qǐng)問這是怎么回事
    發(fā)表于 01-17 06:30

    芯片極限能力、封裝成品及系統(tǒng)級(jí)測(cè)試

    能力測(cè)試 極限能力測(cè)試包括以下兩個(gè)方面: 浪涌電流測(cè)試 大容量的電氣設(shè)備接通或斷開瞬間,由于電網(wǎng)中存在電感,將在電網(wǎng)中產(chǎn)生浪涌電壓,從而產(chǎn)生浪涌電流。 浪涌電流測(cè)試的目的是評(píng)估電氣設(shè)備在遭受浪涌電流沖擊時(shí)的耐受能力。測(cè)試過程中,通常會(huì)使用專門
    的頭像 發(fā)表于 12-24 11:25 ?1468次閱讀

    NPU與傳統(tǒng)處理器的區(qū)別是什么

    和GPU相比,NPU在處理深度學(xué)習(xí)任務(wù)時(shí)展現(xiàn)出了顯著的優(yōu)勢(shì)。 1. 設(shè)計(jì)目的 傳統(tǒng)處理器: CPU(中央處理單元): CPU是通用處理器,設(shè)計(jì)用于執(zhí)行各種計(jì)算任務(wù),包括邏輯運(yùn)算、數(shù)據(jù)處
    的頭像 發(fā)表于 11-15 09:29 ?1988次閱讀

    數(shù)字壓力表的準(zhǔn)確度如何?是否用于精密測(cè)量?

    在工業(yè)和科研領(lǐng)域,壓力的測(cè)量工作至關(guān)重要,而數(shù)字壓力表因其直觀的數(shù)字顯示和高精度的特性,成為了這些領(lǐng)域不可或缺的測(cè)量工具。那么,數(shù)字壓力表的準(zhǔn)確度到底如何,它是否能滿足精細(xì)測(cè)量的需求呢
    的頭像 發(fā)表于 11-07 13:58 ?940次閱讀
    <b class='flag-5'>數(shù)字</b>壓力表的準(zhǔn)確度如何?<b class='flag-5'>是否</b>適<b class='flag-5'>用于</b>精密測(cè)量?

    突破傳輸容量瓶頸:多芯光纖與空芯光纖

    伴隨著容量的提升及輸入功率的增加,由于非線性香農(nóng)極限的影響,單模光纖的傳輸容量即將到達(dá)上限。傳統(tǒng)單模光纖(SMF)傳輸系統(tǒng)的最大容量被認(rèn)為在
    的頭像 發(fā)表于 10-29 15:55 ?2382次閱讀
    突破傳輸<b class='flag-5'>容量</b>瓶頸:多芯光纖與空芯光纖

    《算力芯片 高性能 CPUGPUNPU 微架構(gòu)分析》第二篇閱讀心得:芯片拓?fù)鋵W(xué):并行擴(kuò)展與CPU設(shè)計(jì)的巨頭對(duì)決

    更是達(dá)到了令人驚嘆的6GFLOPS/W。 3 處理器性能的未來與思考 隨著閱讀深入,我發(fā)現(xiàn)這兩章內(nèi)容與前4章的CPU微架構(gòu)知識(shí)自然銜接,又為后續(xù)GPU和NPU架構(gòu)的學(xué)習(xí)搭建了認(rèn)知框架。書中詳細(xì)介紹了
    發(fā)表于 10-29 01:48

    數(shù)字孿生如何改變傳統(tǒng)行業(yè)

    數(shù)字孿生作為一種前沿技術(shù),正在深刻改變傳統(tǒng)行業(yè),其影響力和變革能力在各個(gè)領(lǐng)域中日益顯現(xiàn)。以下是數(shù)字孿生如何改變傳統(tǒng)行業(yè)的具體分析: 一、數(shù)字
    的頭像 發(fā)表于 10-25 15:06 ?852次閱讀