chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

何為異構(gòu)芯片 協(xié)同異構(gòu)AI芯片的挑戰(zhàn)

AI芯天下 ? 來源:晶上聯(lián)盟 ? 2024-02-25 13:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

進(jìn)入大模型時(shí)代,全社會(huì)算力需求被推高到了前所未有的程度。

由于大模型AI對(duì)于全社會(huì)的重要性,以及各行各業(yè)加快建設(shè)智算中心,也引發(fā)了全社會(huì)學(xué)習(xí)異構(gòu)AI芯片的熱潮。

異構(gòu)AI芯片出現(xiàn)的現(xiàn)象

2024年1月,微軟聯(lián)合創(chuàng)始人比爾·蓋茨與OpenAI首席執(zhí)行官山姆·奧特曼進(jìn)行了一次對(duì)話,奧特曼在對(duì)話中表示人工智能將引發(fā)人類歷史上“最快”的一次技術(shù)革命,人類可能還沒有準(zhǔn)備好以多快的速度適應(yīng)這種變革。

奧特曼預(yù)計(jì),這項(xiàng)技術(shù)將迅速發(fā)展,使系統(tǒng)的計(jì)算能力達(dá)到GPT-4的10萬倍或100萬倍。

簡單來說,用于人工智能計(jì)算的英偉達(dá)GPU芯片遠(yuǎn)遠(yuǎn)不夠用了。

而為應(yīng)對(duì)GPU全球供應(yīng)短缺問題,以及美國對(duì)GPU的出口限制問題,當(dāng)然更重要的是在AI場(chǎng)景下降低成本,于是市場(chǎng)上涌現(xiàn)了各類異構(gòu)AI芯片。

何為異構(gòu)芯片

異構(gòu)芯片即結(jié)合兩種或多種不同類型的處理器控制器架構(gòu)的芯片。

異構(gòu)芯片可以是CPU+FPGA,CPU+GPU也可以是CPU+AI,也可以是CPU+動(dòng)態(tài)可重構(gòu)等不同架構(gòu),這些架構(gòu)都是利用一種架構(gòu)的優(yōu)勢(shì)來彌補(bǔ)另外一種架構(gòu)的不足,以適應(yīng)用戶多種用途的應(yīng)用需求。

Intel的CPU+Altera的FPGA或者AMD的Instinct MI300和英偉達(dá)的Grace Hopper超級(jí)芯片也是采用“CPU+GPU”的異構(gòu)形式。

CPU+GPU架構(gòu)的優(yōu)勢(shì)

CPU和GPU協(xié)同工作時(shí),CPU包含幾個(gè)專為串行處理而優(yōu)化的核心,GPU則由數(shù)以千計(jì)更小、更節(jié)能的核心組成,這些核心專為提供強(qiáng)勁的并行運(yùn)算性能而設(shè)計(jì)。

程序的串行部分在CPU上運(yùn)行,而并行部分則在GPU上運(yùn)行。

GPU目前已經(jīng)發(fā)展到成熟階段,可輕松執(zhí)行現(xiàn)實(shí)生活中的各種應(yīng)用程序,而且程序運(yùn)行速度已遠(yuǎn)遠(yuǎn)超過使用多核系統(tǒng)時(shí)的情形。

因此,CPU和GPU的結(jié)合剛好可以解決深度學(xué)習(xí)模型訓(xùn)練在CPU上耗時(shí)長的問題,提升深度學(xué)習(xí)模型的訓(xùn)練效率。

CPU與GPU的應(yīng)用場(chǎng)景也不斷拓寬

隨著CPU與GPU的結(jié)合,其相較于單獨(dú)CPU與GPU的應(yīng)用場(chǎng)景也不斷拓寬。

CPU+GPU架構(gòu)適用于處理高性能計(jì)算。伴隨著高性能計(jì)算類應(yīng)用的發(fā)展,驅(qū)動(dòng)算力需求不斷攀升,但目前單一計(jì)算類型和架構(gòu)的處理器已經(jīng)無法處理更復(fù)雜、更多樣的數(shù)據(jù)。

數(shù)據(jù)中心如何在增強(qiáng)算力和性能的同時(shí),具備應(yīng)對(duì)多類型任務(wù)的處理能力,成為全球性的技術(shù)難題。

CPU+GPU的異構(gòu)并行計(jì)算架構(gòu)作為高性能計(jì)算的一種主流解決方案,受到廣泛關(guān)注。

CPU+GPU架構(gòu)適用于處理數(shù)據(jù)中心產(chǎn)生的海量數(shù)據(jù)。數(shù)據(jù)爆炸時(shí)代來臨,使用單一架構(gòu)來處理數(shù)據(jù)的時(shí)代已經(jīng)過去。

比如:個(gè)人互聯(lián)網(wǎng)用戶每天產(chǎn)生約1GB數(shù)據(jù),智能汽車每天約50GB,智能醫(yī)院每天約3TB數(shù)據(jù),智慧城市每天約50PB數(shù)據(jù)。

數(shù)據(jù)的數(shù)量和多樣性以及數(shù)據(jù)處理的地點(diǎn)、時(shí)間和方式也在迅速變化。無論工作任務(wù)是在邊緣還是在云中,不管是人工智能工作任務(wù)還是存儲(chǔ)工作任務(wù),都需要有正確的架構(gòu)和軟件來充分利用這些特點(diǎn)。

CPU+GPU架構(gòu)可以共享內(nèi)存空間,消除冗余內(nèi)存副本來改善問題。

在此前的技術(shù)中,雖然GPU和CPU已整合到同一個(gè)芯片上,但是芯片在運(yùn)算時(shí)要定位內(nèi)存的位置仍然得經(jīng)過繁雜的步驟,這是因?yàn)镃PU和GPU的內(nèi)存池仍然是獨(dú)立運(yùn)作。

為了解決兩者內(nèi)存池獨(dú)立的運(yùn)算問題,當(dāng)CPU程式需要在GPU上進(jìn)行部分運(yùn)算時(shí),CPU都必須從CPU的內(nèi)存上復(fù)制所有的資料到GPU的內(nèi)存上,而當(dāng)GPU上的運(yùn)算完成時(shí),這些資料還得再復(fù)制回到CPU內(nèi)存上。

然而,將CPU與GPU放入同一架構(gòu),就能夠消除冗余內(nèi)存副本來改善問題,處理器不再需要將數(shù)據(jù)復(fù)制到自己的專用內(nèi)存池來訪問/更改該數(shù)據(jù)。

統(tǒng)一內(nèi)存池還意味著不需要第二個(gè)內(nèi)存芯片池,即連接到CPU的DRAM

因此,通過CPU+GPU異構(gòu)并行計(jì)算架構(gòu)組成的服務(wù)器,正成為服務(wù)器市場(chǎng)中的一匹黑馬?,F(xiàn)在已有多家芯片廠商開始跟進(jìn)。

協(xié)同異構(gòu)AI芯片的挑戰(zhàn)

在實(shí)際建設(shè)智算中心的時(shí)候,到底在GPU、FPGA、DSA和ASIC之間選擇哪種算力和算力組合,這是一個(gè)很大的問題。

GPU雖然能夠應(yīng)對(duì)大模型計(jì)算需求,但一卡難求以及限制性能等問題嚴(yán)重;

DSA靈活性有限,硬件和軟件架構(gòu)呈現(xiàn)碎片化;

FPGA的功耗和成本較高,主要用于原型驗(yàn)證,難以在實(shí)際場(chǎng)景中大規(guī)模落地;

ASIC功能固化,缺乏足夠的靈活性,而且ASIC芯片的研發(fā)周期長、成本高和風(fēng)險(xiǎn)大等,都為大規(guī)模和長期采用帶來了挑戰(zhàn)。

另外,多異構(gòu)計(jì)算的硬件層次高集成度和系統(tǒng)軟件層次多協(xié)同、通用編程模型和開發(fā)環(huán)境等,都是行業(yè)需要解決的問題,多異構(gòu)共存的異構(gòu)計(jì)算孤島現(xiàn)象越來越突顯。

特別是不同的異構(gòu)計(jì)算編程框架,要求開發(fā)者掌握多種編程模式和語言,使得代碼移植面臨巨大挑戰(zhàn)。

尋找一個(gè)真正統(tǒng)一、能滿足所有硬件和應(yīng)用需求的編程方法,仍是當(dāng)下計(jì)算領(lǐng)域的熱門研究課題。

結(jié)尾:可發(fā)展產(chǎn)業(yè)機(jī)遇

大模型AI的出現(xiàn),為重構(gòu)數(shù)據(jù)中心帶來了機(jī)遇。由于大模型AI天然帶來海量的數(shù)據(jù)中心內(nèi)部通信而不是對(duì)外通信,在將數(shù)據(jù)中心重構(gòu)為智算中心的時(shí)候,就帶來了“一個(gè)數(shù)據(jù)中心即為一臺(tái)計(jì)算機(jī)”的設(shè)計(jì)理念,這就是以系統(tǒng)設(shè)計(jì)為中心的原則。

以系統(tǒng)設(shè)計(jì)為中心,即考慮一個(gè)數(shù)據(jù)中心上承載大模型訓(xùn)練等邏輯上單一的“大應(yīng)用”,也就是數(shù)據(jù)中心級(jí)的業(yè)務(wù)系統(tǒng)。

因此在智算中心的設(shè)計(jì)上要超越硬件和軟件的傳統(tǒng)界限,將整個(gè)數(shù)據(jù)中心作為一個(gè)協(xié)同工作的系統(tǒng)。

有了以數(shù)據(jù)中心為一臺(tái)計(jì)算機(jī)的設(shè)計(jì)理念和角度,就能找到有效的軟硬件協(xié)同的異構(gòu)融合計(jì)算之路。

內(nèi)容及圖片來源于:晶上聯(lián)盟



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 處理器
    +關(guān)注

    關(guān)注

    68

    文章

    20225

    瀏覽量

    250412
  • 控制器
    +關(guān)注

    關(guān)注

    114

    文章

    17747

    瀏覽量

    191660
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2114

    瀏覽量

    36664
  • 異構(gòu)芯片
    +關(guān)注

    關(guān)注

    0

    文章

    9

    瀏覽量

    2451

原文標(biāo)題:趨勢(shì)丨2024年再怎么重視“異構(gòu)芯片”都不為過

文章出處:【微信號(hào):World_2078,微信公眾號(hào):AI芯天下】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工信部力推:國產(chǎn)訓(xùn)練芯片異構(gòu)算力引領(lǐng)AI新征程

    部將以落實(shí)《實(shí)施意見》為抓手,推動(dòng)人工智能產(chǎn)業(yè)高質(zhì)量發(fā)展,技術(shù)創(chuàng)新是重點(diǎn),突破訓(xùn)練芯片、異構(gòu)算力等關(guān)鍵技術(shù)是關(guān)鍵。 ? 訓(xùn)練芯片AI模型基石與技術(shù)攻堅(jiān)核心 ? 訓(xùn)練
    的頭像 發(fā)表于 01-21 14:11 ?6520次閱讀

    算力并購狂歡下的隱秘戰(zhàn)場(chǎng):AI芯片如何通過“燒錄大考”?

    英偉達(dá)收購 Groq 引發(fā)行業(yè)關(guān)注之際,AI 芯片測(cè)試與燒錄已成為制約產(chǎn)能與性能的關(guān)鍵瓶頸,其耗時(shí)占比超 30%。傳統(tǒng)方案受困于芯片異構(gòu)集成、動(dòng)態(tài)配置帶來的復(fù)雜度,面臨速度、功耗管理及
    的頭像 發(fā)表于 12-29 17:31 ?533次閱讀
    算力并購狂歡下的隱秘戰(zhàn)場(chǎng):<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>如何通過“燒錄大考”?

    國產(chǎn)AI芯片真能扛住“算力內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“算力是AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實(shí)測(cè)下來有點(diǎn)超出預(yù)期——7nm工藝下算力直接拉到256 TFLOPS,比上一代提升了40%,但功耗
    發(fā)表于 10-27 13:12

    AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索與AGI愿景》一書如同一張?jiān)敱M的“藏寶圖”,為讀者指明了通往下一代人工智能的硬件之路。作者沒有停留在空洞的概念層面,而是直擊核心,從馮·諾依曼架構(gòu)的“內(nèi)存墻”瓶頸切入,清晰闡述了
    發(fā)表于 09-17 09:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會(huì),AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 從2017年開始生成式AI
    發(fā)表于 09-12 16:07

    【飛凌T527N開發(fā)板試用】異構(gòu)RISC-V核心使用體驗(yàn)

    全志T527的最大創(chuàng)新和亮點(diǎn)就在于其 “ARM + 異構(gòu)RISC-V” 的芯片設(shè)計(jì)理念。 簡單來說, 全志T527內(nèi)置的阿里平頭哥E907 RISC-V核心不是一個(gè)可選的協(xié)處理器,而是一個(gè)深度集成
    發(fā)表于 08-19 21:45

    商湯大裝置發(fā)布基于DeepLink的異構(gòu)混合調(diào)度方案

    調(diào)度復(fù)雜、跨域訓(xùn)練穩(wěn)定性不足等行業(yè)挑戰(zhàn),全面提升異構(gòu)集群的協(xié)同效率與運(yùn)行可靠性,加速國產(chǎn)AI算力從“可用”邁向“好用”,為大模型訓(xùn)練提供強(qiáng)大而高效的支撐能力。
    的頭像 發(fā)表于 08-05 10:01 ?1021次閱讀

    潤和軟件發(fā)布StackRUNS異構(gòu)分布式推理框架

    當(dāng)下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應(yīng)用場(chǎng)景日益復(fù)雜,企業(yè)正面臨異構(gòu)算力資源碎片化帶來的嚴(yán)峻挑戰(zhàn)。為應(yīng)對(duì)行業(yè)痛點(diǎn),江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發(fā)布自主研發(fā)的StackRUNS
    的頭像 發(fā)表于 06-13 09:10 ?1386次閱讀
    潤和軟件發(fā)布StackRUNS<b class='flag-5'>異構(gòu)</b>分布式推理框架

    能效提升3倍!異構(gòu)計(jì)算架構(gòu)讓AI跑得更快更省電

    。它是應(yīng)對(duì)復(fù)雜計(jì)算需求的關(guān)鍵技術(shù)之一。 ? 異構(gòu)計(jì)算架構(gòu)的核心優(yōu)勢(shì) ? 異構(gòu)計(jì)算架構(gòu)的核心要素主要包括多種計(jì)算單元結(jié)合、任務(wù)分配機(jī)制和協(xié)同工作機(jī)制。多種計(jì)算單元結(jié)合:結(jié)合不同類型的處理單元,如CPU、GPU、TPU、FPGA等,
    的頭像 發(fā)表于 05-25 01:55 ?3837次閱讀

    RAKsmart智能算力架構(gòu):異構(gòu)計(jì)算+低時(shí)延網(wǎng)絡(luò)驅(qū)動(dòng)企業(yè)AI訓(xùn)練范式升級(jí)

    AI大模型參數(shù)量突破萬億、多模態(tài)應(yīng)用爆發(fā)的今天,企業(yè)AI訓(xùn)練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構(gòu),以異構(gòu)計(jì)算資源池化與超低時(shí)延網(wǎng)絡(luò)為核心,重構(gòu)
    的頭像 發(fā)表于 04-17 09:29 ?699次閱讀

    上揚(yáng)軟件助力12英寸異構(gòu)堆疊芯片企業(yè)建設(shè)MES系統(tǒng)項(xiàng)目

    近日,上揚(yáng)軟件攜手國內(nèi)某12英寸異構(gòu)堆疊芯片企業(yè),正式啟動(dòng)MES(制造執(zhí)行系統(tǒng))、EAP(設(shè)備自動(dòng)化系統(tǒng))和RMS(配方管理系統(tǒng))系統(tǒng)的建設(shè)。該企業(yè)作為行業(yè)內(nèi)的重要參與者,專注于異構(gòu)堆疊芯片
    的頭像 發(fā)表于 03-26 17:01 ?1209次閱讀

    AI SoC#炬芯科技端側(cè) AI 處理器芯片:三核異構(gòu),存內(nèi)計(jì)算

    炬芯科技端側(cè) AI 處理器芯片產(chǎn)品主要為CPU+DSP雙核異構(gòu)高算力單芯片解決方案,現(xiàn)在主推的端側(cè) AI 處理器產(chǎn)品
    的頭像 發(fā)表于 03-24 14:27 ?3271次閱讀
    <b class='flag-5'>AI</b> SoC#炬芯科技端側(cè) <b class='flag-5'>AI</b> 處理器<b class='flag-5'>芯片</b>:三核<b class='flag-5'>異構(gòu)</b>,存內(nèi)計(jì)算

    GS1-N2:雙核心異構(gòu) AI 硬盤錄像機(jī)

    Firefly推出雙核心異構(gòu)AI硬盤錄像機(jī)GS1-N2,采用雙處理器架構(gòu),分別負(fù)責(zé)視頻解碼和AI處理,優(yōu)化資源分配,增強(qiáng)AI處理能力,支持最高8K視頻解碼。8個(gè)千兆網(wǎng)接口,可接駁符合O
    的頭像 發(fā)表于 03-21 16:52 ?1093次閱讀
    GS1-N2:雙核心<b class='flag-5'>異構(gòu)</b> <b class='flag-5'>AI</b> 硬盤錄像機(jī)

    NV-C2P10:雙核心異構(gòu) AI 硬盤錄像機(jī)

    Firefly推出雙核心異構(gòu)AI硬盤錄像機(jī)——NV-C2P10,采用雙處理器架構(gòu),分別負(fù)責(zé)視頻解碼和AI處理,優(yōu)化資源分配,增強(qiáng)AI處理能力,支持最高8K視頻解碼;具備8個(gè)千兆網(wǎng)接口,
    的頭像 發(fā)表于 03-19 16:32 ?1025次閱讀
    NV-C2P10:雙核心<b class='flag-5'>異構(gòu)</b> <b class='flag-5'>AI</b> 硬盤錄像機(jī)

    在采用異構(gòu)模式推理時(shí),如何檢查每層使用的設(shè)備是什么?

    異構(gòu)模式推理時(shí),無法檢查每層使用的設(shè)備是什么
    發(fā)表于 03-06 06:49