chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

2PFLOPS,存算一體迎來(lái)新的卷王

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2022-08-29 06:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

存算一體技術(shù)作為當(dāng)下內(nèi)存廠商和不少AI芯片公司都在全力鉆研的方向,已經(jīng)有了不少成果展示,下一代智能存儲(chǔ)的產(chǎn)品均已呼之欲出了。但新技術(shù)的新生期就是這樣,不斷有新的初創(chuàng)企業(yè)冒頭,不斷有新的架構(gòu)和路線面世,而今年的HotChips34上,就有這么兩個(gè)存算一體技術(shù)的分享,在現(xiàn)有的存算一體生態(tài)上做出了創(chuàng)新,再度為這條賽道上的激烈競(jìng)爭(zhēng)添油加醋。

1PB/s帶寬的千核RISC-V AI推理加速器

存算一體技術(shù)需要解決的,往往都是AI運(yùn)算上的問(wèn)題,比如訓(xùn)練和推理等等,所以不少做存算一體公司與AI芯片公司并無(wú)二致。而AI推理的出現(xiàn)為芯片設(shè)計(jì)者提出了三大關(guān)鍵挑戰(zhàn),一是不斷提升的算力和功耗要求,不說(shuō)是存算一體芯片了,GPU、FPGAASIC等AI加速器都在往這個(gè)方向卷;二是神經(jīng)網(wǎng)絡(luò)的格局一直在變化,現(xiàn)有的芯片可能缺乏跟上節(jié)奏的擴(kuò)展性和靈活性;第三則是推理精度的缺失,在某些業(yè)務(wù)中精度的缺失可能只是意味著虧損,但在ADAS這樣的應(yīng)用中,就很有可能危及人身安全。

加拿大本土AI初創(chuàng)公司Untether AI就打算從計(jì)算的角度來(lái)解決AI推理問(wèn)題,早在2020年他們就推出了runAI200這款加速器芯片,不過(guò)該芯片基于臺(tái)積電16nm工藝,集成了200MB的SRAM,算力最高也只有500 TOPS(INT8),顯然不能滿足高性能的AI推理需求,但他們的思路卻從一開始就和其他存算一體公司不同。

我們常見的存算一體技術(shù)無(wú)疑就是近存計(jì)算和存內(nèi)計(jì)算這兩種,前者基于馮諾依曼架構(gòu),主要還是完成加快數(shù)據(jù)轉(zhuǎn)移的過(guò)程,后者通過(guò)模擬技術(shù)來(lái)完成乘法累加運(yùn)算,再利用數(shù)字處理器來(lái)完成其他運(yùn)算。

Untether AI卻提出了存間計(jì)算(At-MemoryComputation),將雙向的計(jì)算邏輯單元放在SRAM之間。如此一來(lái)不僅能提供大規(guī)模并行卻又簡(jiǎn)短的直接連接,也能提供獨(dú)立優(yōu)化過(guò)的內(nèi)存,提升效率和帶寬,根據(jù)Untether AI所說(shuō),存間計(jì)算恰好能夠解決AI加速的痛點(diǎn)。
Boqueria與競(jìng)品的對(duì)比/ Untether AI

為此,Untether AI推出了Boqueria,一個(gè)算力高達(dá)2PFLOPS、能效比高達(dá)30TFLOPS/W的存間計(jì)算AI推理加速器芯片。Boqueria基于臺(tái)積電7nm打造,頻率高達(dá)1.35GHz,集成了729個(gè)存儲(chǔ)體、238MB的片上SRAM和1458個(gè)RISC-V核心,SRAM內(nèi)存帶寬可以達(dá)到1PB/s。

每個(gè)存儲(chǔ)體中包含2個(gè)RISC-V核心,各管理4個(gè)行控制器。行控制器之間獨(dú)立運(yùn)行,每個(gè)行控制器控制64個(gè)SIMD處理單元,用于完成矩陣向量乘法運(yùn)算。這些處理單元支持INT4、INT8、FP8和BF16這四種常見數(shù)據(jù)格式,而且依Untether AI看來(lái),F(xiàn)P8是精度、吞吐量和能效平衡上最好的一個(gè),更不用說(shuō)Untether AI在處理單元上加入了零檢測(cè),進(jìn)一步拉高了能效比。
Boqueria架構(gòu)不同規(guī)模下的功耗與算力對(duì)比/ Untether AI

Boqueria上的RISC-V核心由Untether AI自己客制化的,本身基于RV32EMC指令集的同時(shí),還加入了20多條專用于存間計(jì)算和推理加速的指令。Boqueria的另一大優(yōu)勢(shì),就是它極具擴(kuò)展性的架構(gòu)。最小的結(jié)構(gòu)可以做到1W以下,也可以將其做成Chiplet集成在其他SoC中,或者是再大一點(diǎn)的M.2卡、PCIe5.0卡等。要想追求最高的性能,可以做成集成6個(gè)Boqueria芯片的PCIe5.0卡,SRAM容量可達(dá)1.4GB,LPDDR5 DRAM容量可達(dá)192GB,F(xiàn)P8算力可達(dá)12PFLOPS,更不用說(shuō)除了芯片到芯片之間的通信外,Boqueria也支持PCIe卡之間的通信。

神經(jīng)形態(tài)存內(nèi)計(jì)算處理器

韓國(guó)科學(xué)技術(shù)院的研究團(tuán)隊(duì)在本屆HotChips上展示了一種新型的存算一體處理器,結(jié)合了時(shí)下兩大新技術(shù),神經(jīng)形態(tài)和存內(nèi)計(jì)算。傳統(tǒng)的存內(nèi)計(jì)算處理器由于在矩陣乘法上的優(yōu)勢(shì),可以為深度學(xué)習(xí)解決最大的計(jì)算問(wèn)題??蛇@個(gè)計(jì)算結(jié)果的準(zhǔn)確性很大程度取決于處理器上DACADC的精度。

可DAC和ADC的精度越高,模擬計(jì)算的結(jié)果也就越精確,也使得處理器的硬件開銷變高,無(wú)論是功耗還是面積都是如此,甚至有可能抵消存內(nèi)計(jì)算原本的硬件優(yōu)勢(shì)。在整個(gè)處理器的功耗中,高精度的ADC甚至可能會(huì)占據(jù)一半以上的功耗,甚至超過(guò)驅(qū)動(dòng)器和控制器的總和。

不僅如此,在真實(shí)應(yīng)用中由于低稀疏度,其能效比也遠(yuǎn)不如紙面數(shù)據(jù)那么理想,比如面對(duì)CIFAR-10或ImageNet等數(shù)據(jù)集時(shí),其能效比甚至可能會(huì)縮水到十分之一,徹底毀掉了存內(nèi)計(jì)算處理器在算力和能耗上的雙重優(yōu)勢(shì)。

于是韓國(guó)科學(xué)技術(shù)院團(tuán)隊(duì)考慮用二進(jìn)制脈沖信號(hào)的事件驅(qū)動(dòng)運(yùn)算來(lái)生成輸入稀疏,并將卷積神經(jīng)網(wǎng)絡(luò)轉(zhuǎn)換成脈沖神經(jīng)網(wǎng)絡(luò),從而剔除ADC/DAC,并引入了四大特性。比如用最高有效位WordSkipping和早停法來(lái)減少位線活動(dòng),從而降低各種模式下的功耗,并用混合模式的神經(jīng)元放電和電壓折疊技術(shù),將該處理器的動(dòng)態(tài)電壓范圍提高至3倍。
傳統(tǒng)存內(nèi)計(jì)算架構(gòu)與神經(jīng)形態(tài)存內(nèi)計(jì)算架構(gòu)對(duì)比/ 韓國(guó)科學(xué)技術(shù)院

如此一來(lái),他們打造出了一個(gè)高能效的神經(jīng)形態(tài)存內(nèi)計(jì)算架構(gòu),存內(nèi)計(jì)算減少內(nèi)存訪問(wèn)和多字線驅(qū)動(dòng)的優(yōu)勢(shì)依然保留,但脈沖神經(jīng)網(wǎng)絡(luò)的加入,卻消除了高精度ADC的需求。他們根據(jù)這一架構(gòu)打造出了一個(gè)基于28nm工藝的存內(nèi)計(jì)算芯片,總存儲(chǔ)大小只有32KB,頻率也只有200MHz,卻可以在100到200mW的系統(tǒng)功耗下,實(shí)現(xiàn)最高310.4 TOPS/W的高能效比??紤]到這一研究本身也是由三星贊助,這一思路未來(lái)很有可能被用于三星的MRAM存內(nèi)計(jì)算芯片中去,屆時(shí)才會(huì)考慮使用更優(yōu)的工藝來(lái)實(shí)現(xiàn)更高的性能,并做到更大的容量。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 內(nèi)存
    +關(guān)注

    關(guān)注

    9

    文章

    3234

    瀏覽量

    76518
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    41137

    瀏覽量

    302608
  • 存算一體
    +關(guān)注

    關(guān)注

    1

    文章

    121

    瀏覽量

    5216
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    安克創(chuàng)新發(fā)布Thus?芯片:一體架構(gòu)重塑AI音頻新生態(tài)

    2026年4月22日,安克創(chuàng)新在深圳舉辦技術(shù)溝通會(huì),正式推出全球首款基于NOR Flash技術(shù)的神經(jīng)網(wǎng)絡(luò)一體(CIM)AI音頻芯片Thus?。這款芯片通過(guò)顛覆性架構(gòu)設(shè)計(jì),將AI峰值
    的頭像 發(fā)表于 04-23 09:59 ?818次閱讀

    觸拓(CHUTO)戶外廣告一體機(jī),無(wú)懼酷暑全天候在線# 觸拓 #戶外觸摸一體機(jī)

    一體機(jī)
    深圳市觸拓科技有限公司
    發(fā)布于 :2026年04月08日 12:20:40

    中科曙光scaleX40超節(jié)點(diǎn)革新AI協(xié)同

    在當(dāng)前力時(shí)代,以Token(詞元)為代表的力需求已成為行業(yè)核心剛需,而穩(wěn)定、高效的力運(yùn)轉(zhuǎn),離不開底層力的可靠支撐。立足這行業(yè)發(fā)展邏
    的頭像 發(fā)表于 03-28 15:46 ?1670次閱讀

    AI一體,這家ReRAM新型存儲(chǔ)受關(guān)注

    及相關(guān)芯片產(chǎn)品的研發(fā),涵蓋AI一體(Computing in Memory, CIM)IP及大模型加速方案、高性
    的頭像 發(fā)表于 12-25 09:43 ?2375次閱讀
    AI<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>,這家ReRAM新型存儲(chǔ)受關(guān)注

    科技紹迪:AI可穿戴需求爆發(fā),一體成主流AI芯片架構(gòu)

    集中在AI驅(qū)動(dòng)的細(xì)分場(chǎng)景需求釋放,知科技聚焦的一體芯片具備高技術(shù)壁壘,同時(shí)在AI發(fā)展需求下具備天然的架構(gòu)優(yōu)勢(shì)和發(fā)展前景。
    的頭像 發(fā)表于 12-23 09:34 ?1.1w次閱讀
    知<b class='flag-5'>存</b>科技<b class='flag-5'>王</b>紹迪:AI可穿戴需求爆發(fā),<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>成主流AI芯片架構(gòu)

    載譽(yù)而歸 | 蘋芯科技斬獲AABI火炬技術(shù)轉(zhuǎn)移獎(jiǎng),一體技術(shù)探索跨境創(chuàng)新合作

    (PimchipTechnology)憑借在一體芯片領(lǐng)域的技術(shù)突破與跨境技術(shù)轉(zhuǎn)化成果,成功斬獲2025年AABI火炬技術(shù)轉(zhuǎn)移獎(jiǎng)。這榮譽(yù)不僅是對(duì)蘋芯團(tuán)隊(duì)技術(shù)實(shí)力的高度認(rèn)可,也將進(jìn)
    的頭像 發(fā)表于 11-04 10:03 ?917次閱讀
    載譽(yù)而歸 | 蘋芯科技斬獲AABI火炬技術(shù)轉(zhuǎn)移獎(jiǎng),<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)探索跨境創(chuàng)新合作

    一體AI芯片公司九天睿芯完成超億元B輪融資

    全球領(lǐng)先的一體AI芯片公司九天睿芯(英文:Reexen Technology)近日宣布,公司已完成B輪融資,規(guī)模超億元人民幣。
    的頭像 發(fā)表于 10-10 11:41 ?1484次閱讀

    后摩爾定律時(shí)代,3D-CIM+RISC-V打造國(guó)產(chǎn)一體新范式

    ,力、能效與帶寬瓶頸成為行業(yè)前行的關(guān)鍵阻礙,而美西方的技術(shù)禁運(yùn)更讓中國(guó)芯片產(chǎn)業(yè)面臨嚴(yán)峻挑戰(zhàn)。 ? 在這大背景下,一體成為國(guó)產(chǎn)
    發(fā)表于 09-17 09:31 ?6217次閱讀
    后摩爾定律時(shí)代,3D-CIM+RISC-V打造國(guó)產(chǎn)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>新范式

    科技榮獲2025半導(dǎo)體市場(chǎng)創(chuàng)新表現(xiàn)獎(jiǎng)

    8月26日,第22屆深圳國(guó)際電子展(elexcon2025)現(xiàn)場(chǎng)正式揭曉聚焦行業(yè)技術(shù)突破與價(jià)值創(chuàng)造的“2025半導(dǎo)體市場(chǎng)創(chuàng)新表現(xiàn)獎(jiǎng)” ,知科技憑借WTM系列一體芯片的核心技術(shù)創(chuàng)新
    的頭像 發(fā)表于 08-28 17:09 ?1799次閱讀

    在TR組件優(yōu)化與一體架構(gòu)中構(gòu)建技術(shù)話語(yǔ)權(quán)

    電磁兼容性、熱管理在內(nèi)的12項(xiàng)專業(yè)能力評(píng)估。\"這種評(píng)估體系,正是行業(yè)對(duì)技術(shù)人才的分級(jí)認(rèn)證標(biāo)準(zhǔn)。 1.2 異構(gòu)計(jì)算架構(gòu)下的能力矩陣 一體架構(gòu)的普及正在重構(gòu)工程師的知識(shí)體系: 近內(nèi)存計(jì)算
    發(fā)表于 08-26 10:40

    文看懂“一體

    今天這篇文章,我們來(lái)聊個(gè)最近幾年很火的概念——一體。為什么會(huì)提出“
    的頭像 發(fā)表于 08-18 12:15 ?1661次閱讀
    <b class='flag-5'>一</b>文看懂“<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>”

    一體技術(shù)加持!后摩智能 160TOPS 端邊大模型AI芯片正式發(fā)布

    ,同步推出力擎?系列M.2卡、力謀?系列加速卡及計(jì)算盒子等硬件組合,形成覆蓋移動(dòng)終端與邊緣場(chǎng)景的完整產(chǎn)品矩陣。這系列動(dòng)作標(biāo)志著后摩智能在一體
    的頭像 發(fā)表于 07-30 07:57 ?8905次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>技術(shù)加持!后摩智能 160TOPS 端邊大模型AI芯片正式發(fā)布

    緩解高性能一體芯片IR-drop問(wèn)題的軟硬件協(xié)同設(shè)計(jì)

    在高性能計(jì)算與AI芯片領(lǐng)域,基于SRAM的一體(Processing-In-Memory, PIM)架構(gòu)因兼具計(jì)算密度、能效和精度優(yōu)勢(shì)成為主流方案。隨著
    的頭像 發(fā)表于 07-11 15:11 ?1608次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片IR-drop問(wèn)題的軟硬件協(xié)同設(shè)計(jì)

    國(guó)際首創(chuàng)新突破!中國(guó)團(tuán)隊(duì)以一體排序架構(gòu)攻克智能硬件加速難題

    2025 年 6 月 25 日,北京大學(xué)團(tuán)隊(duì)在智能計(jì)算硬件方面取得領(lǐng)先突破,國(guó)際上首次實(shí)現(xiàn)了基于一體技術(shù)的高效排序硬件架構(gòu) (A fast and reconfigurable
    的頭像 發(fā)表于 07-02 16:50 ?986次閱讀
    國(guó)際首創(chuàng)新突破!中國(guó)團(tuán)隊(duì)以<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>排序架構(gòu)攻克智能硬件加速難題

    蘋芯科技 N300 一體 NPU,開啟端側(cè) AI 新征程

    隨著端側(cè)人工智能技術(shù)的爆發(fā)式增長(zhǎng),智能設(shè)備對(duì)本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構(gòu)在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問(wèn)題成為制約端側(cè)AI性能突破的關(guān)鍵掣肘。在這背景下,
    的頭像 發(fā)表于 05-06 17:01 ?1336次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側(cè) AI 新征程