chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

存內(nèi)計算芯片,熱度大增

穎脈Imgtec ? 2025-10-28 10:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

來源:由半導(dǎo)體行業(yè)觀察編譯自semiengineering


研究人員專注于限制數(shù)據(jù)移動以減少邊緣設(shè)備的功耗和延遲。在大眾媒體中,“人工智能”通常意味著在昂貴且耗電的數(shù)據(jù)中心運行的大型語言模型。然而,對于許多應(yīng)用程序來說,在本地硬件上運行的小型模型更為合適。自動駕駛汽車需要實時響應(yīng),避免數(shù)據(jù)傳輸延遲。醫(yī)療和工業(yè)應(yīng)用通常依賴于無法與第三方共享的敏感數(shù)據(jù)。盡管邊緣人工智能應(yīng)用速度更快、更安全,但它們的計算資源卻非常有限。它們無法擁有 TB 級的內(nèi)存空間或幾乎無限的計算能力。對于數(shù)據(jù)中心來說,這些限制可能有些抽象,但卻對邊緣人工智能施加了嚴(yán)格的限制。在2025年IEEE國際內(nèi)存研討會的一篇受邀論文及其后續(xù)預(yù)印本中,蘇黎世聯(lián)邦理工學(xué)院計算機科學(xué)教授Onur Mutlu及其同事指出,在典型的移動工作負(fù)載中,數(shù)據(jù)在內(nèi)存中的移動占總能耗的62%,這一比例令人震驚。內(nèi)存是硬件資源的最大消耗者,而且遙遙領(lǐng)先,但內(nèi)存延遲往往是執(zhí)行時間的最大貢獻者。多年來,器件規(guī)模的擴大一直是降低功耗的關(guān)鍵,但現(xiàn)在卻使問題更加嚴(yán)重。Mutlu 表示,規(guī)模龐大的 DRAM 穩(wěn)定性較差,需要更頻繁的刷新周期。大型內(nèi)存陣列的訪問難度也更大,因為帶寬的增長速度不如內(nèi)存條本身的增長速度快。內(nèi)存和近內(nèi)存計算提供了可能的解決方案。即使是商用的現(xiàn)成 DRAM,只要軟件基礎(chǔ)設(shè)施支持,也可以執(zhí)行原始的數(shù)據(jù)復(fù)制、初始化和按位邏輯運算。


混合解決方案結(jié)合了RRAM和鐵電體

然而,DRAM刷新功率的問題仍然存在。在神經(jīng)網(wǎng)絡(luò)模型中,訓(xùn)練和推理任務(wù)都會重復(fù)使用存儲的權(quán)重矩陣。然而,兩者的要求卻截然不同。正如 CEA-Leti 的 Michele Martemucci 及其同事所解釋的那樣,訓(xùn)練任務(wù)涉及對權(quán)重矩陣進行多次小幅更新,使其逐漸收斂到穩(wěn)定值。這些任務(wù)需要具有高寫入耐久性和存儲精確值能力的內(nèi)存。相比之下,推理任務(wù)使用穩(wěn)定不變的權(quán)重矩陣,但可能會將其多次應(yīng)用于輸入數(shù)據(jù)。推理任務(wù)受益于具有高讀取耐久性的非易失性存儲器。在這兩種情況下,近內(nèi)存計算都需要與標(biāo)準(zhǔn) CMOS 邏輯工藝兼容的設(shè)備。RRAM 是一種簡單的器件,依靠氧化層中形成的導(dǎo)電細(xì)絲來實現(xiàn)極高的讀取耐久性。通過精心設(shè)計的編程方案,它們可以存儲模擬值,從而減小存儲器陣列的大小。Martemucci 表示,RRAM 技術(shù)已經(jīng)足夠成熟,可以在邊緣推理場景中進行商業(yè)部署。遺憾的是,RRAM 的寫入耐久性相對較低。隨著時間的推移,編程脈沖會模糊存儲值之間的電阻差異。設(shè)計人員通常使用傳統(tǒng)硬件訓(xùn)練模型,然后將預(yù)先計算的權(quán)重加載到 RRAM 陣列中。然而,在許多應(yīng)用中,邊緣設(shè)備需要具備“學(xué)習(xí)”能力。它要么需要根據(jù)用戶的特定需求進行訓(xùn)練,要么需要修改模型以反映實際流程的變化。與此同時,鐵電電容器支持非??焖俚拈_關(guān)和極高的寫入耐久性。它們可以輕松承受訓(xùn)練任務(wù)中遇到的頻繁寫入操作。然而,雖然存儲的值是非易失性的,但讀取操作卻具有破壞性。Martemucci 表示,這些設(shè)備不適合長期存儲權(quán)重矩陣,也不適合需要頻繁讀取操作的推理任務(wù)。將鐵電晶體管集成到CMOS工藝中非常復(fù)雜,需要高溫工藝和額外的掩模層。鐵電電容器和隧道結(jié)則簡單得多,這使得多個研究小組能夠?qū)RAM和鐵電結(jié)構(gòu)結(jié)合起來。例如,在今年的VLSI技術(shù)研討會上,SK海力士的研究人員展示了一種兼具電阻和鐵電開關(guān)功能的混合鐵電隧道結(jié)(FTJ)。在傳統(tǒng)的FTJ中,頂部和底部電極之間的隧道勢壘取決于鐵電極性。SK海力士的器件將鐵電鉿鋯氧化物(HZO)層夾在兩個電極之間,鉭層用作氧空位儲存器。鉭層附近的導(dǎo)電細(xì)絲在器件頂部提供歐姆導(dǎo)電,從而降低了鐵電隧道勢壘的有效厚度。這些器件實現(xiàn)了精確的模擬乘法累加運算,效率高達(dá)每瓦224.4萬億次運算(TOPS/W)。在另一種混合方法中,Martemucci 團隊將摻雜硅的 HfO2電容器與鈦氧清除層結(jié)合到標(biāo)準(zhǔn) CMOS BEOL 工藝中。這些器件最初表現(xiàn)為鐵電電容器,其中一些器件接收一次性“喚醒”脈沖以穩(wěn)定鐵電響應(yīng)。同時,電容器陣列的另一部分經(jīng)過一次性“成型”工藝,形成由氧空位構(gòu)成的導(dǎo)電細(xì)絲。鈦層充當(dāng)氧空位儲存器,防止細(xì)絲溶解。由此產(chǎn)生的憶阻器器件可以在高阻和低阻狀態(tài)之間切換。圖 1:金屬-鐵電-金屬疊層既可以用作 FeCAP,也可以用作憶阻器鐵電電容器充當(dāng)二進制元件,存儲用于訓(xùn)練計算的高精度權(quán)重。憶阻器存儲的模擬權(quán)重精度足以應(yīng)對推理任務(wù)。在訓(xùn)練過程中,憶阻器陣列每完成100個輸入步驟后更新一次,而鐵電陣列則持續(xù)更新。訓(xùn)練此結(jié)構(gòu)進行標(biāo)準(zhǔn)數(shù)字識別任務(wù)所需的寫入操作總數(shù)比憶阻器耐久性小17倍,比鐵電電容器耐久性小75倍,而能耗比持續(xù)更新憶阻器陣列所需能耗低38倍。


人工智能不僅僅是神經(jīng)網(wǎng)絡(luò)內(nèi)存計算不僅可以提高傳統(tǒng)神經(jīng)網(wǎng)絡(luò)計算的能效,還能促進其他建模方法的發(fā)展。例如,許多計算難度高的問題可以建模為伊辛玻璃,即一組連接的節(jié)點共同演化到最低能量狀態(tài)。[ ? 4] 現(xiàn)實世界中,這類問題可能涉及數(shù)千甚至數(shù)百萬個連接。解決伊辛玻璃問題是量子計算最引人入勝的潛在應(yīng)用之一。更傳統(tǒng)的方法是,在去年的IEEE電子設(shè)備會議上,德克薩斯大學(xué)研究員Tanvir Haider Pantha和他的同事們提出構(gòu)建一個三維結(jié)構(gòu),將FeFET融入CMOS邏輯工藝的BEOL(后道工藝)。每個節(jié)點由四個交叉耦合的FeFET組成,可以存儲一個有符號的模擬值,該值映射到待解決問題的伊辛耦合矩陣。每個節(jié)點的輸出是其相鄰節(jié)點的輸入,從而在整個網(wǎng)絡(luò)中建立振蕩,最終達(dá)到穩(wěn)定的最小能量配置。圖 2:四個交叉耦合雙柵 FeFET 構(gòu)成相變納米振蕩器。提出的伊辛玻璃模型每個節(jié)點使用其中一種結(jié)構(gòu)


內(nèi)存計算需要新框架傳統(tǒng)的 CPUGPU 是通用設(shè)備。只需更改軟件即可應(yīng)用于許多不同的問題。近內(nèi)存和內(nèi)存加速器目前與其預(yù)期任務(wù)密不可分。伊辛玻璃求解器、點云網(wǎng)絡(luò)和圖像識別網(wǎng)絡(luò)將以不同的方式處理數(shù)據(jù),需要不同的硬件設(shè)計。據(jù) Mutlu 稱,內(nèi)存計算的下一步將需要能夠重新映射內(nèi)存訪問以滿足特定問題要求的軟件框架。反過來,這些框架將需要能夠獨立于外部內(nèi)存控制器進行自我管理的內(nèi)存硬件。

原文鏈接https://semiengineering.com/why-in-memory-computation-is-so-important-for-edge-ai/

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53279

    瀏覽量

    455611
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49546

    瀏覽量

    259489
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    緩解高性能算一體芯片IR-drop問題的軟硬件協(xié)同設(shè)計

    在高性能計算與AI芯片領(lǐng)域,基于SRAM的算一體(Processing-In-Memory, PIM)架構(gòu)因兼具計算密度、能效和精度優(yōu)勢成為主流方案。隨著
    的頭像 發(fā)表于 07-11 15:11 ?655次閱讀
    緩解高性能<b class='flag-5'>存</b>算一體<b class='flag-5'>芯片</b>IR-drop問題的軟硬件協(xié)同設(shè)計

    得一微定義“AI芯片”,讓每比特數(shù)據(jù)創(chuàng)造更多智能

    在AI技術(shù)重塑全球產(chǎn)業(yè)格局的進程中,計算范式正經(jīng)歷從運算器為中心到存儲器為中心的范式躍遷。這一變革重新定義了“先進力”的邊界。 得一微電子首次創(chuàng)造性地提出“AI芯片”的技術(shù)概念。
    的頭像 發(fā)表于 06-04 09:03 ?403次閱讀

    第二屆知科技杯華東高校內(nèi)計算創(chuàng)新應(yīng)用大賽正式啟動

    在數(shù)字化浪潮席卷各行業(yè)的當(dāng)下,數(shù)據(jù)量呈爆炸式增長,算力需求也水漲船高。內(nèi)計算架構(gòu)作為創(chuàng)新解決方案,備受產(chǎn)學(xué)研各界關(guān)注。為推動內(nèi)
    的頭像 發(fā)表于 05-06 17:51 ?652次閱讀

    科技入選杭州AI“18羅漢”企業(yè)

    ,聚焦人工智能領(lǐng)域的新生代,代表人工智能產(chǎn)業(yè)的未來,從而全面展現(xiàn)杭州AI生態(tài)。知科技憑借其在內(nèi)計算芯片領(lǐng)域的卓越表現(xiàn)入選杭州 AI“18
    的頭像 發(fā)表于 04-28 11:50 ?941次閱讀

    得一微:AI芯片,重構(gòu)計算范式

    。 ? 在近日舉行的MemoryS 2025上,得一微電子(YEESTOR)展示了其“IP設(shè)計-芯片設(shè)計-算法驅(qū)動-力創(chuàng)新”的全鏈條技術(shù)實力。公司首席市場官羅挺接受電子發(fā)燒友采訪時表示,得一微在業(yè)界首次提出“AI
    的頭像 發(fā)表于 04-21 16:22 ?1633次閱讀
    得一微:AI<b class='flag-5'>存</b>力<b class='flag-5'>芯片</b>,重構(gòu)<b class='flag-5'>計算</b>范式

    國產(chǎn)NSI1300D05-DSWVR放大芯片大增益8.2或41的問題

    國產(chǎn)NSI1300D05-DSWVR放大芯片大增益8.2或41的問題,到底是放大8。2倍還是41倍,真實無法理解,那個大神給指導(dǎo)下,多謝!
    發(fā)表于 02-16 20:24

    專注內(nèi)計算的知科技榮獲2024全球(中國)半導(dǎo)體市場年度最佳企業(yè)獎

    ,簡稱WICA)頒發(fā)的“2024全球(中國)半導(dǎo)體市場年度最佳企業(yè)獎”。這一榮譽不僅是對知科技市場綜合競爭力的認(rèn)可,也是對算一體芯片未來發(fā)展前景的看好。 據(jù)世界集成電路協(xié)會在峰會現(xiàn)場發(fā)布的《全球半導(dǎo)體市場趨勢展望及百強企業(yè)高
    的頭像 發(fā)表于 12-11 17:33 ?2537次閱讀
    專注<b class='flag-5'>存</b><b class='flag-5'>內(nèi)</b><b class='flag-5'>計算</b>的知<b class='flag-5'>存</b>科技榮獲2024全球(中國)半導(dǎo)體市場年度最佳企業(yè)獎

    開源芯片系列講座第24期:基于SRAM算的高效計算架構(gòu)

    鷺島論壇開源芯片系列講座第24期「基于SRAM算的高效計算架構(gòu)」明晚(27日)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目基于SRAM算的高效
    的頭像 發(fā)表于 11-27 01:05 ?1140次閱讀
    開源<b class='flag-5'>芯片</b>系列講座第24期:基于SRAM<b class='flag-5'>存</b>算的高效<b class='flag-5'>計算</b>架構(gòu)

    科技啟動首屆內(nèi)計算創(chuàng)新大賽

    內(nèi)計算作為一項打破“內(nèi)存墻”“功耗墻”的顛覆性技術(shù),消除了與算的界限,相比CPU或GPU能夠?qū)崿F(xiàn)更高計算并行度、更大專用算力,達(dá)成數(shù)量級
    的頭像 發(fā)表于 11-21 10:44 ?848次閱讀

    直播預(yù)約 |開源芯片系列講座第24期:SRAM算一體:賦能高能效RISC-V計算

    鷺島論壇開源芯片系列講座第24期「SRAM算一體:賦能高能效RISC-V計算」11月27日(周三)20:00精彩開播期待與您云相聚,共襄學(xué)術(shù)盛宴!|直播信息報告題目SRAM算一體:
    的頭像 發(fā)表于 11-16 01:10 ?982次閱讀
    直播預(yù)約 |開源<b class='flag-5'>芯片</b>系列講座第24期:SRAM<b class='flag-5'>存</b>算一體:賦能高能效RISC-V<b class='flag-5'>計算</b>

    算一體化與邊緣計算:重新定義智能計算的未來

    隨著數(shù)據(jù)量爆炸式增長和智能化應(yīng)用的普及,計算與存儲的高效整合逐漸成為科技行業(yè)關(guān)注的重點。數(shù)據(jù)存儲和處理需求的快速增長推動了對計算架構(gòu)的重新設(shè)計,“算一體化”技術(shù)應(yīng)運而生。同時,隨著物聯(lián)網(wǎng)、5G網(wǎng)絡(luò)
    的頭像 發(fā)表于 11-12 01:05 ?1184次閱讀
    <b class='flag-5'>存</b>算一體化與邊緣<b class='flag-5'>計算</b>:重新定義智能<b class='flag-5'>計算</b>的未來

    科技榮獲2024中國AI算力層創(chuàng)新企業(yè)

    科技入榜【2024中國AI算力層創(chuàng)新企業(yè)】,憑借在創(chuàng)新內(nèi)計算芯片領(lǐng)域的高能效算力創(chuàng)新實踐和亮眼市場表現(xiàn)獲得智庫專家評委的認(rèn)可。
    的頭像 發(fā)表于 11-06 15:30 ?1196次閱讀

    科技WTM2101芯片助力導(dǎo)覽行業(yè)AI新體驗

    科技WTM2101憑借顛覆性的內(nèi)計算架構(gòu),能夠在極低功耗和延時下運行智能語音、智能健康監(jiān)測算法,已經(jīng)率先落地AR眼鏡、藍(lán)牙耳機等領(lǐng)域?qū)崿F(xiàn)百萬級終端應(yīng)用。近日,WTM2101被創(chuàng)新
    的頭像 發(fā)表于 11-06 15:27 ?1223次閱讀

    科技邀您相約第二屆集成芯片和芯粒大會

    國科學(xué)院計算技術(shù)研究所、復(fù)旦大學(xué)主辦。知科技將攜領(lǐng)先的內(nèi)計算成果及“天才博士計劃”(點擊回顧“天才博士計劃”)加入本屆大會,歡迎現(xiàn)場的優(yōu)
    的頭像 發(fā)表于 11-06 15:25 ?1215次閱讀

    科技芯片測試總部基地開業(yè)

    近日,深圳市晶科技股份有限公司(簡稱:晶科技)迎來又一重要里程碑。其全資子公司——中山晶技術(shù)有限公司,作為晶科技的存儲芯片測試總部基
    的頭像 發(fā)表于 10-29 17:01 ?1169次閱讀