chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

國際首創(chuàng)新突破!中國團隊以存算一體排序架構攻克智能硬件加速難題

半導體芯科技SiSC ? 來源:半導體芯科技SiSC ? 作者:半導體芯科技SiS ? 2025-07-02 16:50 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2025 年 6 月 25 日,北京大學團隊在智能計算硬件方面取得領先突破,國際上首次實現(xiàn)了基于存算一體技術的高效排序硬件架構 (A fast and reconfigurable sort-in-memory system based on memristors),解決了傳統(tǒng)計算架構面對復雜非線性排序問題時計算效率低下的瓶頸問題,在這一極難攻克的人工智能基礎算子加速領域形成優(yōu)勢,將為具身智能、大語言模型、智能駕駛、智慧交通、智慧城市等人工智能應用提供更高效算力支持。該成果由北京大學集成電路學院楊玉超教授、人工智能研究院陶耀宇研究員組成的團隊完成,已在國際頂級學術期刊《自然?電子》上發(fā)表。

chaijie_default.png

chaijie_default.png

排序加速:存算一體架構中難啃的 “硬骨頭”

排序,作為人工智能系統(tǒng)中最常用、最耗時的基礎操作之一,廣泛存在于自然語言處理、信息檢索、圖神經(jīng)網(wǎng)絡、智能決策等人工智能相關領域中。在傳統(tǒng)的馮?諾依曼計算架構中,處理器與存儲器分離的特點導致數(shù)據(jù)被頻繁搬運,嚴重制約了計算速度和系統(tǒng)能效,因此將存儲與計算融合的 “存算一體” 架構是突破硬件性能的必由之路。

例如在智能駕駛場景中,車輛在高速公路等簡單環(huán)境中,只需對周邊幾臺車的行進路線進行排序就能判斷是否會對自身安全產(chǎn)生影響,整個耗時可控制在毫秒級別,但在復雜的城市環(huán)境中風險來自周邊的數(shù)百個乃至更多的各類交通參與者,排序的復雜程度和硬件延遲大幅提高;再比如,在抖音、小紅書等平臺大的規(guī)模檢索與推薦系統(tǒng)中,用戶點擊、評分、相似度計算后,常需要對海量的候選內(nèi)容進行快速排序,找出最相關項,排序性能直接影響系統(tǒng)的響應時間和可擴展性;此外,在大語言模型訓練、機器人路徑規(guī)劃、強化學習搜索等場景中,快速評估多個決策或行動的優(yōu)劣并進行排序,也是必不可少而又極為費時的步驟。

然而,在傳統(tǒng)計算架構下,大規(guī)模的非線性排序難以在端側或邊緣設備高效完成,這一過程消耗大量時間與功耗,極大制約了具身智能、智能駕駛等新興技術的發(fā)展與普及。 近年來,“存算一體” 被認為是突破傳統(tǒng)硬件架構計算瓶頸的關鍵技術,已經(jīng)在矩陣計算等規(guī)則性強的數(shù)值計算中取得顯著成果。然而由于排序存在邏輯復雜、操作非線性、數(shù)據(jù)訪問不規(guī)則,缺乏通用、高效的硬件排序原語等諸多障礙,目前國際主流的存算一體架構均無法解決大數(shù)據(jù)排序問題,這一難題成為了制約下一代人工智能計算硬件發(fā)展的前沿焦點與核心卡點問題。

科研團隊圍繞 “讓數(shù)據(jù)就地排序” 的第一性原理目標,在存算一體架構上攻克了多個核心技術難題,實現(xiàn)了排序速度與能效的數(shù)量級提升。主要突破包括:首先,開發(fā)了一套基于新型存內(nèi)陣列結構的高并行比較機制;第二,開創(chuàng)性地引入了 “憶阻器陣列”,實現(xiàn)了低延遲、多通路的硬件級并行排序電路設計;第三,在算子層面,優(yōu)化了面向人工智能任務的算法 - 架構協(xié)同路徑,同時兼容現(xiàn)有矩陣計算;第四,完全自主設計的器件 - 電路 - 系統(tǒng)級技術棧整合。

在人工智能系統(tǒng)中,排序通常作為數(shù)據(jù)預處理或決策中間環(huán)節(jié)存在,一旦執(zhí)行效率不高,將成為整個系統(tǒng)的主要瓶頸。論文第一作者、北京大學集成電路學院博士生余連風介紹道,“排序的核心是比較運算,需要精準地實現(xiàn)‘條件判斷 + 數(shù)據(jù)搬移’,在復雜的應用場景中,要對不同因素的優(yōu)先級進行比較,因此排序的邏輯非常復雜。一般排序過程需要構建支持多級‘比較 - 選擇’的比較器單元,而傳統(tǒng)存算一體架構主要面向‘乘加’、‘累加’等操作,難以支持這樣的復雜運算,我們的工作成功解決了這一難題,設計了一種‘無比較器’的存算一體排序架構?!?/span>

據(jù)實測結果顯示,該硬件方案在典型排序任務中提升速度超 15 倍,面積效率提升超過 32 倍,具備并行處理百萬級數(shù)據(jù)元素排序任務的潛力,功耗僅為傳統(tǒng) CPUGPU 處理器的 1/10。在人工智能推理場景中,支持動態(tài)稀疏度下的推理響應速度可提升 70% 以上,特別適用于要求極高實時性的任務環(huán)境。論文通訊作者、北京大學人工智能研究院陶耀宇研究員說,“正因為排序計算在人工智能中是高頻、通用、基礎且極難處理的一類操作,這一難題的突破意味著存算一體從‘適合特定應用’走向‘可支持更廣泛的通用計算’,為人工智能相關任務構建了全鏈路的底層硬件架構支持。”

提高計算效率,打造加速引擎

據(jù)悉,該技術具有廣泛的應用前景,可用于智慧交通圖像排序系統(tǒng)、金融智能風控評分引擎、邊緣監(jiān)控設備的目標優(yōu)先識別模塊等場景。在測試中該技術展現(xiàn)出高速度與低功耗的顯著優(yōu)勢。例如,在智慧交通場景中,系統(tǒng)有望在毫秒級內(nèi)完成十萬級事件優(yōu)先級評估,為超大規(guī)模交通決策、應急響應調(diào)度等提供高效的實時算力支持。存算一體超高性能排序加速架構的成功突破,不僅是一次架構創(chuàng)新的勝利,更是將科研成果轉(zhuǎn)化為實際應用、服務國家重大戰(zhàn)略需求的重要行動。

“根據(jù)初步測算,若該技術在智能終端、工業(yè)控制、數(shù)據(jù)中心等核心應用場景中推廣,僅在邊緣 AI 芯片市場就可形成百億元級年產(chǎn)值潛力,大幅提升傳統(tǒng)算力系統(tǒng)的性能。北京大學科研團隊正是瞄準了‘算力’這個牛鼻子,聚焦‘存算一體’這一關鍵技術開展高強度科研攻關,實現(xiàn)了從器件到系統(tǒng)的全棧自主設計。這一成果不僅是技術層面的突破,更是攻克了存算一體化排序加速的‘硬骨頭’難題,在面向人工智能基礎操作的硬件加速領域?qū)崿F(xiàn)了突破,將為我國建設科技強國,實現(xiàn)高水平科技自立自強注入新算力。

來源:半導體芯科技

【2025全年計劃】

隸屬于ACT雅時國際商訊旗下的兩本優(yōu)秀雜志:《化合物半導體》&《半導體芯科技》2025年研討會全年計劃已出。

線上線下,共謀行業(yè)發(fā)展、產(chǎn)業(yè)進步!商機合作一覽無余,歡迎您點擊獲??!

https://www.compoundsemiconductorchina.net/seminar/

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 半導體
    +關注

    關注

    335

    文章

    28886

    瀏覽量

    237571
  • 智能硬件
    +關注

    關注

    205

    文章

    2387

    瀏覽量

    109230
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    緩解高性能一體芯片IR-drop問題的軟硬件協(xié)同設計

    在高性能計算與AI芯片領域,基于SRAM的一體(Processing-In-Memory, PIM)架構因兼具計算密度、能效和精度優(yōu)勢成為主流方案。隨著
    的頭像 發(fā)表于 07-11 15:11 ?118次閱讀
    緩解高性能<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>芯片IR-drop問題的軟<b class='flag-5'>硬件</b>協(xié)同設計

    蘋芯科技 N300 一體 NPU,開啟端側 AI 新征程

    隨著端側人工智能技術的爆發(fā)式增長,智能設備對本地力與能效的需求日益提高。而傳統(tǒng)馮·諾依曼架構在數(shù)據(jù)處理效率上存在瓶頸,“內(nèi)存墻”問題成為制約端側AI性能
    的頭像 發(fā)表于 05-06 17:01 ?449次閱讀
    蘋芯科技 N300 <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b> NPU,開啟端側 AI 新征程

    億鑄科技亮相2025中國移動云智大會

    2025年4月10-11日,中國移動云智大會在蘇州金雞湖國際會議中心成功舉辦。作為AI芯片領域的創(chuàng)新企業(yè),億鑄科技受邀參加此次盛會,并在大會發(fā)表重要演講,展示公司在
    的頭像 發(fā)表于 04-12 13:46 ?434次閱讀
    億鑄科技亮相2025<b class='flag-5'>中國</b>移動云智<b class='flag-5'>算</b>大會

    午芯芯科技國產(chǎn)電容式MEMS壓力傳感器芯片突破卡脖子技術

    本帖最后由 jf_94815006 于 2025-4-25 10:11 編輯 午芯芯科技(遼寧省)有限公司是專注于MEMS芯片和集成電路的研發(fā)、設計、生產(chǎn)、銷售于一體的科技創(chuàng)新型企業(yè)。午芯芯
    發(fā)表于 02-19 12:19

    濟南市中區(qū)一體化智中心上線DeepSeek

    濟南市中未來產(chǎn)業(yè)發(fā)展有限公司(簡稱“市中產(chǎn)發(fā)”)聯(lián)合華為、北京昇騰和清昴智能基于市中區(qū)一體化智中心(國家大學科技園節(jié)點)昇騰
    的頭像 發(fā)表于 02-19 10:38 ?701次閱讀

    梯度科技推出DeepSeek智一體

    近日,梯度科技搭載DeepSeek大模型的智一體機正式發(fā)布。該產(chǎn)品基于“國產(chǎn)服務器+國產(chǎn)GPU+自主算法”核心架構,搭載梯度科技人工智能應用開發(fā)平臺,形成了軟硬
    的頭像 發(fā)表于 02-17 09:53 ?806次閱讀

    澎峰科技發(fā)布DeepSeek智一體

    人工智能普惠化迎來里程碑式突破!澎峰科技發(fā)布業(yè)內(nèi)“首款”萬元級別DeepSeek智一體機,本地運行671B滿血模型。
    的頭像 發(fā)表于 02-15 16:29 ?1502次閱讀

    一體行業(yè)2024年回顧與2025年展望

    2024年,大模型技術的迅猛發(fā)展成為人工智能領域的核心驅(qū)動力,其對硬件力和存儲效率的極致需求,促使
    的頭像 發(fā)表于 01-23 11:24 ?1062次閱讀

    開源芯片系列講座第24期:基于SRAM的高效計算架構

    種先進的計算架構技術,克服傳統(tǒng)馮諾依曼架構中計算單元與存儲單元分離導致的“內(nèi)存墻”問題?;赟RAM的
    的頭像 發(fā)表于 11-27 01:05 ?847次閱讀
    開源芯片系列講座第24期:基于SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b>的高效計算<b class='flag-5'>架構</b>

    直播預約 |開源芯片系列講座第24期:SRAM一體:賦能高能效RISC-V計算

    RISC-V計算報告簡介一體種先進的計算架構技術,克服傳統(tǒng)馮諾依曼
    的頭像 發(fā)表于 11-16 01:10 ?705次閱讀
    直播預約 |開源芯片系列講座第24期:SRAM<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>:賦能高能效RISC-V計算

    一體化與邊緣計算:重新定義智能計算的未來

    隨著數(shù)據(jù)量爆炸式增長和智能化應用的普及,計算與存儲的高效整合逐漸成為科技行業(yè)關注的重點。數(shù)據(jù)存儲和處理需求的快速增長推動了對計算架構的重新設計,“
    的頭像 發(fā)表于 11-12 01:05 ?819次閱讀
    <b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>化與邊緣計算:重新定義<b class='flag-5'>智能</b>計算的未來

    一體架構創(chuàng)新助力國產(chǎn)大力AI芯片騰飛

    在灣芯展SEMiBAY2024《AI芯片與高性能計算(HPC)應用論壇》上,億鑄科技高級副總裁徐芳發(fā)表了題為《一體架構創(chuàng)新助力國產(chǎn)大
    的頭像 發(fā)表于 10-23 14:48 ?858次閱讀

    科技新突破:首款支持多模態(tài)一體AI芯片成功問世

    一體介質(zhì),通過存儲單元和計算單元的深度融合,采用22nm成熟工藝制程,有效把控制造成本。與傳統(tǒng)架構下的AI芯片相比,該款芯片在力、能效
    發(fā)表于 09-26 13:51 ?665次閱讀
    科技新<b class='flag-5'>突破</b>:首款支持多模態(tài)<b class='flag-5'>存</b><b class='flag-5'>算</b><b class='flag-5'>一體</b>AI芯片成功問世

    后摩智能首款一體智駕芯片獲評突出創(chuàng)新產(chǎn)品獎

    近日,2024年6月29日,由深圳市汽車電子行業(yè)協(xié)會主辦的「第十三屆國際汽車電子產(chǎn)業(yè)峰會暨2023年度汽車電子科學技術獎頒獎典禮」在深圳寶安隆重舉行。后摩智能首款
    的頭像 發(fā)表于 09-24 16:51 ?893次閱讀

    蘋芯科技引領存一體技術革新 PIMCHIP系列芯片重塑AI計算新格局

    智能芯片國產(chǎn)化再傳利好,8月8日,國際領先的一體芯片開拓者——蘋芯科技在北京召開 “
    發(fā)表于 08-08 17:21 ?399次閱讀
    蘋芯科技引領存<b class='flag-5'>算</b><b class='flag-5'>一體</b>技術革新   PIMCHIP系列芯片重塑AI計算新格局