chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

華人學者Nature上發(fā)表最新成果 世界最快光子AI加速器

工程師鄧生 ? 來源:《Light: Science & App ? 作者:徐興元 ? 2021-01-11 15:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工神經(jīng)網(wǎng)絡廣泛應用于人臉識別、語音翻譯、醫(yī)療診斷、自動駕駛等重要領域,其性能主要由硬件算力決定,目前所廣泛應用的神經(jīng)網(wǎng)絡硬件都基于數(shù)字電子架構。然而,該架構的兩個本質局限—馮諾曼依瓶頸與電子速率瓶頸,極大限制了神經(jīng)網(wǎng)絡硬件的潛在算力。首先,數(shù)字架構中,數(shù)據(jù)的存儲和運算是分布式的,因而在計算過程中,會有大量的能源和算力消耗在數(shù)據(jù)的反復讀取和存儲中,此限制被稱為馮諾曼依瓶頸。其次,由于電子微處理器中的寄生電容和互聯(lián)時延問題,電子系統(tǒng)存在著本質的帶寬限制,導致電子微處理器的主頻事實上在過去十年已沒有明顯提升,此限制也被稱為電子速率瓶頸。

光子神經(jīng)網(wǎng)絡工作于模擬架構中,即數(shù)據(jù)在硬件系統(tǒng)中的實時位置與進行運算的位置相同,因而規(guī)避了馮諾曼依瓶頸。此外,寬達數(shù)十太赫茲的光譜也為高速運算提供了充足的帶寬。目前已有來自加州大學、麻省理工學院、明斯特大學等單位的研究團隊做出了一系列在網(wǎng)絡尺度、可集成性、片上存儲等方面的突破,然而尚未能實現(xiàn)較高運算速度與高維數(shù)據(jù)處理能力,光子神經(jīng)網(wǎng)絡的超高運算潛力尚未得到證實。

近日,澳大利亞研究人員徐興元博士(莫納什大學)、譚朦曦博士、David Moss教授(斯文本科技大學)、Arnan Mitchell教授(皇家墨爾本理工大學)等首次提出并實現(xiàn)了基于波長、時間交織的光子卷積加速器。該文章以“ 11 TOPS photonic convolutional accelerator for optical neural networks”為題發(fā)表在Nature。

研究人員通過采用集成高品質因素、高非線性微環(huán)與波導色散調控,實現(xiàn)了高相干度、易于產(chǎn)生的集成克爾孤子晶體光頻梳。

研究人員將該光頻梳進行頻域整形并且與高速光電調制相結合,實現(xiàn)了輸入數(shù)據(jù)在并行波長通道上的組播與加權,然后采用光學色散介質作為緩存,對組播信號進行了步進延時(步長為單個碼元時長),從而在時域上對齊了不同波長通道中需要加權求和的碼元,最后通過光電轉換實現(xiàn)處理結果的高速實時讀?。ㄈ鐖D1所示)。通過這一系列步驟,波長構架的卷積窗口(感知域)即可在時域以超過60GBaud的速率滑動,結合克爾光頻梳所實現(xiàn)的高并行度(C波段90個波長通道),實現(xiàn)了11 TOPS(太運算每秒)的運算速度,即每秒可完成11萬億次運算。

1610351104722.jpg

圖1 卷積加速器工作原理

圖源:Nature 589, 44–51 (2021)。 Fig 1

通過這一系列步驟,數(shù)學模型抽象的神經(jīng)元突觸就被光頻梳在實際物理系統(tǒng)中實現(xiàn),其中突觸連接的權重由光頻梳的光功率體現(xiàn)。最終實驗驗證了高維圖片處理(實驗結果如圖2所示)以及深度學習光子卷積神經(jīng)網(wǎng)絡(實驗結果如圖3所示)。

1610351144513.jpg

圖2 卷積圖像處理結果

圖源:Nature 589, 44–51 (2021)。 Fig 3

在國際相關研究成果的基礎上實現(xiàn)了數(shù)個突破,包括:

1. 由于集成克爾光頻梳所提供的大量波長通道,運算速度首次突破到11 TOPS以上;

2. 首次實現(xiàn)了利用光學手段進行高維數(shù)據(jù)處理(25萬像素點),為光子神經(jīng)網(wǎng)絡的進一步實際應用如人臉識別等展現(xiàn)了可能;

3. 實現(xiàn)了500張MINIST手寫數(shù)字圖片的高速分類預測,準確率達到88%以上;

4. 實現(xiàn)了具備高速光電接口的硬件加速器,速度可達64G Baud以上,并且可與現(xiàn)有電子或者光學硬件兼容互聯(lián);

5. 結合應用了集成克爾光頻梳,為實現(xiàn)光子神經(jīng)網(wǎng)絡的單片集成奠定了基礎。

1610351182692.jpg

圖3 卷積神經(jīng)網(wǎng)絡50張手寫數(shù)字識別結果。上圖為全連接層神經(jīng)元輸出幅度,下圖為混淆矩陣。

圖源:Nature 589, 44–51 (2021)。 Fig 6

后續(xù),研究人員將繼續(xù)優(yōu)化本方案的性能指標,如處理速度、并行度、體積與可集成性、功耗等。本工作實驗證明了光子神經(jīng)網(wǎng)絡硬件的運算潛力,并且具有高速光電接口,未來可作為通用卷積特征提取前端與其他光電模數(shù)架構互聯(lián),在卷積神經(jīng)網(wǎng)絡中可承擔70%以上的運算負荷,大幅提升系統(tǒng)整體算力,在未來實時人工智能應用場景如無人駕駛、醫(yī)療診斷等方面有重要應用。

責任編輯:PSY

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 晶體管
    +關注

    關注

    78

    文章

    10449

    瀏覽量

    148738
  • 人工智能
    +關注

    關注

    1821

    文章

    50388

    瀏覽量

    267149
  • 光子芯片
    +關注

    關注

    3

    文章

    110

    瀏覽量

    25305
  • AI加速器
    +關注

    關注

    1

    文章

    73

    瀏覽量

    9546
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實現(xiàn)中的一些功能?

    )。 如何使用 powerquad 加速器中的一些功能以及 CMSIS 原始實現(xiàn)中的一些功能。 Example: I do not want to call arm_mat_trans_q15 powerquad
    發(fā)表于 04-03 06:37

    維信諾與清華北大合作成果亮相國際頂級期刊Nature

    1月28日,清華大學聯(lián)合北京大學與維信諾合作開發(fā)的世界首款柔性存算芯片——FLEXI,在國際頂級期刊《自然》(Nature發(fā)表。這標志著我國在柔性電子與邊緣人工智能硬件領域取得重要
    的頭像 發(fā)表于 02-11 14:31 ?663次閱讀

    使用NORDIC AI的好處

    <5 KB),可在任何 Nordic SoC/SiP 的主 CPU 運行,適合加速度計、IMU、PPG、溫度、電流等時序傳感數(shù)據(jù)的 AI 任務。[Nordic Edge
    發(fā)表于 01-31 23:16

    Nature傳感新子刊第一篇論文出爐,中國青年學者聯(lián)手撰寫

    ? ? 近期,知名學術期刊《Nature》(《自然》)旗下專注于傳感研究領域的子刊《Nature Sensors》,刊發(fā)了創(chuàng)刊以來的第一篇論文。 ? ? 《Nature Sensor
    的頭像 發(fā)表于 11-27 15:04 ?1070次閱讀
    <b class='flag-5'>Nature</b>傳感<b class='flag-5'>器</b>新子刊第一篇論文出爐,中國青年<b class='flag-5'>學者</b>聯(lián)手撰寫

    邊緣計算中的AI加速器類型與應用

    人工智能正在推動對更快速、更智能、更高效計算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實際。這正是邊緣計算中AI加速器變得不可或缺的原因。這種專用硬件能夠直接在邊緣設備
    的頭像 發(fā)表于 11-06 13:42 ?1047次閱讀
    邊緣計算中的<b class='flag-5'>AI</b><b class='flag-5'>加速器</b>類型與應用

    亞馬遜云科技第三期創(chuàng)業(yè)加速器圓滿收官 助力初創(chuàng)釋放Agentic AI潛力 加速全球化進程

    北京——2025年10月28日 ,亞馬遜云科技第三期創(chuàng)業(yè)加速器項目圓滿收官。35家入營企業(yè)齊聚一堂,分享了各自的業(yè)務發(fā)展情況,以及參與本期加速器的收獲及體驗。第三期創(chuàng)業(yè)加速器持續(xù)聚焦AI
    的頭像 發(fā)表于 10-29 15:18 ?1087次閱讀

    航裕電源以大電流技術為國內外超導加速器項目提供優(yōu)質方案

    航裕電源:以大電流技術,護航尖端科技 大科學裝置建設熱潮中,超導加速器作為探索微觀世界、推動前沿科研的 “國之重”,對供電系統(tǒng)的穩(wěn)定性、精度及功率提出極致要求。航裕電源以31.5kA、80kA萬安
    的頭像 發(fā)表于 10-12 15:02 ?1792次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學習AI芯片的創(chuàng)新方法與架構

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實現(xiàn)深度學習AI芯片 1、基于開源RISC-V的AI加速器 RISC-V是一種開源、模塊化的指令集架構(ISA)。優(yōu)勢如下: ①模塊化特性②標準接口③開源
    發(fā)表于 09-12 17:30

    Andes晶心科技推出新一代深度學習加速器

    高效能、低功耗 32/64 位 RISC-V 處理核與 AI 加速解決方案的領導供貨商—Andes晶心科技(Andes Technology)今日正式發(fā)表最新深度學習
    的頭像 發(fā)表于 08-20 17:43 ?3161次閱讀

    Arm神經(jīng)技術是業(yè)界首創(chuàng)在 Arm GPU 增添專用神經(jīng)加速器的技術,移動設備實現(xiàn)PC級別的AI圖形性能

    Arm 神經(jīng)技術是業(yè)界首創(chuàng)在 Arm GPU 增添專用神經(jīng)加速器的技術,首次在移動設備實現(xiàn) PC 級別的 AI 圖形性能,為未來的端側 AI
    的頭像 發(fā)表于 08-14 17:59 ?2954次閱讀

    森木磊石受邀出席重離子加速器電源規(guī)劃發(fā)展研討會,共探行業(yè)前沿趨勢

    近日,武漢森木磊石科技有限公司(簡稱“森木磊石”)受邀參加重離子加速器電源規(guī)劃發(fā)展研討會,并就電源技術創(chuàng)新成果進行了專題匯報。研討會采用線上線下結合的會議形式,匯聚了中國科學院近代物理研究所及多家
    的頭像 發(fā)表于 08-14 14:03 ?1018次閱讀
    森木磊石受邀出席重離子<b class='flag-5'>加速器</b>電源規(guī)劃發(fā)展研討會,共探行業(yè)前沿趨勢

    高壓放大器在粒子加速器研究中的應用

    粒子加速器是現(xiàn)代科學研究中不可或缺的大型實驗裝置,廣泛應用于物理學、化學、材料科學、生物學等多個領域。其核心原理是利用電場和磁場對帶電粒子進行加速和約束,使粒子達到極高的能量,從而為研究微觀世界
    的頭像 發(fā)表于 06-19 17:09 ?730次閱讀
    高壓放大器在粒子<b class='flag-5'>加速器</b>研究中的應用

    粒子加速器?——?科技前沿的核心裝置

    粒子加速器全稱“荷電粒子加速器”,是一種利用電磁場在高真空環(huán)境中對帶電粒子(如電子、質子、離子)進行加速和控制,使其獲得高能量的特種裝置。粒子加速器技術現(xiàn)已發(fā)展成為集高能物理、核物理、
    的頭像 發(fā)表于 06-19 12:05 ?4231次閱讀
    粒子<b class='flag-5'>加速器</b>?——?科技前沿的核心裝置

    機器學習賦能的智能光子學器件系統(tǒng)研究與應用

    與應用 在人工智能與光子學設計融合的背景下,科研的邊界持續(xù)擴展,創(chuàng)新成果不斷涌現(xiàn)。從理論模型的整合到光學現(xiàn)象的復雜模擬,從數(shù)據(jù)驅動的探索到光場的智能分析,機器學習正以前所未有的動力推動光子學領域的革新。據(jù)調查,目前在
    的頭像 發(fā)表于 06-04 17:59 ?787次閱讀
    機器學習賦能的智能<b class='flag-5'>光子</b>學器件系統(tǒng)研究與應用

    基于雙向塊浮點量化的大語言模型高效加速器設計

    本文提出雙向塊浮點(BBFP)量化格式及基于其的LLMs加速器BBAL,通過雙向移位與重疊位設計顯著降低量化誤差,提升非線性計算效率,實現(xiàn)精度、吞吐量和能效的顯著優(yōu)化,相關成果被國際頂級會議 DAC 2025 接收。
    的頭像 發(fā)表于 05-14 13:40 ?2541次閱讀
    基于雙向塊浮點量化的大語言模型高效<b class='flag-5'>加速器</b>設計