chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Lightmatter公司推出用于通用AI加速的光子計算測試芯片

我快閉嘴 ? 來源:芯東西 ? 作者:芯東西 ? 2020-09-02 17:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AI芯片的下一個創(chuàng)新點在哪兒?光子計算或許能提供新的啟發(fā)。8月31日報道,在剛落幕不久的Hot Chips 32大會上,脫胎于麻省理工學(xué)院的初創(chuàng)公司Lightmatter展示了用于通用AI加速的光子計算測試芯片。該處理器利用硅光子和MEMS技術(shù),以光速處理矩陣向量乘法,由毫瓦級激光光源供電。據(jù)悉,在相同芯片面積上,光子器件的速度比電子器件快1000倍,而功耗僅有電子器件的1/1000。

Lightmatter于2017年在馬薩諸塞州波士頓市成立,目前有46名員工,已從Google Ventures等投資方處融資3300萬美元,擁有30項專利。

作為最早面向AI推理定制光子芯片的公司之一,Lightmatter將于2021年秋季推出其首款商業(yè)產(chǎn)品——搭載光子計算芯片的PCIe卡,專為數(shù)據(jù)中心AI推理工作負載而設(shè)計。

一、能效提升20倍,吞吐量提高5倍

得益于硅光子技術(shù)的進步,硅芯片上的光傳輸成為可能。

光子芯片通過采用與傳統(tǒng)基于晶體管的電子器件完全不同的物理學(xué)原理,可實現(xiàn)更快的性能、更低的能耗。

Lightmatter首席執(zhí)行官尼克·哈里斯稱:“我們可以利用現(xiàn)有AI數(shù)據(jù)中心,將能耗降低為原來的1/20,將物理空間減少為原來的1/5。”

據(jù)他介紹,這只是Lightmatter正在打造的第一代產(chǎn)品,未來還有很長的路線圖。

哈里斯強調(diào),此次展示的測試芯片只是作為其技術(shù)的演示,并不是為了在基準(zhǔn)測試中有出色表現(xiàn)。

但他堅持認為,在實際應(yīng)用中,該演示芯片仍將擊敗AI加速領(lǐng)域的市場領(lǐng)導(dǎo)者——英偉達A100 GPU。

據(jù)哈里斯介紹,與A100相比,其光子芯片在BERT和ResNet-50推理等工作負載上可提供20倍的能效和至少5倍的吞吐量。

二、格芯代工,采用3D封裝堆疊

Lightmatter的芯片由兩個垂直堆疊的芯片組成,整個芯片面積為150平方毫米,兩個裸片均由格芯標(biāo)準(zhǔn)CMOS工藝制造,包含超過十億個FinFET晶體管、數(shù)萬個光子算術(shù)單元和數(shù)百個記錄設(shè)置數(shù)據(jù)轉(zhuǎn)換器。

上方是一個12nm ASIC(Lightmatter副總工程師Carl Ramey在Hot Chips演講時介紹的是14nm ASIC),用于存儲內(nèi)存和控制下方作為計算引擎的90nm光子芯片裸片。

該光子處理器具有64 x 64光子矩陣向量乘積計算器,可在標(biāo)準(zhǔn)數(shù)據(jù)中心工作溫度下運行,總延遲時間不到200皮秒(1萬億皮秒=1秒),比晶體管計算要快幾個數(shù)量級,晶體管計算需要多個時鐘周期。計算引擎由50兆瓦的激光驅(qū)動。

哈里斯認為,這種低功耗光子計算芯片的優(yōu)勢之一,是可以與控制/內(nèi)存ASIC進行3D堆疊。

基于晶體管的計算芯片會散發(fā)過多的熱量。堆疊的芯片縮短了ASIC上的操作數(shù)存儲區(qū)與光子芯片上的計算元件之間的軌跡線——從數(shù)據(jù)轉(zhuǎn)換器到光子計算引擎的距離不到總路徑的1毫米。反過來,這降低了延遲和功耗。

哈里斯說:“這里有一個很好的正反饋循環(huán)”, “節(jié)省功耗使我們堆疊,而堆疊可以節(jié)省更多功耗?!?/p>

三、更高速度、更低功耗是如何實現(xiàn)的?

Lightmatter光學(xué)計算陣列由DACADC模塊封裝,作為與數(shù)字電路的其余部分的接口

DAC接收數(shù)字輸入信號,將其轉(zhuǎn)換為模擬電壓,并使用該電壓來驅(qū)動激光器(該技術(shù)已在光纖發(fā)射器中廣泛使用)。

來自該激光器的光,在進入馬赫曾德爾干涉儀(MZI)后,相干光分為兩束,每半束光的相位調(diào)整不同,將具有不同相位的光束組合會導(dǎo)致相長或相消干涉,從而有效地調(diào)制通過MZI的光的亮度(該調(diào)制可被視為乘法運算)。

在波導(dǎo)(承載光的“電線”)相遇之處,信號被有效地加在一起,這是光MAC的基礎(chǔ)。

計算陣列輸出的光到達光電二極管,通過機械手段實現(xiàn)MZI中的關(guān)鍵操作,改變光的相位。

Lightmatter副總工程師Carl Ramey在Hot Chips演講解釋說,其光子芯片使用了納米光學(xué)機電系統(tǒng)(NOEMS)。

與MEMS器件類似,波導(dǎo)結(jié)構(gòu)通過在下面蝕刻而懸浮,然后通過向其上方和下方的電容器板添加電荷來偏轉(zhuǎn)。這成功地改變了光的相位所需的數(shù)量,并且所需功率極低。

“NOEMS設(shè)備具有一些非常驚人的性能,” Ramey說?!八鼈兊膿p耗極低,靜態(tài)功耗幾乎為零。我們只是將一些電子傾倒到小電容器上,幾乎沒有泄漏——電容足夠小,致動所用的動態(tài)功率也很小。(結(jié)構(gòu))也能以相對較高的速度啟動,最高可達數(shù)百兆赫。”

Ramey說,Lightmatter的演示芯片具有64 x 64計算元素,但可以很容易地擴大規(guī)模。

據(jù)他介紹:“類似于基于晶體管的脈動陣列,計算量與面積成線性比例關(guān)系,“延遲也隨著陣列的尺寸而縮放。因此,在一個典型的流水線晶體管設(shè)計中,您需要64個時鐘周期來執(zhí)行這些操作,從左到右。我們的延遲也隨陣列尺寸而定,但是速度要快三個數(shù)量級。因此,即使是1000 x 1000的陣列,其延遲也會遠低于納秒?!?/p>

有趣的是,光子計算陣列消耗的功率與面積的平方根成比例。這是因為功耗主要歸因于數(shù)據(jù)轉(zhuǎn)換。

“當(dāng)我們將每個新元素添加到陣列中時,我們將獲得更高的性能,但是我們只需要付出功率平方根的代價即可?!?Ramey說,“因此,我們制造的芯片越大,實際上它們的效率就越高。這與電子系統(tǒng)有很大不同,電子系統(tǒng)只是線性擴展:性能越高,功耗越大?!?/p>

除了與計算相關(guān)的能量外,還有與在芯片周圍移動數(shù)據(jù)有關(guān)的能量(當(dāng)今基于晶體管的大型AI芯片在硅片上移動數(shù)據(jù)可能要消耗50-100W功率)。

而通過光學(xué)計算,以光學(xué)方式移動數(shù)據(jù),意味著不需要電源,從而節(jié)省了很多錢。結(jié)果是,光子計算設(shè)備的運行功耗不到3W,僅是其他計算方法每次推理操作所消耗能量的一小部分。

四、支持同時執(zhí)行多個AI推理任務(wù)

光子計算的另一個有趣功能是并行處理能力。與光通信中使用的技術(shù)類似,可以將多個獨立的數(shù)據(jù)流編碼到不同波長的光上,并同時饋入計算引擎。這意味著光學(xué)計算芯片可以同時執(zhí)行多個AI推理任務(wù)。

“這是光子計算的一個非常獨特的特性,” Lightmatter首席執(zhí)行官Nick Harris說,“這意味著您有一個物理資源,一個處理器,但它的作用就像一排處理器?!?/p>

雖然指定的光譜(1310至1600nm)在理論上可以適合至少1000路,但哈里斯說,因激光技術(shù)還不成熟,目前僅支持8路。

落地將是艱巨的挑戰(zhàn)

據(jù)悉,Lightmatter的目標(biāo)客戶是當(dāng)今的數(shù)據(jù)中心,包括高性能計算等可擴展系統(tǒng)。自動駕駛技術(shù)是一個遙遠的未來發(fā)展方向,不過哈里斯承認,進入這一領(lǐng)域所需的可靠性工程將是“一項艱巨的任務(wù)”。

Lightmatter具有完整的軟件堆棧,支持TensorFlow、PyTorch、ONNX等機器學(xué)習(xí)框架。哈里斯說,他們的目標(biāo)是在兩個機器學(xué)習(xí)框架之間實現(xiàn)即插即用。對于初創(chuàng)企業(yè)而言,首要挑戰(zhàn)之一可能是如何使持懷疑態(tài)度的客戶理解和接受光子計算的整個概念。

如何做到這一點呢?哈里斯回應(yīng)稱:“這是一個艱巨的挑戰(zhàn)”。他介紹道,自1960年代以來的計算歷史上,從來沒有一種技術(shù)取代過電子晶體管做計算,人們已經(jīng)嘗試過,但從未成功?!拔艺J為這是您第一次看到它的實現(xiàn),而我們銷售它的方式就是通過展示它的運行?!惫锼拐f。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    462

    文章

    53559

    瀏覽量

    459338
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38171

    瀏覽量

    296912
  • 自動駕駛
    +關(guān)注

    關(guān)注

    791

    文章

    14673

    瀏覽量

    176650
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    邊緣計算中的AI加速器類型與應(yīng)用

    人工智能正在推動對更快速、更智能、更高效計算的需求。然而,隨著每秒產(chǎn)生海量數(shù)據(jù),將所有數(shù)據(jù)發(fā)送至云端處理已變得不切實際。這正是邊緣計算AI加速器變得不可或缺的原因。這種專用硬件能夠直
    的頭像 發(fā)表于 11-06 13:42 ?436次閱讀
    邊緣<b class='flag-5'>計算</b>中的<b class='flag-5'>AI</b><b class='flag-5'>加速</b>器類型與應(yīng)用

    今日看點:高通發(fā)布云端AI芯片;艾為電子推出低功耗Hyper-Hall?芯片 高通發(fā)布云端AI芯片 近日,美國高通公

    ? 高通發(fā)布云端AI芯片 近日,美國高通公司宣布推出兩款新型人工智能芯片AI200和
    發(fā)表于 10-28 10:43 ?817次閱讀

    新思科技測試IO方案加速HPC和AI芯片量產(chǎn)

    為實現(xiàn)更高性能目標(biāo),AI與HPC芯片設(shè)計正加速向芯粒架構(gòu)演進。但是傳統(tǒng)單片機SOC已經(jīng)很難在尺寸上繼續(xù)擴張,異構(gòu)集成已成為推動半導(dǎo)體創(chuàng)新的核心動力。然而,它也增加了芯片設(shè)計的復(fù)雜性,需
    的頭像 發(fā)表于 10-15 11:33 ?544次閱讀
    新思科技<b class='flag-5'>測試</b>IO方案<b class='flag-5'>加速</b>HPC和<b class='flag-5'>AI</b><b class='flag-5'>芯片</b>量產(chǎn)

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    和探索;人類級別的理解能力;常識推理;現(xiàn)實世界的知識整合。 3、測試計算 測試計算(TTC)是指在模型推理階段利用額外的計算資源來提升泛
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+第二章 實現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    算法 5.2加速矩陣乘法的芯片架構(gòu) ①新的矩陣乘法器架構(gòu) ②基于RISC-V的矩陣乘法擴展指令集 ③用信息論的思想來減少AI推理計算量 三、用于
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    ②Transformer引擎③NVLink Switch系統(tǒng)④機密計算⑤HBM FPGA: 架構(gòu)的主要特點:可重構(gòu)邏輯和路由,可以快速實現(xiàn)各種不同形式的神經(jīng)網(wǎng)絡(luò)加速。 ASIC: 介紹了幾種ASIC AI
    發(fā)表于 09-12 16:07

    Lightium、旺矽科技與 Axiomatic_AI 宣布達成戰(zhàn)略合作,共同推出 AI 驅(qū)動的光子芯片測試創(chuàng)新解決方案

    蘇黎世、新竹和波士頓2025年8月5日 /美通社/ -- Lightium AG、旺矽科技股份有限公司(MPI Corporation)與 Axiomatic_AI Inc. 近日正式簽署合作備忘錄
    的頭像 發(fā)表于 08-06 08:46 ?537次閱讀

    AI芯片加速人工智能計算的專用硬件引擎

    人工智能(AI)的快速發(fā)展離不開高性能計算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計算需求。因此,專為AI優(yōu)
    的頭像 發(fā)表于 07-09 15:59 ?933次閱讀

    黑芝麻A2000#高階智能駕駛與通用AI計算芯片詳細解析

    、產(chǎn)品定位與核心目標(biāo) A2000家族是黑芝麻智能華山系列的最新產(chǎn)品, 定位于高階智能駕駛與通用AI計算 ,目標(biāo)是通過高算力、高能效的芯片設(shè)計,解決自動駕駛場景中的復(fù)雜決策與感知需求,并
    的頭像 發(fā)表于 04-30 10:33 ?5634次閱讀
    黑芝麻A2000#高階智能駕駛與<b class='flag-5'>通用</b><b class='flag-5'>AI</b><b class='flag-5'>計算</b><b class='flag-5'>芯片</b>詳細解析

    光子 AI 處理器的核心原理及突破性進展

    電子發(fā)燒友網(wǎng)(文 / 李彎彎)光子 AI 處理器,作為一種借助光子執(zhí)行信息處理與人工智能(AI計算的新型硬件設(shè)備,正逐漸嶄露頭角。與傳統(tǒng)基
    的頭像 發(fā)表于 04-19 00:40 ?3662次閱讀

    融合30萬項專利,“OptoChat AI”引擎引爆萬億光子AI市場

    ? 電子發(fā)燒友網(wǎng)報道(文/吳子鵬) 近日,南京江北新區(qū)企業(yè) —— 南京南智先進光電集成技術(shù)研究院有限公司,聯(lián)合南京知滿科技等合作伙伴,成功開發(fā)出國內(nèi)首個光子 AI 智能引擎 “OptoChat
    的頭像 發(fā)表于 03-09 04:38 ?1686次閱讀
    融合30萬項專利,“OptoChat <b class='flag-5'>AI</b>”引擎引爆萬億<b class='flag-5'>光子</b><b class='flag-5'>AI</b>市場

    FPGA+AI王炸組合如何重塑未來世界:看看DeepSeek東方神秘力量如何預(yù)測......

    的三重革命1) 硬件架構(gòu)革命:英特爾IPU路線圖顯示,到2026年將推出FPGA+Xeon的異構(gòu)加速卡;AMD計劃2023年集成Xilinx AI Engine的CPU芯片......
    發(fā)表于 03-03 11:21

    Lightmatter借助Cadence工具構(gòu)建光子芯片

    生成式 AI 日益普及,托管和訓(xùn)練這些算法所消耗的能源也隨之增加。光子技術(shù)以光子為主要計算源,基于光子的系統(tǒng)具有低功耗的優(yōu)勢,有助減少碳排放
    的頭像 發(fā)表于 02-24 10:37 ?1033次閱讀

    中科曙光以AI加速智能計算服務(wù)千行萬業(yè)

    近年來,中科曙光以AI為中心,全面重構(gòu)底層芯片、液冷、計算、存儲、智算集群、基礎(chǔ)軟件棧、管理平臺,并與AI場景有機適配、融合,加速智能
    的頭像 發(fā)表于 02-10 17:45 ?1563次閱讀

    消息稱AMD Instinct MI400 AI加速器將配備8個計算芯片

    計算芯片,這一消息在 AI 計算領(lǐng)域引發(fā)了廣泛關(guān)注。 據(jù)悉,MI400 將配備 2 個有源轉(zhuǎn)接層芯片 (AID),每個 AID 包含 4
    的頭像 發(fā)表于 02-05 15:07 ?1388次閱讀