chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Meta第二代自研AI芯片出世,性能提升三倍以上

E4Life ? 來源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2024-04-15 09:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))不久前,Meta宣布將花費(fèi)150億美元,購置60多萬塊GPU,而這還沒算上系統(tǒng)成本。就當(dāng)大家以為Meta打算All In GPU之際,Meta放出了下一代MTIA AI芯片,MTIA v2。

基于5nm打造,性能三倍以上

相較上一代MTIA v1,新的MTIA v2的工藝從臺(tái)積電的7nm換成了臺(tái)積電5nm,芯片主頻也從800MHz提升至1.35GHz。得益于芯片工藝的改進(jìn),即便晶體管數(shù)量大幅增加,其芯片面積僅增加了12%。

圖片

MTIA v2芯片 / Meta
MTIA v2的性能提升主要體現(xiàn)在算力上,根據(jù)Meta給出的數(shù)據(jù)其GEMM算力達(dá)到354TFLOPS/s(INT8),SIMD算力達(dá)到11.06TFLOPS/s(INT8),相較上一代均提升了3倍以上。在接口上,MTIA v2也從8xPCIe 4.0升級(jí)至8x PCIe 5.0,帶寬翻倍。
算力的提升除了歸功于工藝的升級(jí)外,很可能也不乏內(nèi)核的升級(jí)。結(jié)合晶心科技和Meta合作開發(fā)數(shù)據(jù)中心AI處理器的新聞來看,MTIA v1很有可能采用了晶心科技打造的首個(gè)商用RISC-V矢量處理器內(nèi)核NX27V,而MTIA v2則很可能用到了最新的AX45MPV內(nèi)核,其三倍以上的性能提升幅度也符合MTIA的算力提升幅度,不過這也只是猜想而已。值得一提的是,與同樣在近期發(fā)布的英特爾Gaudi 3不一樣,MTIA v2在內(nèi)存配置上依舊沒有選擇HBM,片上內(nèi)存只有256MB,片外內(nèi)存選擇了LPDDR5。雖然其片上內(nèi)存擁有2.7TB/s的帶寬,但也注定了MTIA v2很難用于高效率的大模型應(yīng)用。在硬件堆料下,MTIA v2的功耗也已經(jīng)來到了90W,相比MTIA v1的25有著比較大幅度的增加。不過對(duì)比H100的能耗比,MTIA v2依然有著比較大的優(yōu)勢(shì)。但這也就意味著上一代的服務(wù)器方案可能已經(jīng)不再適用于新的方案,Meta因此為新加速器打造了全新的機(jī)柜系統(tǒng)。該系統(tǒng)單個(gè)機(jī)架由三個(gè)底盤構(gòu)成,每個(gè)底盤塞進(jìn)了12塊板卡,每個(gè)板卡集成了2個(gè)加速器,也就意味著單個(gè)機(jī)架共有72個(gè)MTIA v2加速器,單機(jī)柜至少需要6000W的電源供應(yīng)。如果想要實(shí)現(xiàn)多機(jī)架拓展的話,也可以選擇加入RDMA NIC。Meta表示實(shí)現(xiàn)這樣的成績(jī),除了依靠硬件本身的性能提升之外,也離不開他們?cè)趦?yōu)化內(nèi)核、編譯器、運(yùn)行時(shí)上的努力。隨著后續(xù)開發(fā)生態(tài)進(jìn)一步成熟,對(duì)模型針對(duì)性優(yōu)化的時(shí)間會(huì)進(jìn)一步減少,而且未來還有不少空間可以繼續(xù)優(yōu)化芯片的效率。

軟件棧引入新的編譯器

隨著新硬件的發(fā)布,Meta也加大了他們?cè)谲浖I系拈_發(fā)力度。作為PyTorch的開發(fā)者,MTIA的軟件棧從設(shè)計(jì)之初就做到了PyTorch 2.0的完全集成,也支持TorchDynamo和TorchInductor等新特性。但與此同時(shí),為了簡(jiǎn)化應(yīng)用開發(fā)者的工作,為MTIA v1開發(fā)的代碼,也能向下兼容新的MTIA v2硬件。而且Meta表示,因?yàn)橐呀?jīng)將全部的軟件棧集成在新的MTIA芯片內(nèi),在發(fā)布之際,他們已經(jīng)在自己的服務(wù)器上用MTIA v2跑了一段時(shí)間了。正因?yàn)橛羞@種兼容的軟件棧方案,Meta可在九個(gè)月內(nèi)就能讓商用模型運(yùn)行在16個(gè)地區(qū)的服務(wù)器上。為了為全新的MTIA硬件生成更高性能的代碼,Meta還打造了一套新的Triton-MTIA編譯器。Triton是由OpenAI開發(fā)的一套開源語言和編譯器,用于編寫高效的ML計(jì)算內(nèi)核。Triton極大地提高了開發(fā)者編寫GPU代碼的速度,但Meta發(fā)現(xiàn)Triton也很適合用于MTIA這樣非GPU的硬件架構(gòu)。

寫在最后

從MTIA v2的性能來看,該加速器應(yīng)該不會(huì)替代其購置的大量GPU用在LLM模型上,而是追求算力、內(nèi)存帶寬和內(nèi)存容量的平衡,用于排名和推薦的大模型上。這樣一來大容量的SRAM還是用在GPU上,而Meta最大收入來源的廣告業(yè)務(wù),可以靠MTIA之類的加速器減少成本。Meta除了投資定制AI芯片和下一代GPU這樣的計(jì)算芯片外,Meta也強(qiáng)調(diào)他們會(huì)繼續(xù)投資內(nèi)存帶寬、網(wǎng)絡(luò)、容量相關(guān)的下一代硬件系統(tǒng)。不僅如此,Meta也在探索增加MTIA的應(yīng)用范圍,包括未來可能支持GenAI的負(fù)載。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • Meta
    +關(guān)注

    關(guān)注

    0

    文章

    322

    瀏覽量

    12461
  • AI芯片
    +關(guān)注

    關(guān)注

    17

    文章

    2128

    瀏覽量

    36793
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    比亞迪正式發(fā)布第二代刀片電池及閃充技術(shù)

    發(fā)布會(huì)現(xiàn)場(chǎng),王傳福還宣布:所有搭載第二代刀片電池的閃充車車主,均享有重磅“閃充權(quán)益”,交車之日起,在全國閃充站可享受1年的免費(fèi)閃充權(quán)益,讓閃充體驗(yàn)更暢快。并且,在閃充免費(fèi)期結(jié)束后,也會(huì)同行業(yè)保持一致,不會(huì)額外收費(fèi)。
    的頭像 發(fā)表于 03-06 14:04 ?306次閱讀

    AMD VEK385評(píng)估套件助力快速啟動(dòng)第二代Versal AI Edge系列設(shè)計(jì)

    AMD VEK385 評(píng)估套件為評(píng)估第二代 AMD Versal AI Edge 系列 XC2VE3858 器件提供了一條快速、功能豐富且可擴(kuò)展的途徑。借助異構(gòu)計(jì)算、高性能 I/O、全面的內(nèi)存帶寬、即用型工作負(fù)載以及穩(wěn)健的啟動(dòng)工
    的頭像 發(fā)表于 03-06 09:09 ?399次閱讀

    新品 | CoolSiC? MOSFET 650V第二代產(chǎn)品,新增75m?型號(hào)

    新品CoolSiCMOSFET650V第二代產(chǎn)品,新增75m?型號(hào)CoolSiCMOSFET650V第二代器件基于性能卓越的第一溝槽SiCMOSFET技術(shù)打造,通過
    的頭像 發(fā)表于 01-12 17:03 ?327次閱讀
    新品 | CoolSiC? MOSFET 650V<b class='flag-5'>第二代</b>產(chǎn)品,新增75m?型號(hào)

    類比半導(dǎo)體全新第二代高邊開關(guān)芯片HD80152和SPI高邊HD708204量產(chǎn)

    致力于提供高品質(zhì)汽車驅(qū)動(dòng)芯片和高品質(zhì)信號(hào)鏈芯片供應(yīng)商上海類比半導(dǎo)體技術(shù)有限公司(下稱“類比半導(dǎo)體”或“類比”)宣布全新第二代高邊開關(guān)芯片HD80152和SPI高邊HD708204量產(chǎn)。
    的頭像 發(fā)表于 01-05 17:57 ?965次閱讀
    類比半導(dǎo)體全新<b class='flag-5'>第二代</b>高邊開關(guān)<b class='flag-5'>芯片</b>HD80152和SPI高邊HD708204量產(chǎn)

    新品 | CoolSiC? MOSFET 400V與440V第二代器件

    新品CoolSiCMOSFET400V與440V第二代器件CoolSiCMOSFET400V與440V第二代器件兼具高魯棒性、超低開關(guān)損耗與低通態(tài)電阻等優(yōu)勢(shì),同時(shí)有助于優(yōu)化系統(tǒng)成本。該系列400V
    的頭像 發(fā)表于 12-31 09:05 ?611次閱讀
    新品 | CoolSiC? MOSFET 400V與440V<b class='flag-5'>第二代</b>器件

    TeledyneLeCroy發(fā)布第二代DisplayPort 2.1 PHY合規(guī)測(cè)試與調(diào)試解決方案

    TeledyneLeCoy(Teledyne子公司)宣布第二代QualiPHY 2自動(dòng)化合規(guī)測(cè)試框架現(xiàn)已支持DisplayPort 2.1物理層(PHY)合規(guī)性測(cè)試。
    的頭像 發(fā)表于 12-26 11:04 ?1592次閱讀

    新品 | 采用.XT擴(kuò)散焊和第二代1200V SiC MOSFET的Easy C系列

    新品采用.XT擴(kuò)散焊和第二代1200VSiCMOSFET的EasyC系列EasyPACK2C1200V8mΩ電平模塊、EasyPACK2C1200V8mΩ四單元模塊以及
    的頭像 發(fā)表于 11-24 17:05 ?1476次閱讀
    新品 | 采用.XT擴(kuò)散焊和<b class='flag-5'>第二代</b>1200V SiC MOSFET的Easy C系列

    新品 | 第二代CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回流焊封裝

    系統(tǒng)、工業(yè)變頻器等大功率輸出應(yīng)用的理想選擇。第二代1400VCoolSiCMOSFET前沿技術(shù)具有前沿性,可顯著提升熱管理性能、功率密度及系統(tǒng)可靠性。其封裝支持回流
    的頭像 發(fā)表于 11-17 17:02 ?1353次閱讀
    新品 | <b class='flag-5'>第二代</b>CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回流焊封裝

    新品 | 第二代CoolSiC? MOSFET G2 750V - 工業(yè)級(jí)與車規(guī)級(jí)碳化硅功率器件

    新品第二代CoolSiCMOSFETG2750V-工業(yè)級(jí)與車規(guī)級(jí)碳化硅功率器件第二代750VCoolSiCMOSFET憑借成熟的柵極氧化層技術(shù),在抗寄生導(dǎo)通方面展現(xiàn)出業(yè)界領(lǐng)先的可靠性。該器件在圖騰柱
    的頭像 發(fā)表于 07-28 17:06 ?993次閱讀
    新品 | <b class='flag-5'>第二代</b>CoolSiC? MOSFET G2 750V - 工業(yè)級(jí)與車規(guī)級(jí)碳化硅功率器件

    類比半導(dǎo)體推出全新第二代高邊開關(guān)芯片HD80012

    致力于提供高品質(zhì)汽車驅(qū)動(dòng)芯片和高品質(zhì)工業(yè)模擬芯片供應(yīng)商上海類比半導(dǎo)體技術(shù)有限公司(下稱“類比半導(dǎo)體”或“類比”)宣布推出全新第二代高邊開關(guān)芯片HD80012,單通道低內(nèi)阻1.2mΩ產(chǎn)品
    的頭像 發(fā)表于 07-02 15:19 ?1329次閱讀
    類比半導(dǎo)體推出全新<b class='flag-5'>第二代</b>高邊開關(guān)<b class='flag-5'>芯片</b>HD80012

    AMD第二代Versal AI Edge和Versal Prime系列加速量產(chǎn) 為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產(chǎn)品是對(duì) Versal 產(chǎn)品組合的擴(kuò)展,可為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能。
    的頭像 發(fā)表于 06-11 09:59 ?1871次閱讀

    恩智浦推出第二代OrangeBox車規(guī)級(jí)開發(fā)平臺(tái)

    第二代OrangeBox開發(fā)平臺(tái)集成AI功能、后量子加密技術(shù)及內(nèi)置軟件定義網(wǎng)絡(luò)的能力,應(yīng)對(duì)快速演變的信息安全威脅。
    的頭像 發(fā)表于 05-27 14:25 ?1401次閱讀

    類比半導(dǎo)體推出全新第二代高邊開關(guān)芯片HD8004

    致力于提供高品質(zhì)汽車驅(qū)動(dòng)芯片和高品質(zhì)工業(yè)模擬芯片供應(yīng)商上海類比半導(dǎo)體技術(shù)有限公司(下稱“類比半導(dǎo)體”或“類比”)宣布推出全新第二代高邊開關(guān)芯片HD8004,單通道低內(nèi)阻4.3mΩ產(chǎn)品。
    的頭像 發(fā)表于 05-21 18:04 ?1346次閱讀
    類比半導(dǎo)體推出全新<b class='flag-5'>第二代</b>高邊開關(guān)<b class='flag-5'>芯片</b>HD8004

    第二代AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    第二代 AMD Versal Premium 系列自適應(yīng) SoC 是一款多功能且可配置的平臺(tái),提供全面的 CXL 3.1 子系統(tǒng)。該系列自適應(yīng) SoC 旨在滿足從簡(jiǎn)單到復(fù)雜的各種 CXL 應(yīng)用需求
    的頭像 發(fā)表于 04-24 14:52 ?1274次閱讀
    <b class='flag-5'>第二代</b>AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    方正微電子推出第二代車規(guī)主驅(qū)SiC MOS產(chǎn)品

    2025年4月16日,在上海舉行的電關(guān)鍵技術(shù)高峰論壇上,方正微電子副總裁彭建華先生正式發(fā)布了第二代車規(guī)主驅(qū)SiC MOS 1200V 13mΩ產(chǎn)品,性能達(dá)到國際頭部領(lǐng)先水平。
    的頭像 發(fā)表于 04-17 17:06 ?1541次閱讀