chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

MLPerf首次GPT大模型推理放榜 墨芯連續(xù)三屆登頂

墨芯人工智能 ? 來源:墨芯人工智能 ? 2023-09-14 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著ChatGPT等AIGC應用掀起大模型浪潮,算力層作為基礎設施,成為最先受益的產業(yè)。

然而,算力需求大、費用昂貴等問題,已成為企業(yè)落地大模型的普通痛點,更可能制約AI向前發(fā)展:大模型參數日益增長,而算力供給瓶頸迫在眉睫,二者形成巨大矛盾。

如何探索更好的大模型算力方案,是業(yè)界共同關注的焦點。

近日,全球權威測評MLPerf 公布最新推理測評結果,這是MLPerf首度引入GPT大模型推理測試,參與熱度再創(chuàng)紀錄,收到了來自英偉達、英特爾、谷歌、高通等企業(yè)提交的13500 多項性能結果。

4aa1d2b4-52bd-11ee-a25d-92fbcf53809c.png

在MLPerf Inference 3.1中,墨芯人工智能(Moffet AI)S30計算卡在大模型GPT-J(60億參數)上,單卡、4卡、8卡的算力均獲得第一。

這是墨芯在MLPerf上連續(xù)第三次衛(wèi)冕。此前墨芯曾在MLPerf Inference 2.0與2.1上,連續(xù)兩屆獲得第一。

墨芯的成績,為大模型算力方案帶來了可行的創(chuàng)新方向。

事實證明:結合AI模型與計算平臺的軟硬協(xié)同創(chuàng)新,能夠釋放更大的算力潛力。這也再度印證:以稀疏計算為代表的創(chuàng)新技術,將是大模型時代算力發(fā)展的關鍵。

墨芯參加的是MLPerf開放分區(qū),據主辦方MLCommons介紹,該分區(qū)旨在鼓勵創(chuàng)新。因此參賽者可以通過軟硬協(xié)同等方式,探索對算力的提升。在MLPerf中的GPT-J大模型上,與4nm制程的H100純硬件加速方案相比,12nm制程的墨芯S30計算卡通過“原創(chuàng)的雙稀疏算法+硬件協(xié)同”方式,取得了高達1.8倍的優(yōu)勢。

本次測評的GPT-J模型是生成式AI模型,墨芯S30計算卡在8卡、4卡、單卡模式下,性能分別為170.59,91.57,23.28 (Sample/s),達到英偉達H100性能的1.6倍、1.8倍、1.8倍,展現出墨芯產品在AIGC類任務上的能力。

4b02a418-52bd-11ee-a25d-92fbcf53809c.png

三度奪冠,大模型算力率先“交卷”,軟硬協(xié)同持續(xù)創(chuàng)新——墨芯的產品實力數次經過MLPerf的嚴格檢驗,也探索出大模型算力發(fā)展的新路徑。

1

稀疏計算——大模型“潛力股”

獲得市場認可

墨芯接連的優(yōu)異成績,主要得益于基于稀疏化算法的軟硬協(xié)同設計。

在大模型時代,稀疏計算的重要性不言而喻:AI模型大小與其稀疏化潛力成正比。

也就是說,當模型越大,算法上有更大稀疏的可能性,稀疏計算可加速的幅度也越高。對于一般大型語言模型,稀疏計算可帶來數十倍加速。

墨芯獨創(chuàng)的雙稀疏算法,結合軟硬協(xié)同設計,使墨芯Antoum芯片成為全球首款高稀疏倍率AI芯片,支持高達32倍稀疏——這也正是墨芯在本次MLPerf中創(chuàng)新紀錄的關鍵。

模型越大,稀疏計算的優(yōu)勢越明顯——尤其是在GPT等大模型參數動輒上百億、千億的現狀下,這使得墨芯的護城河更為穩(wěn)固。

墨芯的產品實力與稀疏計算的大勢所趨,也獲得了市場的認可:墨芯商業(yè)化進程接連取得重要突破,助力企業(yè)加速AI應用。

就在近日,墨芯成為支持Byte MLPerf的供應商之一

4b33ae5a-52bd-11ee-a25d-92fbcf53809c.png

來源:Byte MLPerf網站

當前,墨芯AI計算平臺已能夠支持不同參數級別的大模型,包括 BLOOM, OPT, GPT-J,LLaMA,StableDiffusion等。同時具有高吞吐、低延時、低功耗等特點,緩解算力之困,真正為企業(yè)帶來“好用”、“用得起”的大模型算力方案。

2

帶來根本性的算力變革

稀疏計算助力大模型發(fā)展

墨芯的稀疏計算方案不僅能夠緩解當前的算力難題,也為AI的持續(xù)發(fā)展打開新的空間。

稀疏計算減少了AI模型的計算量,這意味著能讓大模型既在參數量上躍升若干個數量級的同時,又不產生過大的計算量,大模型參數增長與算力瓶頸的矛盾有望從根本上得到解決。

同時,由于計算量的減少,大模型的高算力需求、高功耗、高費用等痛點,也一并得到解決,實現“多贏”效果。

墨芯Antoum芯片:全球首款高稀疏倍率AI芯片,支持高達32倍稀疏

連續(xù)三屆MLPerf的優(yōu)異成績,不僅是對墨芯產品實力的證明,也為業(yè)界帶來新啟示:在稀疏計算等技術的助力下,大模型的發(fā)展與應用有望迎來更廣闊的施展空間,加速AIGC等應用在各行各業(yè)遍地開花。





審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • GPT
    GPT
    +關注

    關注

    0

    文章

    368

    瀏覽量

    16104
  • AI芯片
    +關注

    關注

    17

    文章

    1983

    瀏覽量

    35926
  • ChatGPT
    +關注

    關注

    29

    文章

    1590

    瀏覽量

    9116

原文標題:MLPerf首次GPT大模型推理放榜,墨芯連續(xù)三屆登頂

文章出處:【微信號:墨芯人工智能,微信公眾號:墨芯人工智能】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    科技亮相第三屆粒開發(fā)者大會

    在剛剛于無錫圓滿落幕的第三屆粒開發(fā)者大會——這場匯聚全球頂尖芯片企業(yè)、科研機構及產業(yè)鏈專家的盛會上,行科技作為國內Signoff領域的領軍企業(yè),受邀發(fā)表了主題演講《面向3DIC的Signoff挑戰(zhàn)與行
    的頭像 發(fā)表于 07-18 10:22 ?140次閱讀

    模型推理顯存和計算量估計方法研究

    估算剪枝后的模型所需的顯存大小。 、計算量估計方法 基于模型結構的計算量估計 根據深度學習模型的層次結構和參數數量,可以估算模型
    發(fā)表于 07-03 19:43

    公司入選第三屆能源電力行業(yè)高價值專利及技術成果轉化典型案例

    近日,中國能源研究會公布第三屆能源電力行業(yè)高價值專利及技術成果轉化典型案例評選結果,智公司牽頭申報的2項專利技術成果成功入選,其中核心型高價值專利(技術)成果1項、核心型高價值專利(技術)成果轉化典型案例1項,這也是智公司
    的頭像 發(fā)表于 06-11 17:09 ?520次閱讀

    工信部第三屆能源電子產業(yè)創(chuàng)新大賽|御微承辦WIoTa能源物聯網應用專題賽

    》、《新型儲能制造業(yè)高質量發(fā)展行動方案》有關部署,工業(yè)和信息化部產業(yè)發(fā)展促進中心自2022年以來連續(xù)舉辦了三屆先進儲能技術創(chuàng)新挑戰(zhàn)賽、兩能源電子產業(yè)創(chuàng)新大賽,累計收到
    的頭像 發(fā)表于 06-10 11:28 ?600次閱讀
    工信部第<b class='flag-5'>三屆</b>能源電子產業(yè)創(chuàng)新大賽|御<b class='flag-5'>芯</b>微承辦WIoTa能源物聯網應用專題賽

    中興通訊星云大模型登頂SuperCLUE推理專項榜單

    近日,中文大模型權威測評基準SuperCLUE發(fā)布《中文大模型基準測評2025年5月報告》。報告顯示,中興通訊自主研發(fā)的星云大模型NebulaCoder-V6在推理專項榜單中斬獲榜單金
    的頭像 發(fā)表于 06-04 16:44 ?705次閱讀

    三屆百度文心杯創(chuàng)業(yè)大賽啟動

    近日,第三屆“文心杯”創(chuàng)業(yè)大賽面向全球正式啟動報名。
    的頭像 發(fā)表于 04-30 10:24 ?440次閱讀

    今日看點丨OpenAI將發(fā)布新的GPT-4.5模型;星西安工廠將升級286層NAND閃存工藝

    1. OpenAI 將發(fā)布新的GPT-4.5 模型 ? OpenAI首席執(zhí)行官阿爾特曼周表示,該公司內部稱為Orion的GPT-4.5模型
    發(fā)表于 02-13 11:22 ?550次閱讀

    OpenAI即將推出GPT-5模型

    OpenAI首席執(zhí)行官奧爾特曼近日宣布了一項重要消息:OpenAI將在今年未來幾個月內推出全新的GPT-5模型。這一消息引起了業(yè)界的廣泛關注和期待。 據了解,GPT-5模型將整合Ope
    的頭像 發(fā)表于 02-13 11:21 ?596次閱讀

    高效大模型推理綜述

    模型由于其在各種任務中的出色表現而引起了廣泛的關注。然而,大模型推理的大量計算和內存需求對其在資源受限場景的部署提出了挑戰(zhàn)。業(yè)內一直在努力開發(fā)旨在提高大模型
    的頭像 發(fā)表于 11-15 11:45 ?1467次閱讀
    高效大<b class='flag-5'>模型</b>的<b class='flag-5'>推理</b>綜述

    線上逛展 | 沉浸探索第三屆OpenHarmony技術大會五大展區(qū)

    世博中心又有什么大事發(fā)生? 第三屆OpenHarmony技術大會 五大展區(qū)全方位展示智慧互聯未來 雷科技從現場發(fā)來探展邀約 一起跟隨他的視角漫步展區(qū) 在精彩紛呈的特色產品、應用案例中 體驗OpenHarmony的快速發(fā)展吧!
    發(fā)表于 10-24 21:50

    高燃回顧|第三屆OpenHarmony技術大會精彩瞬間

    三屆OpenHarmony技術大會圓滿落幕 全球開源精英齊聚 共同展示OpenHarmony技術、生態(tài)、人才的最新進展 見證OpenHarmony南北向生態(tài)繁榮 共繪開源生態(tài)發(fā)展藍圖 星光璀璨致謝
    發(fā)表于 10-16 18:47

    云知聲山海多模態(tài)大模型UniGPT-mMed登頂MMMU測評榜首

    近日,多模態(tài)人工智能模型基準評測集MMMU更新榜單,云知聲山海多模態(tài)大模型UniGPT-mMed以通用能力、醫(yī)療專業(yè)能力雙雙排名第一的優(yōu)異成績登頂榜首,力壓GPT-4V,充分彰顯其硬核
    的頭像 發(fā)表于 10-12 14:09 ?685次閱讀
    云知聲山海多模態(tài)大<b class='flag-5'>模型</b>UniGPT-mMed<b class='flag-5'>登頂</b>MMMU測評榜首

    三屆OpenHarmony技術大會亮點紛呈

    10月12日—13日 第三屆OpenHarmony技術大會如期而至, 高能看點,一觸即發(fā)! 讓我們攜手走進這場技術盛宴 ?
    的頭像 發(fā)表于 10-11 11:08 ?597次閱讀
    第<b class='flag-5'>三屆</b>OpenHarmony技術大會亮點紛呈

    30s高能速遞 | 第三屆 OpenHarmony技術大會精彩搶鮮看

    技術引領筑生態(tài) 萬物智聯創(chuàng)未來 第三屆 OpenHarmony技術大會 如約而至 高燃登場 10月12-13日,上海世博中心 重磅嘉賓,前沿議題 看億萬代碼如何改變未來,與卓越伙伴共繪閃耀繁星 亮點
    發(fā)表于 10-08 17:36

    OpenAI即將發(fā)布“草莓”推理模型

    科技界迎來新動態(tài),據可靠消息透露,OpenAI正緊鑼密鼓地籌備著一項重大發(fā)布——預計在兩周內,將正式推出名為“草莓”的新型AI推理模型,并將其無縫融入ChatGPT服務中。這款以卓越推理能力為核心的大模型,旨在突破現有
    的頭像 發(fā)表于 09-11 16:53 ?829次閱讀