chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IBM 新款高能效 AI 芯片:能效比高過 NVIDIA A100

工程師鄧生 ? 來源:芯東西 ? 作者:溫淑 ? 2021-02-19 11:03 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2 月 18 日報道,本屆集成電路設(shè)計領(lǐng)域頂會 “國際固態(tài)電路會議(ISSCC 2021)”正在進行中(2021 年 2 月 13 日到 22 日)。作為已有近 70 年歷史的集成電路產(chǎn)學屆盛會,ISSCC 2021 亦被許多廠商視為發(fā)布其領(lǐng)先芯片技術(shù)的權(quán)威舞臺。

本屆會議上,IBM 發(fā)表了據(jù)稱是 “全球首款”的高能效 AI 芯片,該芯片采用 7nm 制程工藝,可達到 80% 以上的訓(xùn)練利用率和 60% 以上的推理利用率,而通常情況下,GPU 的利用率在 30% 以下。

性能參數(shù)方面,IBM 新品的運算密度高于同樣采用 7nm 工藝的 NVIDIA A100 GPU;其在多種精度下的整數(shù)運算性能,還優(yōu)于聯(lián)發(fā)科 7nm 專用 AI 芯片等產(chǎn)品。

據(jù) IBM 官網(wǎng)分享,其新款 7nm 高能效 AI 芯片該款芯片在多種場景中均有較好的應(yīng)用前景,比如,可用于混合云環(huán)境中的低能耗 AI 訓(xùn)練、或用于實現(xiàn)更接近邊緣的云端訓(xùn)練等。

一、IBM 新款高能效 AI 芯片:能效比高過 NVIDIA A100

對比結(jié)果顯示,IBM 新款 7nm 高能效 AI 芯片的性能和能效,不同程度地超越了 IBM 此前推出的 14nm 芯片、韓國科學院(KAIST)推出的 65nm 芯片、阿里巴巴旗下芯片公司平頭哥推出的 12nm 芯片含光 800、NVIDIA 推出的 7nm 芯片 A100、聯(lián)發(fā)科推出的 7nm 芯片。

IBM 新款 7nm 高能效 AI 芯片支持 fp8、fp16、fp32、int4、int2 混合精度。

在 fp32 和 fp8 精度下,IBM 新款高能效 AI 芯片的每秒浮點運算次數(shù),分別達到 16TFLOPS 和 25.6TFLOPS;運算密度分別為 0.82TFLOPS/mm^2 和 1.31TFLOPS/mm^2;能效比分別為 3.5TFLOPS/W 和 1.9TFLOPS。

在 int2 和 int4 精度下,IBM 新款高能效 AI 芯片的運算密度分別為 3.27TOPS/mm^2 和 5.22TOPS/mm^2;能效比分別為 16.5TOPS/W 和 8.9TOPS/W。

對比之下,IBM 此前推出的 14nm 芯片在 fp32 和 fp8 精度下的每秒浮點運算次數(shù),分別為 2TFLOPS 和 3TFLOPS;在在 fp32 精度下的能效比為 1.4TFLOPS/W。

另外,在 7nm 芯片陣營中,NVIDIA A100 GPU 在 fp16 精度下的能效比為 0.78TFLOPS/W,在 int4 精度下的能效比為 3.12TOPS/W,均低于 IBM 新款高能效 AI 芯片。

pIYBAGAvK12AaOpeAAFehISLSRQ350.jpg

▲ IBM 新款高能效 AI 芯片與同類產(chǎn)品的性能參數(shù)對比

二、采用 IBM 自研超低精度訓(xùn)練 / 推理設(shè)計

IBM 官網(wǎng)文章寫道,其新款 AI 芯片之所以能夠兼顧能效和性能,是因為該芯片支持超低精度混合 8 位浮點格式((HFP8,hybrid FP8)。這是 IBM 于 2019 年發(fā)布的一種高度優(yōu)化設(shè)計,允許 AI 芯片在低精度下完成訓(xùn)練任務(wù)和不同 AI 模型的推理任務(wù),同時避免任何質(zhì)量損失。

據(jù)悉,目前 IBM 將超低精度混合 8 位浮點格式用于訓(xùn)練、超低精度混合 4 位浮點格式用于推理,并開發(fā)了數(shù)據(jù)通信協(xié)議,以提升多核心 AI 芯片上不同核心間的數(shù)據(jù)交換效率。

據(jù) IBM 官網(wǎng)文章,自 2015 年起,該公司每年將芯片的功耗性能提升 2.5 倍。這背后,IBM 致力于實現(xiàn)算法、架構(gòu)、軟件堆棧等各方面的創(chuàng)新。

▲ IBM 在低精度 AI 訓(xùn)練、推理方面的研究歷程

除了采用超低精度混合 8 位浮點格式外,IBM 新款高能效 AI 芯片添加了電源管理功能。IBM 研究顯示,在同等功率的情況下,通過減緩計算階段的功率消耗,可以最大限度地提升芯片性能。

結(jié)語:AI 發(fā)展對芯片能耗提出更高要求

隨著智能化浪潮席卷各個領(lǐng)域,AI 模型的復(fù)雜性日趨提高。相應(yīng)地,AI 應(yīng)用的能源消耗水平亦水漲船高。這一背景下,如何最大限度提升能效,成為 AI 芯片設(shè)計玩家們面臨的重要命題。

IBM 通過采用超低精度混合 8 位浮點格式和內(nèi)置電源管理功能,為其新款 AI 芯片實現(xiàn)了業(yè)界領(lǐng)先的高能效。但是,這一芯片尚未實現(xiàn)規(guī)?;慨a(chǎn),仍有待市場檢驗。

責任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 芯片
    +關(guān)注

    關(guān)注

    463

    文章

    53866

    瀏覽量

    463148
  • IBM
    IBM
    +關(guān)注

    關(guān)注

    3

    文章

    1861

    瀏覽量

    76883
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5570

    瀏覽量

    109384
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39117

    瀏覽量

    299693
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    基于NVIDIA模組與軟件套件推動邊緣與機器人AI推理

    1200 FP4 TFLOPs 的 AI 算力和 64 GB 內(nèi)存,在性能、和可擴展性之間實現(xiàn)了理想平衡。憑借高能設(shè)計和量產(chǎn)就緒的形
    的頭像 發(fā)表于 01-14 09:46 ?269次閱讀
    基于<b class='flag-5'>NVIDIA</b>模組與軟件套件推動邊緣與機器人<b class='flag-5'>AI</b>推理

    專為邊緣而生:深度解析昆侖芯K100 AI加速卡,釋放128 TOPS極致

    昆侖芯K100邊緣AI加速卡以75W超低功耗實現(xiàn)128 TOPS的INT8算力,重新定義邊緣推理標準。其半高半長設(shè)計搭載8GB HBM內(nèi)存與256GB/s帶寬,支持INT8至FP3
    的頭像 發(fā)表于 12-14 11:12 ?2681次閱讀
    專為邊緣而生:深度解析昆侖芯K<b class='flag-5'>100</b> <b class='flag-5'>AI</b>加速卡,釋放128 TOPS極致<b class='flag-5'>能</b><b class='flag-5'>效</b>

    高能、低功耗、小體積,炬芯科技發(fā)布全新CGM連續(xù)血糖監(jiān)測方案

    及數(shù)字健康設(shè)備提供小體積、低功耗、高能的解決方案 ,為醫(yī)療級連續(xù)血糖監(jiān)測系統(tǒng)提供可靠的硬件基礎(chǔ)。 隨著數(shù)字醫(yī)療與生理數(shù)據(jù)監(jiān)測需求不斷發(fā)展,傳統(tǒng)CGM設(shè)備在功耗、體積及無線傳輸性能上仍面臨挑戰(zhàn)。炬芯科技憑借在低功耗無線通信與系統(tǒng)級
    的頭像 發(fā)表于 12-01 16:57 ?578次閱讀
    <b class='flag-5'>高能</b><b class='flag-5'>效</b>、低功耗、小體積,炬芯科技發(fā)布全新CGM連續(xù)血糖監(jiān)測方案

    新手小白必看!關(guān)于A100云主機租用,你想知道的一切都在這!

    最通俗易懂的語言,為你準備了一份超詳細的A100云主機租用新手指南,幫你掃清所有障礙,輕松開啟AI之旅。Q1:A100云主機到底是什么?我租了得到什么?把它想象成一
    的頭像 發(fā)表于 10-31 19:24 ?1377次閱讀
    新手小白必看!關(guān)于<b class='flag-5'>A100</b>云主機租用,你想知道的一切都在這!

    NVIDIA AI技術(shù)在節(jié)能和氣候中的應(yīng)用

    最新研究強調(diào)了高能基礎(chǔ)設(shè)施和 AI 模型如何推動氣候、能源等領(lǐng)域的創(chuàng)新。
    的頭像 發(fā)表于 10-13 11:05 ?760次閱讀

    NVIDIA助力AI超級計算機Isambard-AI投入使用

    英國布里斯托大學的超級計算機 Isambard-AI 采用 NVIDIA Grace Hopper 超級芯片,其 AI 算力達到了 21 ExaFLOPS,不僅是英國最快的系統(tǒng),同時也
    的頭像 發(fā)表于 07-28 15:07 ?1092次閱讀

    佐航BYQ3712PK變壓器等級測試儀:以精準測量賦配電變壓器升級

    在“雙碳”目標推動下,高效節(jié)能的配電變壓器已成為電力系統(tǒng)降本增效的關(guān)鍵環(huán)節(jié)。而準確判定變壓器等級,是推廣節(jié)能產(chǎn)品、淘汰低效設(shè)備的核心前提。佐航推出的BYQ3712PK變壓器等級
    的頭像 發(fā)表于 06-27 13:35 ?627次閱讀
    佐航BYQ3712PK變壓器<b class='flag-5'>能</b><b class='flag-5'>效</b>等級測試儀:以精準測量賦<b class='flag-5'>能</b>配電變壓器<b class='flag-5'>能</b><b class='flag-5'>效</b>升級

    優(yōu)化電機控制以提高能

    機器人及工廠自動化設(shè)備密布的工業(yè)環(huán)境,電機已成為不可或缺的動力核心。 與能耗 根據(jù)美國能源信息署數(shù)據(jù),全球約50%的能源消耗來自電機系統(tǒng),而在工業(yè)領(lǐng)域,這一比例更高達80%。以2022年美國為例
    發(fā)表于 06-11 09:57

    比和算力提升的衡量方法

    一、比的衡量方法 定義與計算公式? 比(EER)定義為制冷量與輸入功率的比值,計算公式為:?EER = Q / W?(Q為制冷量,W為輸入功率)。公制單位通常采用kW/W,英制
    的頭像 發(fā)表于 04-28 07:47 ?3072次閱讀
    <b class='flag-5'>能</b><b class='flag-5'>效</b>比和算力提升的衡量方法

    線性充電與開關(guān)充電:環(huán)保與的考量

    從環(huán)保和角度出發(fā),比較線性充電和開關(guān)充電的特點。
    的頭像 發(fā)表于 03-18 15:45 ?858次閱讀
    線性充電與開關(guān)充電:環(huán)保與<b class='flag-5'>能</b><b class='flag-5'>效</b>的考量

    Arm 推出 Armv9 邊緣 AI 計算平臺,以超高能與先進 AI 能力賦物聯(lián)網(wǎng)革新

    架構(gòu)的超高能 CPU——Arm Cortex-A320 以及對 Transformer 網(wǎng)絡(luò)具有原生支持的 Ethos-U85 AI 加速器為核心的邊緣
    的頭像 發(fā)表于 03-06 11:43 ?1939次閱讀
    Arm 推出 Armv9 邊緣 <b class='flag-5'>AI</b> 計算平臺,以超<b class='flag-5'>高能</b><b class='flag-5'>效</b>與先進 <b class='flag-5'>AI</b> 能力賦<b class='flag-5'>能</b>物聯(lián)網(wǎng)革新

    高速公路綜合管理:從理論到實踐的跨越

    ,不僅面臨著復(fù)雜的地質(zhì)情況和建設(shè)難度,更需要在管理上尋求創(chuàng)新與突破。本文將結(jié)合都巴高速的實際應(yīng)用案例,探討高速公路綜合管理的創(chuàng)新實踐。 二、項目概述 ? ? ? 都巴高速主線全
    的頭像 發(fā)表于 02-28 15:42 ?690次閱讀
    高速公路綜合<b class='flag-5'>能</b><b class='flag-5'>效</b>管理:從理論到實踐的跨越

    飛騰主板——滿足高能和安全可信需求

    在信息技術(shù)飛速發(fā)展的今天,主板作為計算機的核心部件,其性能和安全性至關(guān)重要。飛騰主板以其卓越的高能和安全可信特性,在眾多主板產(chǎn)品中脫穎而出,成為滿足當今時代需求的理想選擇。
    的頭像 發(fā)表于 02-20 08:45 ?664次閱讀

    中央空調(diào)系統(tǒng)管理解決方案

    中央空調(diào)系統(tǒng)管理解決方案
    的頭像 發(fā)表于 02-14 08:03 ?721次閱讀
    中央空調(diào)系統(tǒng)<b class='flag-5'>能</b><b class='flag-5'>效</b>管理解決方案

    英偉達A100和H100比較

    英偉達A100和H100都是針對高性能計算和人工智能任務(wù)設(shè)計的GPU,但在性能和特性上存在顯著差異。以下是對這兩款GPU的比較: 1. 架構(gòu)與核心規(guī)格: A100: 架構(gòu): 基于Ampere架構(gòu)
    的頭像 發(fā)表于 02-10 17:05 ?1.2w次閱讀
    英偉達<b class='flag-5'>A100</b>和H<b class='flag-5'>100</b>比較