chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

二代IPU性能超過(guò)GPU且全面支持PyTorch

hl5C_deeptechch ? 來(lái)源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2020-12-30 15:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“不管是在今天 GPU 能夠做的事情上,還是 GPU 不能做的事情上,IPU 都有它的價(jià)值點(diǎn)和價(jià)值定位?!?日前,在英國(guó) AI 芯片初創(chuàng)公司 Graphcore 中國(guó)區(qū)的媒體溝通會(huì)上,Graphcore 高級(jí)副總經(jīng)理兼中國(guó)區(qū)總經(jīng)理盧濤和 Graphcore 中國(guó)工程總負(fù)責(zé)人、AI 算法科學(xué)家金琛,就 Graphcore 的新產(chǎn)品性能以及該公司在中國(guó)的落地策略向 DeepTech 等媒體進(jìn)行了同步。

溝通會(huì)上,Graphcore 解讀了其于本月公布的大規(guī)模系統(tǒng)級(jí)產(chǎn)品 IPU-M2000 的應(yīng)用測(cè)試數(shù)據(jù)。公布數(shù)據(jù)顯示,在典型 CV 模型 ResNet、基于分組卷積的 ResNeXt、EfficientNet、語(yǔ)音模型、BERT-Large 等自然語(yǔ)言處理模型以及 MCMC 等傳統(tǒng)機(jī)器學(xué)習(xí)模型中,IPU-M2000 在吞吐量、訓(xùn)練時(shí)間和學(xué)習(xí)結(jié)果生成時(shí)間方面都有較好表現(xiàn)。比如,在 IPU-M2000 上 EfficientNet 的吞吐量達(dá)到 A100 的 18 倍。

bf6a28a2-4a2e-11eb-8b86-12bb97331649.jpg

圖 | IPU-M2000 與 GPU 的吞吐量、訓(xùn)練及結(jié)果生成時(shí)間對(duì)比(來(lái)源:Graphcore)

此前,IPU-M2000 與 Graphcore 第二代 IPU 處理器 GC200 已于今年 7 月 15 日發(fā)布。據(jù)介紹,GC200 芯片基于臺(tái)積電的 7nm 工藝制造,集成 250 TFlops AI-Float 算力和 900MB 處理器內(nèi)存,相較第一代產(chǎn)品性能提升 8 倍。而對(duì)于第三代 IPU,盧濤在此次溝通會(huì)上并未透露發(fā)布的具體時(shí)間表,不過(guò)他表示下一代產(chǎn)品正在研發(fā)中,將依舊重點(diǎn)解決存儲(chǔ)問(wèn)題。

支持 PyTorch、TensorFlow,在 IPU 與 GPU 間無(wú)縫銜接

另外,Graphcore 還發(fā)布了 Poplar SDK 1.4 版本和 PyTorch 的 IPU 版本。

Graphcore 對(duì) Poplar SDK 1.4 版本在易用性和速度上進(jìn)行了優(yōu)化,能夠支持模型和數(shù)據(jù)并行,同時(shí)能夠?qū)崿F(xiàn)模型的橫向擴(kuò)展 —— 從 1 個(gè) IPU 橫向擴(kuò)展到 64 個(gè) IPU。金琛表示,下一版本的 Poplar SDK 有望實(shí)現(xiàn)橫向擴(kuò)展到 128 個(gè) IPU。

值得關(guān)注的是,除支持 Graphcore 的自研框架 PopART 外,Poplar SDK 1.4 還支持 Facebook 的 PyTorch 框架、以及 Google 的 TensorFlow 框架。

據(jù)金琛介紹,Graphcore 在 PyTorch 代碼中引入了 PopTorch 輕量級(jí)接口,通過(guò)這一接口,用戶可基于當(dāng)前的 PyTorch 模型進(jìn)行封裝,以實(shí)現(xiàn) IPU 和 CPU 之間的無(wú)障礙銜接。

對(duì)于實(shí)現(xiàn)這一功能的核心技術(shù),金琛做進(jìn)一步解釋說(shuō),Graphcore 采用 PyTorch 里的 jit.trace 機(jī)制對(duì)計(jì)算圖進(jìn)行編譯,轉(zhuǎn)化為 IPU 和 PyTorch 兼容的表達(dá)格式,最后用 Graphcore 自研框架 PopART 后端的 audiff 功能自動(dòng)生成反向圖,便可以實(shí)現(xiàn)同一個(gè)模型在不同平臺(tái)的無(wú)差別運(yùn)行。

目前,PyTorch 因其直觀易懂、靈活易用等優(yōu)勢(shì)受到開(kāi)發(fā)者的廣泛喜愛(ài)和應(yīng)用。Poplar SDK 1.4 增加了對(duì) PyTorch 的支持,策略上是希望用戶在 IPU 上也能體驗(yàn) PyTorch,讓用戶多一個(gè)轉(zhuǎn)戰(zhàn) IPU 的理由。不過(guò)目前英偉達(dá)的 GPU 已經(jīng)在 AI 計(jì)算領(lǐng)域占據(jù)大部分市場(chǎng),此時(shí) IPU 能夠提供的價(jià)值、轉(zhuǎn)場(chǎng)到 IPU 的成本等,都是用戶所要考慮的問(wèn)題。

在遷移成本上,盧濤表示,經(jīng)過(guò)幾年來(lái)對(duì) Poplar SDK 的打磨,現(xiàn)在從 GPU 到 IPU 的軟硬件遷移難度已經(jīng)比大家認(rèn)為的小得多。

金琛補(bǔ)充道,在訓(xùn)練上,針對(duì)一個(gè)不太復(fù)雜的模型,一般一周可以遷移完成,對(duì)于復(fù)雜的模型大概需要兩周;在推理上,基本上是 1-2 天的工作量。

談及性能,盧濤表示:“IPU 在訓(xùn)練推理、語(yǔ)音、圖像模型處理上基本全面超越 GPU?!?不過(guò)他也坦言:“不能說(shuō) 100% 超越了 GPU,因?yàn)樗惴P痛_實(shí)非常多,比如說(shuō)語(yǔ)音有不同的語(yǔ)音模型、圖像也是有不同的圖像模型?!?/p>

未來(lái):持續(xù)優(yōu)化性能,進(jìn)一步壓縮遷移成本

IPU 在機(jī)器學(xué)習(xí)性能上的明顯優(yōu)勢(shì)是不可否認(rèn)的,但前有身強(qiáng)體壯且努力奔跑的巨頭英偉達(dá),Graphcore 更是一刻也不容懈怠。盧濤在溝通會(huì)上也多次提到,“目前 Graphcore 面對(duì)的壓力最主要還是來(lái)自英偉達(dá)”。

“重壓” 之下,Graphcore 短期內(nèi)的計(jì)劃是聚焦在數(shù)據(jù)中心高性能訓(xùn)練和推理市場(chǎng)上,持續(xù)打磨 IPU 和軟件平臺(tái),持續(xù)優(yōu)化性能和提高可用性。盧濤說(shuō),“只有在我們聚焦的領(lǐng)域跑得更快,Graphcore 和英偉達(dá)之間的距離才會(huì)越來(lái)越短,甚至在某些領(lǐng)域超過(guò)英偉達(dá)”。

他還表示,Graphcore 希望未來(lái)數(shù)年內(nèi),能在數(shù)據(jù)中心的 AI 訓(xùn)練、推理批量部署、以及發(fā)貨和體量上做到除英偉達(dá)以外的另一個(gè)頭部地位。

為實(shí)現(xiàn)該目標(biāo),Graphcore 也將從增加 AI 框架支持、以及模型覆蓋兩個(gè)維度著手,以期進(jìn)一步減少用戶的遷移成本。此外,除目前 AI 應(yīng)用最廣泛的互聯(lián)網(wǎng)和云計(jì)算兩個(gè)場(chǎng)景外,盧濤表示公司明年還將在金融、汽車、智慧醫(yī)療、智慧教育、智慧城市和政府服務(wù)等領(lǐng)域,至少突破一到兩個(gè)比較主流的領(lǐng)域。

原文標(biāo)題:二代IPU性能超過(guò)GPU、全面支持PyTorch,Graphcore接下來(lái)將聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

文章出處:【微信公眾號(hào):DeepTech深科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5149

    瀏覽量

    134747
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39062

    瀏覽量

    299624
  • IPU
    IPU
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    15942
  • pytorch
    +關(guān)注

    關(guān)注

    2

    文章

    813

    瀏覽量

    14781

原文標(biāo)題:二代IPU性能超過(guò)GPU、全面支持PyTorch,Graphcore接下來(lái)將聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

文章出處:【微信號(hào):deeptechchina,微信公眾號(hào):deeptechchina】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    新品 | CoolSiC? MOSFET 650V第二代產(chǎn)品,新增75m?型號(hào)

    新品CoolSiCMOSFET650V第二代產(chǎn)品,新增75m?型號(hào)CoolSiCMOSFET650V第二代器件基于性能卓越的第一溝槽SiCMOSFET技術(shù)打造,通過(guò)提升
    的頭像 發(fā)表于 01-12 17:03 ?122次閱讀
    新品 | CoolSiC? MOSFET 650V第<b class='flag-5'>二代</b>產(chǎn)品,新增75m?型號(hào)

    新品 | CoolSiC? MOSFET 400V與440V第二代器件

    新品CoolSiCMOSFET400V與440V第二代器件CoolSiCMOSFET400V與440V第二代器件兼具高魯棒性、超低開(kāi)關(guān)損耗與低通態(tài)電阻等優(yōu)勢(shì),同時(shí)有助于優(yōu)化系統(tǒng)成本。該系列400V
    的頭像 發(fā)表于 12-31 09:05 ?465次閱讀
    新品 | CoolSiC? MOSFET 400V與440V第<b class='flag-5'>二代</b>器件

    TeledyneLeCroy發(fā)布第二代DisplayPort 2.1 PHY合規(guī)測(cè)試與調(diào)試解決方案

    TeledyneLeCoy(Teledyne子公司)宣布第二代QualiPHY 2自動(dòng)化合規(guī)測(cè)試框架現(xiàn)已支持DisplayPort 2.1物理層(PHY)合規(guī)性測(cè)試。
    的頭像 發(fā)表于 12-26 11:04 ?1389次閱讀

    新品 | 采用.XT擴(kuò)散焊和第二代1200V SiC MOSFET的Easy C系列

    新品采用.XT擴(kuò)散焊和第二代1200VSiCMOSFET的EasyC系列EasyPACK2C1200V8mΩ三電平模塊、EasyPACK2C1200V8mΩ四單元模塊以及
    的頭像 發(fā)表于 11-24 17:05 ?1282次閱讀
    新品 | 采用.XT擴(kuò)散焊和第<b class='flag-5'>二代</b>1200V SiC MOSFET的Easy C系列

    新品 | 第二代CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回流焊封裝

    系統(tǒng)、工業(yè)變頻器等大功率輸出應(yīng)用的理想選擇。第二代1400VCoolSiCMOSFET前沿技術(shù)具有前沿性,可顯著提升熱管理性能、功率密度及系統(tǒng)可靠性。其封裝支持回流
    的頭像 發(fā)表于 11-17 17:02 ?1255次閱讀
    新品 | 第<b class='flag-5'>二代</b>CoolSiC? MOSFET G2 1400V,TO-247PLUS-4回流焊封裝

    Imagination GPU 全面支持 Vulkan 1.4 和 Android 16

    是Imagination開(kāi)發(fā)者社區(qū)中廣受歡迎的圖形API,因其提供了低開(kāi)銷、跨平臺(tái)訪問(wèn)現(xiàn)代GPU的能力,幫助開(kāi)發(fā)者在多種設(shè)備上最大化性能與效率。其對(duì)GPU操作的顯式控制,以及對(duì)
    的頭像 發(fā)表于 08-14 11:18 ?2142次閱讀
    Imagination <b class='flag-5'>GPU</b> <b class='flag-5'>全面</b><b class='flag-5'>支持</b> Vulkan 1.4 和 Android 16

    最高256細(xì)分,支持集成式熱管理系統(tǒng)!納芯微發(fā)布第二代步進(jìn)電機(jī)驅(qū)動(dòng)NSD8389-Q1

    納芯微推出第二代車規(guī)級(jí)高性能步進(jìn)電機(jī)驅(qū)動(dòng)器NSD8389-Q1,具備寬電壓、低內(nèi)阻、高細(xì)分等特性,支持多種配置與保護(hù)功能。該產(chǎn)品助力汽車制造商實(shí)現(xiàn)高精度電機(jī)控制,適用于熱管理、頭燈控制、HUD等場(chǎng)景,推動(dòng)汽車電氣化和智能化升級(jí)。
    的頭像 發(fā)表于 06-27 16:32 ?813次閱讀
    最高256細(xì)分,<b class='flag-5'>支持</b>集成式熱管理系統(tǒng)!納芯微發(fā)布第<b class='flag-5'>二代</b>步進(jìn)電機(jī)驅(qū)動(dòng)NSD8389-Q1

    AMD第二代Versal AI Edge和Versal Prime系列加速量產(chǎn) 為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能

    我們推出了 AMD 第二代 Versal AI Edge 系列和第二代 Versal Prime 系列,這兩款產(chǎn)品是對(duì) Versal 產(chǎn)品組合的擴(kuò)展,可為嵌入式系統(tǒng)實(shí)現(xiàn)單芯片智能。
    的頭像 發(fā)表于 06-11 09:59 ?1697次閱讀

    恩智浦推出第二代OrangeBox車規(guī)級(jí)開(kāi)發(fā)平臺(tái)

    二代OrangeBox開(kāi)發(fā)平臺(tái)集成AI功能、后量子加密技術(shù)及內(nèi)置軟件定義網(wǎng)絡(luò)的能力,應(yīng)對(duì)快速演變的信息安全威脅。
    的頭像 發(fā)表于 05-27 14:25 ?1201次閱讀

    摩爾線程發(fā)布Torch-MUSA v2.0.0版本 支持原生FP8和PyTorch 2.5.0

    支持原生FP8數(shù)據(jù)類型,支持PyTorch 2.5.0 ,并通過(guò)多項(xiàng)針對(duì)MUSA計(jì)算平臺(tái)的性能優(yōu)化,進(jìn)一步提升了對(duì)AI模型和大規(guī)模數(shù)據(jù)處理的支持
    的頭像 發(fā)表于 05-11 16:41 ?1487次閱讀

    二代AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    二代 AMD Versal Premium 系列自適應(yīng) SoC 是一款多功能可配置的平臺(tái),提供全面的 CXL 3.1 子系統(tǒng)。該系列自適應(yīng) SoC 旨在滿足從簡(jiǎn)單到復(fù)雜的各種 CXL 應(yīng)用需求
    的頭像 發(fā)表于 04-24 14:52 ?1110次閱讀
    第<b class='flag-5'>二代</b>AMD Versal Premium系列SoC滿足各種CXL應(yīng)用需求

    方正微電子推出第二代車規(guī)主驅(qū)SiC MOS產(chǎn)品

    2025年4月16日,在上海舉行的三電關(guān)鍵技術(shù)高峰論壇上,方正微電子副總裁彭建華先生正式發(fā)布了第二代車規(guī)主驅(qū)SiC MOS 1200V 13mΩ產(chǎn)品,性能達(dá)到國(guó)際頭部領(lǐng)先水平。
    的頭像 發(fā)表于 04-17 17:06 ?1426次閱讀

    比亞迪二代刀片電池或3月17日發(fā)布

    據(jù)媒體報(bào)道,比亞迪公司將在3月17日召開(kāi)一場(chǎng)發(fā)布會(huì),預(yù)計(jì)此次的重磅發(fā)布會(huì)的主題,或?qū)?huì)是外界期待已久的二代刀片電池,比亞迪二代刀片電池或?qū)?lái)一系列技術(shù)進(jìn)化。而且這或是比亞迪在打出“全民智駕”這張牌
    的頭像 發(fā)表于 03-13 18:16 ?2945次閱讀

    RT-Thread ART-Pi二代正式發(fā)布

    挑戰(zhàn)的日益復(fù)雜,ART-Pi迎來(lái)了全新的迭代——基于STM32H7R的ART-Pi二代,現(xiàn)已正式發(fā)布! ART-Pi二代在繼承一優(yōu)秀基因的基礎(chǔ)上,進(jìn)行了全面的技術(shù)升級(jí)和優(yōu)化。它采用了
    的頭像 發(fā)表于 02-18 14:31 ?1258次閱讀

    新品 | 第二代 CoolSiC? MOSFET G2分立器件 1200 V TO-247-4HC高爬電距離

    第一技術(shù)的優(yōu)勢(shì)為基礎(chǔ),加快了系統(tǒng)設(shè)計(jì)的成本優(yōu)化,實(shí)現(xiàn)高效率、緊湊設(shè)計(jì)和可靠性。第二代產(chǎn)品在硬開(kāi)關(guān)工況和軟開(kāi)關(guān)拓?fù)涞年P(guān)鍵性能指標(biāo)上都有顯著改進(jìn),適用于所有常見(jiàn)的交
    的頭像 發(fā)表于 02-08 08:34 ?1004次閱讀
    新品 | 第<b class='flag-5'>二代</b> CoolSiC? MOSFET G2分立器件 1200 V TO-247-4HC高爬電距離