chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

IPU 與 GPU 間無(wú)縫銜接,未來(lái)聚焦數(shù)據(jù)中心的AI訓(xùn)練和推理部署

工程師鄧生 ? 來(lái)源:DeepTech深科技 ? 作者:DeepTech深科技 ? 2021-01-02 10:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

“不管是在今天 GPU 能夠做的事情上,還是 GPU 不能做的事情上,IPU 都有它的價(jià)值點(diǎn)和價(jià)值定位。” 日前,在英國(guó) AI 芯片初創(chuàng)公司 Graphcore 中國(guó)區(qū)的媒體溝通會(huì)上,Graphcore 高級(jí)副總經(jīng)理兼中國(guó)區(qū)總經(jīng)理盧濤和 Graphcore 中國(guó)工程總負(fù)責(zé)人、AI 算法科學(xué)家金琛,就 Graphcore 的新產(chǎn)品性能以及該公司在中國(guó)的落地策略向 DeepTech 等媒體進(jìn)行了同步。

溝通會(huì)上,Graphcore 解讀了其于本月公布的大規(guī)模系統(tǒng)級(jí)產(chǎn)品 IPU-M2000 的應(yīng)用測(cè)試數(shù)據(jù)。公布數(shù)據(jù)顯示,在典型 CV 模型 ResNet、基于分組卷積的 ResNeXt、EfficientNet、語(yǔ)音模型、BERT-Large 等自然語(yǔ)言處理模型以及 MCMC 等傳統(tǒng)機(jī)器學(xué)習(xí)模型中,IPU-M2000 在吞吐量、訓(xùn)練時(shí)間和學(xué)習(xí)結(jié)果生成時(shí)間方面都有較好表現(xiàn)。比如,在 IPU-M2000 上 EfficientNet 的吞吐量達(dá)到 A100 的 18 倍。

圖 | IPU-M2000 與 GPU 的吞吐量、訓(xùn)練及結(jié)果生成時(shí)間對(duì)比(來(lái)源:Graphcore)

66e3cb43bec8442f90d9105440bb1a58.jpeg

此前,IPU-M2000 與 Graphcore 第二代 IPU 處理器 GC200 已于今年 7 月 15 日發(fā)布。據(jù)介紹,GC200 芯片基于臺(tái)積電的 7nm 工藝制造,集成 250 TFlops AI-Float 算力和 900MB 處理器內(nèi)存,相較第一代產(chǎn)品性能提升 8 倍。而對(duì)于第三代 IPU,盧濤在此次溝通會(huì)上并未透露發(fā)布的具體時(shí)間表,不過(guò)他表示下一代產(chǎn)品正在研發(fā)中,將依舊重點(diǎn)解決存儲(chǔ)問(wèn)題。

支持 PyTorch、TensorFlow,在 IPU 與 GPU 間無(wú)縫銜接

另外,Graphcore 還發(fā)布了 Poplar SDK 1.4 版本和 PyTorch 的 IPU 版本。

Graphcore 對(duì) Poplar SDK 1.4 版本在易用性和速度上進(jìn)行了優(yōu)化,能夠支持模型和數(shù)據(jù)并行,同時(shí)能夠?qū)崿F(xiàn)模型的橫向擴(kuò)展 —— 從 1 個(gè) IPU 橫向擴(kuò)展到 64 個(gè) IPU。金琛表示,下一版本的 Poplar SDK 有望實(shí)現(xiàn)橫向擴(kuò)展到 128 個(gè) IPU。

值得關(guān)注的是,除支持 Graphcore 的自研框架 PopART 外,Poplar SDK 1.4 還支持 Facebook 的 PyTorch 框架、以及 Google 的 TensorFlow 框架。

據(jù)金琛介紹,Graphcore 在 PyTorch 代碼中引入了 PopTorch 輕量級(jí)接口,通過(guò)這一接口,用戶可基于當(dāng)前的 PyTorch 模型進(jìn)行封裝,以實(shí)現(xiàn) IPU 和 CPU 之間的無(wú)障礙銜接。

對(duì)于實(shí)現(xiàn)這一功能的核心技術(shù),金琛做進(jìn)一步解釋說(shuō),Graphcore 采用 PyTorch 里的 jit.trace 機(jī)制對(duì)計(jì)算圖進(jìn)行編譯,轉(zhuǎn)化為 IPU 和 PyTorch 兼容的表達(dá)格式,最后用 Graphcore 自研框架 PopART 后端的 audiff 功能自動(dòng)生成反向圖,便可以實(shí)現(xiàn)同一個(gè)模型在不同平臺(tái)的無(wú)差別運(yùn)行。

目前,PyTorch 因其直觀易懂、靈活易用等優(yōu)勢(shì)受到開(kāi)發(fā)者的廣泛喜愛(ài)和應(yīng)用。Poplar SDK 1.4 增加了對(duì) PyTorch 的支持,策略上是希望用戶在 IPU 上也能體驗(yàn) PyTorch,讓用戶多一個(gè)轉(zhuǎn)戰(zhàn) IPU 的理由。不過(guò)目前英偉達(dá)的 GPU 已經(jīng)在 AI 計(jì)算領(lǐng)域占據(jù)大部分市場(chǎng),此時(shí) IPU 能夠提供的價(jià)值、轉(zhuǎn)場(chǎng)到 IPU 的成本等,都是用戶所要考慮的問(wèn)題。

在遷移成本上,盧濤表示,經(jīng)過(guò)幾年來(lái)對(duì) Poplar SDK 的打磨,現(xiàn)在從 GPU 到 IPU 的軟硬件遷移難度已經(jīng)比大家認(rèn)為的小得多。

金琛補(bǔ)充道,在訓(xùn)練上,針對(duì)一個(gè)不太復(fù)雜的模型,一般一周可以遷移完成,對(duì)于復(fù)雜的模型大概需要兩周;在推理上,基本上是 1-2 天的工作量。

談及性能,盧濤表示:“IPU 在訓(xùn)練推理、語(yǔ)音、圖像模型處理上基本全面超越 GPU?!?不過(guò)他也坦言:“不能說(shuō) 100% 超越了 GPU,因?yàn)樗惴P痛_實(shí)非常多,比如說(shuō)語(yǔ)音有不同的語(yǔ)音模型、圖像也是有不同的圖像模型?!?/p>

未來(lái):持續(xù)優(yōu)化性能,進(jìn)一步壓縮遷移成本

IPU 在機(jī)器學(xué)習(xí)性能上的明顯優(yōu)勢(shì)是不可否認(rèn)的,但前有身強(qiáng)體壯且努力奔跑的巨頭英偉達(dá),Graphcore 更是一刻也不容懈怠。盧濤在溝通會(huì)上也多次提到,“目前 Graphcore 面對(duì)的壓力最主要還是來(lái)自英偉達(dá)”。

“重壓” 之下,Graphcore 短期內(nèi)的計(jì)劃是聚焦在數(shù)據(jù)中心高性能訓(xùn)練和推理市場(chǎng)上,持續(xù)打磨 IPU 和軟件平臺(tái),持續(xù)優(yōu)化性能和提高可用性。盧濤說(shuō),“只有在我們聚焦的領(lǐng)域跑得更快,Graphcore 和英偉達(dá)之間的距離才會(huì)越來(lái)越短,甚至在某些領(lǐng)域超過(guò)英偉達(dá)”。

他還表示,Graphcore 希望未來(lái)數(shù)年內(nèi),能在數(shù)據(jù)中心的 AI 訓(xùn)練、推理批量部署、以及發(fā)貨和體量上做到除英偉達(dá)以外的另一個(gè)頭部地位。

為實(shí)現(xiàn)該目標(biāo),Graphcore 也將從增加 AI 框架支持、以及模型覆蓋兩個(gè)維度著手,以期進(jìn)一步減少用戶的遷移成本。此外,除目前 AI 應(yīng)用最廣泛的互聯(lián)網(wǎng)和云計(jì)算兩個(gè)場(chǎng)景外,盧濤表示公司明年還將在金融、汽車、智慧醫(yī)療、智慧教育、智慧城市和政府服務(wù)等領(lǐng)域,至少突破一到兩個(gè)比較主流的領(lǐng)域。

責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5039

    瀏覽量

    133841
  • 數(shù)據(jù)中心
    +關(guān)注

    關(guān)注

    16

    文章

    5425

    瀏覽量

    74337
  • IPU
    IPU
    +關(guān)注

    關(guān)注

    0

    文章

    35

    瀏覽量

    15893
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)

    NVIDIA Quantum-2交換機(jī)等主流設(shè)備。 平滑擴(kuò)展:與現(xiàn)有400G/100G設(shè)備無(wú)縫互通,降低數(shù)據(jù)中心升級(jí)成本。 多場(chǎng)景覆蓋:從AI訓(xùn)練集群的“大象流”到
    發(fā)表于 08-13 19:01

    加速AI未來(lái),睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)

    客戶的共同選擇 超算中心應(yīng)用 :為某國(guó)家實(shí)驗(yàn)室提供800G OSFP SR8模塊,構(gòu)建E級(jí)超算互聯(lián)網(wǎng)絡(luò) AI訓(xùn)練集群 :某自動(dòng)駕駛企業(yè)采用我們的解決方案,GPU
    發(fā)表于 08-13 16:38

    PCIe協(xié)議分析儀在數(shù)據(jù)中心中有何作用?

    數(shù)據(jù)中心的整體可靠性。以下是其核心作用及具體應(yīng)用場(chǎng)景的詳細(xì)分析:一、性能優(yōu)化:突破帶寬瓶頸,提升計(jì)算效率 鏈路帶寬利用率分析 場(chǎng)景:在AI訓(xùn)練集群中,GPU通過(guò)PCIe與CPU交換
    發(fā)表于 07-29 15:02

    PCIe協(xié)議分析儀能測(cè)試哪些設(shè)備?

    :提升數(shù)據(jù)中心的整體效率,降低CPU負(fù)載。 四、異構(gòu)計(jì)算與擴(kuò)展設(shè)備 多GPU系統(tǒng) 測(cè)試場(chǎng)景:利用PCIe協(xié)議分析儀模擬高負(fù)載的GPU通信,測(cè)試PCIe交換機(jī)的性能和穩(wěn)定性。 應(yīng)用價(jià)
    發(fā)表于 07-25 14:09

    中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案

    中型數(shù)據(jù)中心的定義與特點(diǎn) 中型數(shù)據(jù)中心通常服務(wù)于中大型企業(yè)、科研機(jī)構(gòu)或地方行業(yè)節(jié)點(diǎn),具備50至200個(gè)機(jī)柜,部署多臺(tái)服務(wù)器、交換設(shè)備、存儲(chǔ)系統(tǒng)與光通信鏈路等,強(qiáng)調(diào)高帶寬、低延遲與高可用性。關(guān)鍵設(shè)備
    發(fā)表于 07-01 16:33

    施耐德電氣發(fā)布數(shù)據(jù)中心高密度AI集群部署解決方案

    在人工智能(AI)驅(qū)動(dòng)的產(chǎn)業(yè)革命浪潮中,數(shù)據(jù)中心正迎來(lái)深刻變革。面對(duì)迅猛增長(zhǎng)的人工智能算力需求,部署高密度AI集群已成為數(shù)據(jù)中心發(fā)展的必然選
    的頭像 發(fā)表于 04-19 16:54 ?1078次閱讀
    施耐德電氣發(fā)布<b class='flag-5'>數(shù)據(jù)中心</b>高密度<b class='flag-5'>AI</b>集群<b class='flag-5'>部署</b>解決方案

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器以驗(yàn)證和優(yōu)化網(wǎng)絡(luò)架構(gòu)和主機(jī)設(shè)計(jì)

    : KEYS )推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進(jìn)的軟件套件,通過(guò)模擬真實(shí)工作負(fù)載來(lái)評(píng)估新算法、組件和協(xié)議對(duì)AI訓(xùn)練性能的影響。KAI
    的頭像 發(fā)表于 04-10 08:50 ?415次閱讀

    是德科技推出AI數(shù)據(jù)中心構(gòu)建器

    是德科技(NYSE:KEYS)推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進(jìn)的軟件套件,通過(guò)模擬真實(shí)工作負(fù)載來(lái)評(píng)估新算法、組件和協(xié)議對(duì)AI訓(xùn)練性能的影響。KAI
    的頭像 發(fā)表于 04-07 11:06 ?689次閱讀

    適用于數(shù)據(jù)中心AI時(shí)代的800G網(wǎng)絡(luò)

    ,成為新一代AI數(shù)據(jù)中心的核心驅(qū)動(dòng)力。 AI時(shí)代的兩大數(shù)據(jù)中心AI工廠與AI
    發(fā)表于 03-25 17:35

    DeepSeek推動(dòng)AI算力需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI算力需求正以前所未有的速度增長(zhǎng)。DeepSeek等大模型的訓(xùn)練推理任務(wù)對(duì)算力的需求持續(xù)攀升,直接推動(dòng)了服務(wù)器、光通信設(shè)備以及數(shù)據(jù)中心基礎(chǔ)設(shè)施的升級(jí)。特
    發(fā)表于 03-25 12:00

    華為全新升級(jí)星河AI數(shù)據(jù)中心網(wǎng)絡(luò)

    在華為中國(guó)合作伙伴大會(huì)2025期,以 “星河AI數(shù)據(jù)中心網(wǎng)絡(luò),賦AI時(shí)代新動(dòng)能”為主題的數(shù)據(jù)中心網(wǎng)絡(luò)分論壇圓滿落幕。本次論壇匯聚了來(lái)自全國(guó)
    的頭像 發(fā)表于 03-24 14:46 ?742次閱讀

    Cadence顛覆AI數(shù)據(jù)中心設(shè)計(jì)

    日前舉辦的英偉達(dá) GTC 2025 開(kāi)發(fā)者大會(huì)匯聚了眾多行業(yè)精英,共同探討人工智能的未來(lái)。而人工智能正在重塑全球數(shù)據(jù)中心的格局。據(jù)預(yù)測(cè),未來(lái)將有 1 萬(wàn)億美元用于 AI 驅(qū)動(dòng)的
    的頭像 發(fā)表于 03-21 15:43 ?688次閱讀

    FPGA+AI王炸組合如何重塑未來(lái)世界:看看DeepSeek東方神秘力量如何預(yù)測(cè)......

    ”“大模型圈的大黑馬”“硅谷震驚了”“來(lái)自中國(guó)的學(xué)霸級(jí)AI”…… 從智能手機(jī)到自動(dòng)駕駛,從數(shù)據(jù)中心到物聯(lián)網(wǎng),F(xiàn)PGA 正悄然改變著我們的生活。未來(lái),F(xiàn)PGA 又將如何塑造世界?DeepSeek 帶你一起
    發(fā)表于 03-03 11:21

    GPU是如何訓(xùn)練AI大模型的

    AI模型的訓(xùn)練過(guò)程中,大量的計(jì)算工作集中在矩陣乘法、向量加法和激活函數(shù)等運(yùn)算上。這些運(yùn)算正是GPU所擅長(zhǎng)的。接下來(lái),AI部落小編帶您了解GPU
    的頭像 發(fā)表于 12-19 17:54 ?1031次閱讀

    華迅光通AI計(jì)算加速800G光模塊部署

    近年來(lái),在人工智能計(jì)算需求不斷增長(zhǎng)的推動(dòng)下,對(duì)GPU和其他計(jì)算硬件的需求急劇飆升。僅今年一年,英偉達(dá)的股價(jià)就上漲了200%以上,這一點(diǎn)顯而易見(jiàn)。此外,由于數(shù)據(jù)中心的人工智能訓(xùn)練需要高速數(shù)據(jù)
    發(fā)表于 11-13 10:16