chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

相比在硬件性能上超越英偉達(dá),軟件生態(tài)的趕超難度顯然更大

工程師鄧生 ? 來源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-12-29 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達(dá)在云端AI訓(xùn)練芯片市場超九成的市占率讓新入局的競爭者們都將槍口指向這家當(dāng)紅AI公司。聲稱AI性能比英偉達(dá)GPU的新產(chǎn)品不少,但真正突破英偉達(dá)護(hù)城河的現(xiàn)在仍未看到。

相比在硬件性能上超越英偉達(dá),軟件生態(tài)的趕超難度顯然更大。不過,微軟亞洲研究院的NNFusion項(xiàng)目以及阿里云的HALO開源項(xiàng)目,正努力降低從GPU遷移到新的硬件平臺的難度和成本,再加上在多個重要AI模型上性能超英偉達(dá)最新A100 GPU的IPU,云端AI芯片市場的格局未來幾年可能會發(fā)生變化。

微軟、阿里云開源項(xiàng)目

降低遷移出GPU的難度

目前AI的落地,仍以互聯(lián)網(wǎng)和云計(jì)算為主。因此,科技巨頭們很快發(fā)現(xiàn)遷移到新平臺不能只看峰值算力。Graphcore高級副總裁兼中國區(qū)總經(jīng)理盧濤表示:“客戶考慮為一個新的軟硬件平臺買單時,首先考慮的是能夠獲得多少收益。其次考慮的是需要多少成本,這涉及軟硬件的遷移成本?!?/p>

對于科技巨頭們而言,GPU確實(shí)是一個好選擇,但考慮到成本、功耗以及自身業(yè)務(wù)的特點(diǎn),仍然有自研或者遷移到其它高性能芯片的動力。此時,軟件成為能否快速、低成本遷移的關(guān)鍵。

將已有的AI模型遷移到新的AI加速器時,現(xiàn)在普遍的做法是在TensorFlow寫一些后端集成新硬件,這給社區(qū)和AI芯片公司都帶來了負(fù)擔(dān),也增加了遷移的難度和成本。

微軟亞洲研究院的NNFusion以及阿里云的HALO開源項(xiàng)目,都是希望從AI編譯的角度,避免重復(fù)性的工作,讓用戶能夠在GPU和其它AI加速器之間盡量平滑遷移,特別是GPU和IPU之間的遷移。

也就是說,NNFusion和HALO向上跨AI框架,既可以集成TensorFlow生成的模型,也可以集成PyTorch或其他框架生成的模型。向下用戶只要通過NNFusion或者HALO的接口就可以在不同的AI芯片上做訓(xùn)練或者推理。

這種調(diào)度框架在降低遷移難度和成本的同時,還能提升性能。根據(jù)2020 OSDI(計(jì)算機(jī)學(xué)界最頂級學(xué)術(shù)會議之一)發(fā)布的研究結(jié)果,研究者在英偉達(dá)和AMD的GPU,還有Graphcore IPU上做了各種測試后得出結(jié)果,在IPU上LSTM的訓(xùn)練模型得到了3倍的提升。

當(dāng)然,這樣的收益還是需要開源社區(qū)與硬件提供方的緊密合作,比如Graphcore與微軟亞洲研究院以及阿里云的合作。

增加遷入IPU的便捷性

“我們與阿里云HALO和微軟NNFusion緊密合作,這兩個項(xiàng)目支持的最主要的平臺是GPU和IPU?!北R濤表示,“目前在阿里云HALO的GitHub里已經(jīng)有IPU的完整支持代碼odla_PopArt,下載開源代碼就已經(jīng)可以在IPU上使用?!?/p>

能夠便捷地使用IPU也離不開主流機(jī)器學(xué)習(xí)框架的支持。Graphcore本月最新發(fā)布了面向IPU的PyTorch產(chǎn)品級版本與Poplar SDK 1.4。PyTorch是AI研究者社區(qū)炙手可熱的機(jī)器學(xué)習(xí)框架,與TensorFlow兩分天下。

PyTorch支持IPU引起了機(jī)器學(xué)習(xí)大神Yann LeCun的關(guān)注。之所以引發(fā)廣泛關(guān)注,是因?yàn)檫@個支持對于IPU的廣泛應(yīng)用有著積極意義。

Graphcore中國工程總負(fù)責(zé)人,AI算法科學(xué)家金琛介紹,“在PyTorch的代碼里,我們引入了一個叫PopTorch的輕量級接口。通過這個接口,用戶可以基于他們當(dāng)前的PyTorch的模型做輕量級封裝,之后就可以無縫的在IPU和CPU上運(yùn)行這個模型?!?/p>

這也能更好地與HALO和NNFusion開源社區(qū)合作。金琛告訴雷鋒網(wǎng),“不同的框架會有不同中間表示格式,也就是IR(Intermediate Representation)。我們希望將不同的IR格式轉(zhuǎn)換到我們通用的PopART計(jì)算圖上,這也是兼容性中最關(guān)鍵的一點(diǎn)?!?/p>

據(jù)悉,IPU對TensorFlow的支持,是像TPU一樣,通過TensorFlow XLA backend接入到TensorFlow的框架,相當(dāng)于把一個TensorFlow計(jì)算圖轉(zhuǎn)換成為一個XLA的計(jì)算圖,然后再通過接入XLA的計(jì)算圖下沉到PopART的計(jì)算圖,通過編譯,就可以生成可以在IPU上執(zhí)行的二進(jìn)制文件。

金琛認(rèn)為,“各個層級圖的轉(zhuǎn)換是一個非常關(guān)鍵的因素,也需要一些定制化工作,因?yàn)槔锩娴囊恍┩ㄓ盟阕右彩腔贗PU進(jìn)行開發(fā)的,這是我們比較特殊的工作?!?/p>

除了需要增加對不同AI框架以及AI框架里自定義算子的支持,增強(qiáng)對模型的覆蓋度的支持,也能夠降低遷移成本。

金琛介紹,對于訓(xùn)練模型的遷移,如果是遷移一個不太復(fù)雜的模型,一般一個開發(fā)者一周就可以完成,比較復(fù)雜的模型則需要兩周時間。如果是遷移推理模型,一般只需要1-2天就可以完成。

IPU正面挑戰(zhàn)GPU,

云端芯片市場或改變

AI時代,軟硬件一體化的重要性更加突顯。盧濤說:“AI處理器公司大致可以分為三類,一類公司是正在講PPT的公司,一類公司是有了芯片的公司,一類公司是真正接近或者是有了軟件的公司?!?/p>

已經(jīng)在軟件方面有進(jìn)展的Graphcore,硬件的表現(xiàn)能否也讓用戶有足夠的切換動力?本月,Graphcore發(fā)布了基于MK2 IPU的IPU-M2000的多個模型的訓(xùn)練Benchmark,包括典型的CV模型ResNet、基于分組卷積的ResNeXt、EfficientNet、語音模型、BERT-Large等自然語言處理模型,MCMC等傳統(tǒng)機(jī)器學(xué)習(xí)模型。

其中有一些比較大的提升,比如與A100 GPU相比,IPU-M2000的ResNet50的吞吐量大概能實(shí)現(xiàn)2.6倍的性能提升,ResNeXt101的吞吐量提升了3.6倍,EfficientNet的吞吐量達(dá)到了18倍,Deep Voice 3達(dá)到了13倍。

值得一提的還有IPU-POD64訓(xùn)練BERT-Large的時間比1臺DGX-A100快5.3倍,比3臺DGX-A100快1.8倍。1個IPU-POD64和3個DGX-A100的功率和價(jià)格基本相同。

強(qiáng)調(diào)IPU訓(xùn)練BERT-Large的成績不僅因?yàn)檫@是英偉達(dá)GPU和谷歌TPU之后第三個發(fā)布能夠訓(xùn)練這一模型的AI芯片,還因?yàn)锽ERT-Large模型對現(xiàn)在芯片落地的意義。

盧濤說:“在今天,BERT-Large模型不管是對于工業(yè)界,還是對研究界都是一個比較好的基準(zhǔn),它在未來至少一年內(nèi)是一個上線的模型水準(zhǔn)。”

不過,這一成績目前并非MLPerf發(fā)布的結(jié)果,正式結(jié)果需要等待Graphcore在明年上半年正式參與MLPerf性能測試。近期,Graphcore宣布加入MLPerf管理機(jī)構(gòu)MLCommons。

“我覺得我們加入MLCommons和提交MLPerf表明,IPU即將在GPU的核心領(lǐng)域里面和GPU正面PK,表明了IPU除了能做GPU不能做的事情,在GPU最擅長的領(lǐng)域,IPU也能以更好TCO實(shí)現(xiàn)相等,甚至更優(yōu)的表現(xiàn)?!北R濤表示。

微軟亞洲研究院、阿里云、Graphcore都在共同推動GPU轉(zhuǎn)向IPU,什么時候會迎來破局時刻?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 軟件
    +關(guān)注

    關(guān)注

    69

    文章

    5257

    瀏覽量

    90494
  • 英偉達(dá)
    +關(guān)注

    關(guān)注

    23

    文章

    4022

    瀏覽量

    97089
  • 智能硬件
    +關(guān)注

    關(guān)注

    205

    文章

    2394

    瀏覽量

    110835
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    阿里神秘AI芯片曝光:多項(xiàng)參數(shù)超越英偉達(dá)A800

    ,并交由中國大陸代工廠生產(chǎn),已經(jīng)進(jìn)入測試階段。 ? 然而在9月16日晚,央視《新聞聯(lián)播》節(jié)目中,阿里平頭哥AI算力卡PPU新聞背景畫面里被曝光,“國產(chǎn)卡與NV卡重要參數(shù)對比”表格中顯示,PPU顯存、片間帶寬等多項(xiàng)
    的頭像 發(fā)表于 09-18 09:46 ?6695次閱讀
    阿里神秘AI芯片曝光:多項(xiàng)參數(shù)<b class='flag-5'>超越</b><b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>A800

    RV生態(tài)又一里程碑:英偉達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    時間里,RISC-V生態(tài)不斷壯大,RISC-V?CPU產(chǎn)品性能持續(xù)提高,開始往高性能的服務(wù)器CPU發(fā)展,形成向Arm服務(wù)器CPU挑戰(zhàn)的趨勢。 ? 而在最近的 第五屆 RISC-V中
    的頭像 發(fā)表于 07-19 00:04 ?5923次閱讀
    RV<b class='flag-5'>生態(tài)</b>又一里程碑:<b class='flag-5'>英偉</b>達(dá)官宣CUDA將兼容RISC-V架構(gòu)!

    特朗普要叫停英偉達(dá)對華特供版 英偉達(dá)H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉達(dá)公司為符合美國出口規(guī)定專門為中國市場開發(fā)的定制芯片,H20芯片在訓(xùn)練AI模型方面不如英偉達(dá)其他芯片速度快;相比
    的頭像 發(fā)表于 04-16 16:59 ?1758次閱讀

    新思科技攜手英偉達(dá)加速芯片設(shè)計(jì),提升芯片電子設(shè)計(jì)自動化效率

    宣布英偉達(dá) Grace Blackwell 平臺上實(shí)現(xiàn)高達(dá) 30 倍的預(yù)期性能提升,加速下一代半導(dǎo)體的電路仿真 ? 摘要: 今年GTC主
    發(fā)表于 03-19 17:59 ?370次閱讀

    英偉達(dá)市值一夜蒸發(fā)近2萬億 英偉達(dá)股價(jià)下跌超8%

    美東時間周一,美股三大指數(shù)集體收跌,截至收盤,英偉達(dá)股價(jià)下跌超8%,英偉達(dá)市值一夜蒸發(fā)2650億美元(換算下來約合人民幣19345億元);
    的頭像 發(fā)表于 03-04 10:19 ?888次閱讀

    英偉達(dá):全自動駕駛汽車至少需十年

    十年才會出現(xiàn)”。他表示:“我們距離實(shí)現(xiàn)這一目標(biāo)還很遙遠(yuǎn),這項(xiàng)技術(shù)難度極大?!?卡尼指出,英偉達(dá)當(dāng)前研發(fā)的軟件與一年前相比已完全不同。如今正在
    的頭像 發(fā)表于 01-23 11:08 ?762次閱讀

    英偉達(dá)組建ASIC團(tuán)隊(duì),挖掘臺灣設(shè)計(jì)服務(wù)人才

    芯片戰(zhàn)線。 據(jù)了解,英偉達(dá)此次挖腳行動的目標(biāo)非常明確,即尋找具有豐富經(jīng)驗(yàn)和專業(yè)技能的設(shè)計(jì)服務(wù)人才。這些人才將加入英偉達(dá)的ASIC團(tuán)隊(duì),共同研發(fā)具有更高
    的頭像 發(fā)表于 01-03 14:39 ?940次閱讀

    英偉達(dá)新應(yīng)用引發(fā)用戶不滿:游戲幀率受影響

    提供更加出色的游戲優(yōu)化體驗(yàn)。 然而,一些用戶安裝并使用這款新應(yīng)用后,卻發(fā)現(xiàn)自己的游戲幀率出現(xiàn)了明顯的下降。這一問題在多個游戲和硬件配置上都得到了驗(yàn)證,使得不少用戶開始質(zhì)疑這款新應(yīng)用的性能和穩(wěn)定性。
    的頭像 發(fā)表于 12-17 14:17 ?768次閱讀

    剛剛!英偉達(dá)最新回應(yīng)!

    達(dá)公司收購邁絡(luò)思科技公司股權(quán)案反壟斷審查決定的公告》(市場監(jiān)管總局公告〔2020〕第16號),市場監(jiān)管總局依法對英偉達(dá)公司開展立案調(diào)查。 受到此消息影響,英偉
    的頭像 發(fā)表于 12-10 18:13 ?1073次閱讀

    英偉達(dá)被立案調(diào)查 英偉達(dá)回應(yīng)反壟斷調(diào)查

    英偉達(dá)被立案調(diào)查!?國家市場監(jiān)督管理總局12 月 9 日晚宣布,英偉達(dá)公司涉嫌違反《中華人民共和國反壟斷法》及《市場監(jiān)管總局關(guān)于附加限制性
    的頭像 發(fā)表于 12-10 15:03 ?706次閱讀

    英偉達(dá)推出GB200 NVL4平臺:整合了兩個GB200芯片

    11月19日消息,人工智能(AI)芯片大廠英偉達(dá)(NVIDIA)正式推出了兩個全新的AI解決方案硬件平臺,一個是BlackwellGB200NVL4,一個是HopperH200NVL。據(jù)介紹,
    的頭像 發(fā)表于 11-21 01:06 ?2053次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>推出GB200 NVL4平臺:整合了兩個GB200芯片

    英偉達(dá)超越蘋果成為市值最高 英偉達(dá)取代英特爾加入道指

    AI浪潮下英偉達(dá)被各路資本競相追逐,2024年英偉達(dá)公司的股價(jià)累計(jì)上漲高達(dá)180%。11月4
    的頭像 發(fā)表于 11-05 15:22 ?984次閱讀

    成全球最高!英偉達(dá)市值超蘋果

    近日,全球圖形處理器(GPU)巨頭英偉達(dá)公司的股價(jià)在當(dāng)日交易中上漲了1.4%,使其總市值達(dá)到了驚人的3.37萬億美元,成功超越了蘋果公司,重新成為全球市值最高的公司。 這一里程碑式的成就凸顯了
    的頭像 發(fā)表于 11-05 14:53 ?819次閱讀

    英偉達(dá)市值欲超蘋果面臨挑戰(zhàn),美研究機(jī)構(gòu)稱穩(wěn)居榜首不易

    。然而,收盤時,蘋果反超了英偉達(dá),重新奪回市值第一的寶座。這已經(jīng)不是英偉達(dá)第一次嘗試登頂了,今年6月,
    的頭像 發(fā)表于 10-28 17:02 ?1194次閱讀