chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

相比在硬件性能上超越英偉達,軟件生態(tài)的趕超難度顯然更大

工程師鄧生 ? 來源:雷鋒網(wǎng) ? 作者:包永剛 ? 2020-12-29 10:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

英偉達在云端AI訓練芯片市場超九成的市占率讓新入局的競爭者們都將槍口指向這家當紅AI公司。聲稱AI性能比英偉達GPU的新產(chǎn)品不少,但真正突破英偉達護城河的現(xiàn)在仍未看到。

相比在硬件性能上超越英偉達,軟件生態(tài)的趕超難度顯然更大。不過,微軟亞洲研究院的NNFusion項目以及阿里云的HALO開源項目,正努力降低從GPU遷移到新的硬件平臺的難度和成本,再加上在多個重要AI模型上性能超英偉達最新A100 GPU的IPU,云端AI芯片市場的格局未來幾年可能會發(fā)生變化。

微軟、阿里云開源項目

降低遷移出GPU的難度

目前AI的落地,仍以互聯(lián)網(wǎng)和云計算為主。因此,科技巨頭們很快發(fā)現(xiàn)遷移到新平臺不能只看峰值算力。Graphcore高級副總裁兼中國區(qū)總經(jīng)理盧濤表示:“客戶考慮為一個新的軟硬件平臺買單時,首先考慮的是能夠獲得多少收益。其次考慮的是需要多少成本,這涉及軟硬件的遷移成本。”

對于科技巨頭們而言,GPU確實是一個好選擇,但考慮到成本、功耗以及自身業(yè)務的特點,仍然有自研或者遷移到其它高性能芯片的動力。此時,軟件成為能否快速、低成本遷移的關鍵。

將已有的AI模型遷移到新的AI加速器時,現(xiàn)在普遍的做法是在TensorFlow寫一些后端集成新硬件,這給社區(qū)和AI芯片公司都帶來了負擔,也增加了遷移的難度和成本。

微軟亞洲研究院的NNFusion以及阿里云的HALO開源項目,都是希望從AI編譯的角度,避免重復性的工作,讓用戶能夠在GPU和其它AI加速器之間盡量平滑遷移,特別是GPU和IPU之間的遷移。

也就是說,NNFusion和HALO向上跨AI框架,既可以集成TensorFlow生成的模型,也可以集成PyTorch或其他框架生成的模型。向下用戶只要通過NNFusion或者HALO的接口就可以在不同的AI芯片上做訓練或者推理。

這種調(diào)度框架在降低遷移難度和成本的同時,還能提升性能。根據(jù)2020 OSDI(計算機學界最頂級學術會議之一)發(fā)布的研究結果,研究者在英偉達和AMD的GPU,還有Graphcore IPU上做了各種測試后得出結果,在IPU上LSTM的訓練模型得到了3倍的提升。

當然,這樣的收益還是需要開源社區(qū)與硬件提供方的緊密合作,比如Graphcore與微軟亞洲研究院以及阿里云的合作。

增加遷入IPU的便捷性

“我們與阿里云HALO和微軟NNFusion緊密合作,這兩個項目支持的最主要的平臺是GPU和IPU?!北R濤表示,“目前在阿里云HALO的GitHub里已經(jīng)有IPU的完整支持代碼odla_PopArt,下載開源代碼就已經(jīng)可以在IPU上使用?!?/p>

能夠便捷地使用IPU也離不開主流機器學習框架的支持。Graphcore本月最新發(fā)布了面向IPU的PyTorch產(chǎn)品級版本與Poplar SDK 1.4。PyTorch是AI研究者社區(qū)炙手可熱的機器學習框架,與TensorFlow兩分天下。

PyTorch支持IPU引起了機器學習大神Yann LeCun的關注。之所以引發(fā)廣泛關注,是因為這個支持對于IPU的廣泛應用有著積極意義。

Graphcore中國工程總負責人,AI算法科學家金琛介紹,“在PyTorch的代碼里,我們引入了一個叫PopTorch的輕量級接口。通過這個接口,用戶可以基于他們當前的PyTorch的模型做輕量級封裝,之后就可以無縫的在IPU和CPU上運行這個模型。”

這也能更好地與HALO和NNFusion開源社區(qū)合作。金琛告訴雷鋒網(wǎng),“不同的框架會有不同中間表示格式,也就是IR(Intermediate Representation)。我們希望將不同的IR格式轉(zhuǎn)換到我們通用的PopART計算圖上,這也是兼容性中最關鍵的一點。”

據(jù)悉,IPU對TensorFlow的支持,是像TPU一樣,通過TensorFlow XLA backend接入到TensorFlow的框架,相當于把一個TensorFlow計算圖轉(zhuǎn)換成為一個XLA的計算圖,然后再通過接入XLA的計算圖下沉到PopART的計算圖,通過編譯,就可以生成可以在IPU上執(zhí)行的二進制文件。

金琛認為,“各個層級圖的轉(zhuǎn)換是一個非常關鍵的因素,也需要一些定制化工作,因為里面的一些通用算子也是基于IPU進行開發(fā)的,這是我們比較特殊的工作?!?/p>

除了需要增加對不同AI框架以及AI框架里自定義算子的支持,增強對模型的覆蓋度的支持,也能夠降低遷移成本。

金琛介紹,對于訓練模型的遷移,如果是遷移一個不太復雜的模型,一般一個開發(fā)者一周就可以完成,比較復雜的模型則需要兩周時間。如果是遷移推理模型,一般只需要1-2天就可以完成。

IPU正面挑戰(zhàn)GPU,

云端芯片市場或改變

AI時代,軟硬件一體化的重要性更加突顯。盧濤說:“AI處理器公司大致可以分為三類,一類公司是正在講PPT的公司,一類公司是有了芯片的公司,一類公司是真正接近或者是有了軟件的公司?!?/p>

已經(jīng)在軟件方面有進展的Graphcore,硬件的表現(xiàn)能否也讓用戶有足夠的切換動力?本月,Graphcore發(fā)布了基于MK2 IPU的IPU-M2000的多個模型的訓練Benchmark,包括典型的CV模型ResNet、基于分組卷積的ResNeXt、EfficientNet、語音模型、BERT-Large等自然語言處理模型,MCMC等傳統(tǒng)機器學習模型。

其中有一些比較大的提升,比如與A100 GPU相比,IPU-M2000的ResNet50的吞吐量大概能實現(xiàn)2.6倍的性能提升,ResNeXt101的吞吐量提升了3.6倍,EfficientNet的吞吐量達到了18倍,Deep Voice 3達到了13倍。

值得一提的還有IPU-POD64訓練BERT-Large的時間比1臺DGX-A100快5.3倍,比3臺DGX-A100快1.8倍。1個IPU-POD64和3個DGX-A100的功率和價格基本相同。

強調(diào)IPU訓練BERT-Large的成績不僅因為這是英偉達GPU和谷歌TPU之后第三個發(fā)布能夠訓練這一模型的AI芯片,還因為BERT-Large模型對現(xiàn)在芯片落地的意義。

盧濤說:“在今天,BERT-Large模型不管是對于工業(yè)界,還是對研究界都是一個比較好的基準,它在未來至少一年內(nèi)是一個上線的模型水準。”

不過,這一成績目前并非MLPerf發(fā)布的結果,正式結果需要等待Graphcore在明年上半年正式參與MLPerf性能測試。近期,Graphcore宣布加入MLPerf管理機構MLCommons。

“我覺得我們加入MLCommons和提交MLPerf表明,IPU即將在GPU的核心領域里面和GPU正面PK,表明了IPU除了能做GPU不能做的事情,在GPU最擅長的領域,IPU也能以更好TCO實現(xiàn)相等,甚至更優(yōu)的表現(xiàn)?!北R濤表示。

微軟亞洲研究院、阿里云、Graphcore都在共同推動GPU轉(zhuǎn)向IPU,什么時候會迎來破局時刻?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 軟件
    +關注

    關注

    69

    文章

    5319

    瀏覽量

    91235
  • 英偉達
    +關注

    關注

    23

    文章

    4068

    瀏覽量

    98458
  • 智能硬件
    +關注

    關注

    205

    文章

    2414

    瀏覽量

    111247
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    套現(xiàn)413億!軟銀清倉英偉,AI硬件泡沫破裂?

    電子發(fā)燒友網(wǎng)報道(文/黃山明)前幾天,全球知名的科技投資公司日本軟銀集團(SBG)突然宣布,公司已經(jīng)今年10月出售了所持有的全部英偉股票,共計3210萬股,套現(xiàn)58億美元(約合人民幣413億元
    的頭像 發(fā)表于 11-13 09:19 ?5485次閱讀

    阿里神秘AI芯片曝光:多項參數(shù)超越英偉A800

    ,并交由中國大陸代工廠生產(chǎn),已經(jīng)進入測試階段。 ? 然而在9月16日晚,央視《新聞聯(lián)播》節(jié)目中,阿里平頭哥AI算力卡PPU新聞背景畫面里被曝光,“國產(chǎn)卡與NV卡重要參數(shù)對比”表格中顯示,PPU顯存、片間帶寬等多項
    的頭像 發(fā)表于 09-18 09:46 ?8020次閱讀
    阿里神秘AI芯片曝光:多項參數(shù)<b class='flag-5'>超越</b><b class='flag-5'>英偉</b><b class='flag-5'>達</b>A800

    RV生態(tài)又一里程碑:英偉達官宣CUDA將兼容RISC-V架構!

    時間里,RISC-V生態(tài)不斷壯大,RISC-V?CPU產(chǎn)品性能持續(xù)提高,開始往高性能的服務器CPU發(fā)展,形成向Arm服務器CPU挑戰(zhàn)的趨勢。 ? 而在最近的 第五屆 RISC-V中
    的頭像 發(fā)表于 07-19 00:04 ?6392次閱讀
    RV<b class='flag-5'>生態(tài)</b>又一里程碑:<b class='flag-5'>英偉</b>達官宣CUDA將兼容RISC-V架構!

    麥格納宣布擴大與英偉的戰(zhàn)略合作

    麥格納宣布擴大與英偉的戰(zhàn)略合作,為整車廠基于英偉DRIVE Hyperion平臺的項目落地提供支持。
    的頭像 發(fā)表于 01-09 12:59 ?259次閱讀

    算力與生態(tài)雙賦能!文遠知行與英偉共拓Robotaxi全球市場

    1月6日,“全球Robotaxi第一股”文遠知行WeRide(NASDAQ: WRD,HKEX: 0800)CES2026(國際消費電子展)期間宣布:作為英偉NVIDIA全球L4級
    的頭像 發(fā)表于 01-07 09:03 ?153次閱讀
    算力與<b class='flag-5'>生態(tài)</b>雙賦能!文遠知行與<b class='flag-5'>英偉</b><b class='flag-5'>達</b>共拓Robotaxi全球市場

    黃仁勛:英偉AI芯片訂單排到2026年 英偉上季營收加速增長62%再超預期

    預計本財季的營收將保持60%以上的增速。 從業(yè)務層面來看,數(shù)據(jù)中心業(yè)務仍然是英偉最核心的增長引擎。該季度,數(shù)據(jù)中心業(yè)務實現(xiàn)銷售額 512 億美元,同比增長 66%,超越分析師 490.9 億美元的預期。其中,以 GPU 為主的
    的頭像 發(fā)表于 11-20 11:36 ?1132次閱讀

    英偉最新B30A芯片曝光:算力角逐中的新變數(shù)

    全球AI芯片市場風云變幻之際,英偉再次成為焦點。據(jù)路透社8月19日報道,兩位知情人士透露,英偉正在為中國市場開發(fā)一款基于其最新Blac
    的頭像 發(fā)表于 08-22 16:41 ?1370次閱讀

    英偉自研HBM基礎裸片

    "后的下一代AI GPU "Feynman"。 ? 有分析指出,英偉此舉或是將部分GPU功能集成到基礎裸片中,旨在提高HBM和GPU的整體性能。英偉
    的頭像 發(fā)表于 08-21 08:16 ?2645次閱讀

    英偉一夜大漲1.2萬億元,市值重回全球第一!

    ABSTRACT摘要英偉股票一夜大漲1.2萬億元,市值超越微軟,重新回到全球第一位置。JAEALOT2025年6月26日截至2025年6月25日美股收盤,英偉
    的頭像 發(fā)表于 06-26 17:35 ?2588次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>一夜大漲1.2萬億元,市值重回全球第一!

    特朗普要叫停英偉對華特供版 英偉H20出口限制 或損失55億美元

    是“中國特供版”人工智能芯片;是英偉公司為符合美國出口規(guī)定專門為中國市場開發(fā)的定制芯片,H20芯片在訓練AI模型方面不如英偉其他芯片速度快;相比
    的頭像 發(fā)表于 04-16 16:59 ?2000次閱讀

    新思科技攜手英偉加速芯片設計,提升芯片電子設計自動化效率

    宣布英偉 Grace Blackwell 平臺上實現(xiàn)高達 30 倍的預期性能提升,加速下一代半導體的電路仿真 ? 摘要: 今年GTC主
    發(fā)表于 03-19 17:59 ?460次閱讀

    N1X 英偉Arm AI PC 芯片技術細節(jié),性能表現(xiàn)

    本市場;N1(中端型號):2026年推出,預計出貨1300萬顆,覆蓋主流AI筆記本用戶。Windows on Arm生態(tài)突破 英偉瞄準微軟生態(tài)痛點,通過N1X填補高通驍龍X系列
    的頭像 發(fā)表于 03-10 10:42 ?2099次閱讀

    英偉市值一夜蒸發(fā)近2萬億 英偉股價下跌超8%

    美東時間周一,美股三大指數(shù)集體收跌,截至收盤,英偉股價下跌超8%,英偉市值一夜蒸發(fā)2650億美元(換算下來約合人民幣19345億元);
    的頭像 發(fā)表于 03-04 10:19 ?1062次閱讀

    英偉發(fā)布DeepSeek R1于NIM平臺

    英偉近日宣布,其DeepSeek R1 671b版本已正式上線英偉NIM(NVIDIA Inference Microservices)平臺,并以預覽版的形式
    的頭像 發(fā)表于 02-05 14:48 ?1016次閱讀