chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從8小時(shí)到80秒,NVIDIA如何實(shí)現(xiàn)AI訓(xùn)練用時(shí)大突破?

張慧娟 ? 來源:電子發(fā)燒友網(wǎng) ? 作者:張慧娟 ? 2019-07-11 17:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


“天下武功,唯快不破”,你需要以“快”制勝。

如今,全球頂級公司的研究人員和數(shù)據(jù)科學(xué)家團(tuán)隊(duì)們都在致力于創(chuàng)建更為復(fù)雜的AI模型。但是,AI模型的創(chuàng)建工作不僅僅是設(shè)計(jì)模型,還需要對模型進(jìn)行快速地訓(xùn)練。

這就是為什么說,如果想在AI領(lǐng)域保持領(lǐng)導(dǎo)力,就首先需要有賴于AI基礎(chǔ)設(shè)施的領(lǐng)導(dǎo)力。而這也正解釋了為什么MLPerf AI訓(xùn)練結(jié)果如此之重要。

通過完成全部6項(xiàng)MLPerf基準(zhǔn)測試,NVIDIA展現(xiàn)出了全球一流的性能表現(xiàn)和多功能性。NVIDIA AI平臺在訓(xùn)練性能方面創(chuàng)下了八項(xiàng)記錄,其中包括三項(xiàng)大規(guī)模整體性能紀(jì)錄和五項(xiàng)基于每個(gè)加速器的性能紀(jì)錄。

表1:NVIDIA MLPerf AI紀(jì)錄

每個(gè)加速器的比較基于早前報(bào)告的基于單一NVIDIA DGX-2H(16個(gè)V100 GPU)、與其他同規(guī)模相比較的MLPerf 0.6的性能(除MiniGo采用的是基于8個(gè)V100 GPU的NVIDIA DGX-1)|最大規(guī)模MLPerf ID:Mask R-CNN:0.6-23,GNMT:0.6-26,MiniGo:0.6-11 |每加速器MLPerf ID:Mask R-CNN,SSD,GNMT,Transformer:全部使用0.6-20,MiniGo:0.6-10

以上測試結(jié)果數(shù)據(jù)由谷歌、英特爾、百度、NVIDIA、以及創(chuàng)建MLPerf AI基準(zhǔn)測試的其他數(shù)十家頂級技術(shù)公司和大學(xué)提供背書,能夠轉(zhuǎn)化為具有重要意義的創(chuàng)新。

簡而言之,NVIDIA的AI平臺如今能夠在不到兩分鐘的時(shí)間內(nèi)完成此前需要一個(gè)工作日才能完成的模型訓(xùn)練。

各公司都知道,釋放生產(chǎn)力是一件重中之重的要務(wù)。超級計(jì)算機(jī)如今已經(jīng)成為了AI的必備工具,樹立AI領(lǐng)域的領(lǐng)導(dǎo)力首先需要強(qiáng)大的AI計(jì)算基礎(chǔ)設(shè)施支持。

NVIDIA最新的MLPerf結(jié)果很好地展示了將NVIDIA V100 Tensor核心GPU應(yīng)用于超算級基礎(chǔ)設(shè)施中所能帶來的益處。

在2017年春季的時(shí)候,使用搭載了V100 GPU的NVIDIA DGX-1系統(tǒng)訓(xùn)練圖像識別模型ResNet-50,需要花費(fèi)整整一個(gè)工作日(8小時(shí))的時(shí)間。

而如今,同樣的任務(wù),NVIDIA DGX SuperPOD使用相同的V100 GPU,采用Mellanox InfiniBand進(jìn)行互聯(lián),并借助可用于分布式AI訓(xùn)練的最新NVIDIA優(yōu)化型AI軟件,僅需80秒即可完成。

80秒的時(shí)間,甚至都不夠用來沖一杯咖啡。

圖1:AI時(shí)間機(jī)器
2019年MLPerf ID(按圖表從上到下的順序):ResNet-50:0.6-30 | Transformer:0.6-28 | GNMT:0.6-14 | SSD:0.6-27 | MiniGo:0.6-11 | Mask R-CNN:0

AI的必備工具:DGX SuperPOD能夠更快速地完成工作負(fù)載

仔細(xì)觀察今日的MLPerf結(jié)果,會發(fā)現(xiàn)NVIDIA DGX SuperPOD是唯一在所有六個(gè)MLPerf類別中耗時(shí)都少于20分鐘的AI平臺:
?
圖2:DGX SuperPOD打破大規(guī)模AI紀(jì)錄
大規(guī)模MLPerf 0.6性能|大規(guī)模MLPerf ID:RN50 v1.5:0.6-30,0.6-6 | Transformer:0.6-28,0.6-6 | GNMT:0.6-26,0.6-5 | SSD:0.6-27,0.6-6 | MiniGo:0.6-11,0.6-7 | Mask R-CNN:0.6-23,0.6-3

更進(jìn)一步觀察會發(fā)現(xiàn),針對重量級目標(biāo)檢測和強(qiáng)化學(xué)習(xí),這些最困難的AI問題,NVIDIA AI平臺在總體訓(xùn)練時(shí)間方面脫穎而出。

使用Mask R-CNN深度神經(jīng)網(wǎng)絡(luò)的重量級目標(biāo)檢測可為用戶提供高級實(shí)例分割。其用途包括將其與多個(gè)數(shù)據(jù)源(攝像頭、傳感器、激光雷達(dá)、超聲波等)相結(jié)合,以精確識別并定位特定目標(biāo)。

這類AI工作負(fù)載有助于訓(xùn)練自動駕駛汽車,為其提供行人和其他目標(biāo)的精確位置。另外,在醫(yī)療健康領(lǐng)域,它能夠幫助醫(yī)生在醫(yī)療掃描中查找并識別腫瘤。其意義的重要性非同小可。

NVIDIA的“重量級目標(biāo)檢測”用時(shí)不到19分鐘,性能幾乎是第二名的兩倍。

強(qiáng)化學(xué)習(xí)是另一有難度的類別。這種AI方法能夠用于訓(xùn)練工廠車間機(jī)器人,以簡化生產(chǎn)。城市也可以用這種方式來控制交通燈,以減少擁堵。NVIDIA采用NVIDIA DGX SuperPOD,在創(chuàng)紀(jì)錄的13.57分鐘內(nèi)完成了對MiniGo AI強(qiáng)化訓(xùn)練模型的訓(xùn)練。

咖啡還沒好,任務(wù)已完成:即時(shí)AI基礎(chǔ)設(shè)施提供全球領(lǐng)先性能

打破基準(zhǔn)測試紀(jì)錄不是目的,加速創(chuàng)新才是目標(biāo)。這就是為什么NVIDIA構(gòu)建的DGX SuperPOD不僅性能強(qiáng)大,而且易于部署。

DGX SuperPOD全面配置了可通過NGC容器注冊表免費(fèi)獲取的優(yōu)化型CUDA-X AI軟件,可提供開箱即用的全球領(lǐng)先AI性能。

在這個(gè)由130多萬名CUDA開發(fā)者組成的生態(tài)系統(tǒng)中,NVIDIA與開發(fā)者們合作,致力于為所有AI框架和開發(fā)環(huán)境提供有力支持。

我們已經(jīng)助力優(yōu)化了數(shù)百萬行代碼,讓我們的客戶能夠?qū)⑵銩I項(xiàng)目落地,無論您身在何處都可以找到NVIDIA GPU,無論是在云端,還是在數(shù)據(jù)中心,亦或是邊緣。

AI基礎(chǔ)設(shè)施如今有夠快,未來會更快

更好的一點(diǎn)在于,這一平臺的速度一直在提升。NVIDIA每月都會發(fā)布CUDA-X AI軟件的新優(yōu)化和性能改進(jìn),集成型軟件堆??稍贜GC容器注冊表中免費(fèi)下載,包括容器化的框架、預(yù)先訓(xùn)練好的模型和腳本。

借助在CUDA-X AI軟件堆棧上的創(chuàng)新,NVIDIA DGX-2H服務(wù)器的MLPerf 0.6吞吐量比NVIDIA七個(gè)月前發(fā)布的結(jié)果提升了80%。

圖3:基于同一服務(wù)器,性能提升高達(dá)80%
對單個(gè)歷元上單一DGX-2H服務(wù)器的吞吐量進(jìn)行比較(數(shù)據(jù)集單次通過神經(jīng)網(wǎng)絡(luò))| MLPerf ID 0.5 / 0.6比較:ResNet-50 v1.5: 0.5-20/0.6-30 | Transformer: 0.5-21/0.6-20 | SSD: 0.5-21/0.6-20 | GNMT: 0.5-19/0.6-20 | Mask R-CNN: 0.5-21/0.6-20
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    89

    文章

    38013

    瀏覽量

    296004
  • MLPerf基準(zhǔn)測試
    +關(guān)注

    關(guān)注

    0

    文章

    2

    瀏覽量

    1167
  • 模型訓(xùn)練
    +關(guān)注

    關(guān)注

    0

    文章

    21

    瀏覽量

    1520
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    RA8P1部署ai模型指南:訓(xùn)練模型部署?|?本周六

    在嵌入式邊緣AI中,如何把“訓(xùn)練好的模型”穩(wěn)定地“跑在板子上”,決定了項(xiàng)目能否落地。我們帶你基于RA8P1平臺,跑通數(shù)據(jù)準(zhǔn)備、模型訓(xùn)練、量
    的頭像 發(fā)表于 11-20 18:06 ?1593次閱讀
    RA<b class='flag-5'>8</b>P1部署<b class='flag-5'>ai</b>模型指南:<b class='flag-5'>從</b><b class='flag-5'>訓(xùn)練</b>模型<b class='flag-5'>到</b>部署?|?本周六

    NVIDIA CEO黃仁勛暢談AI時(shí)代最新藍(lán)圖

    在主題演講中,NVIDIA 創(chuàng)始人兼首席執(zhí)行官黃仁勛勾勒出了 AI 時(shí)代的最新藍(lán)圖。大規(guī)模 GPU 部署和量子技術(shù)突破,
    的頭像 發(fā)表于 11-03 14:45 ?474次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片AGI芯片

    、分布式群體智能 1)物聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢: 組成部分: 2)分布式AI訓(xùn)練 7、發(fā)展重點(diǎn):基于強(qiáng)化學(xué)習(xí)的后訓(xùn)練與推理 8、超越大模型:神經(jīng)符號計(jì)算 三、AGI芯片的
    發(fā)表于 09-18 15:31

    AI的核心操控:算法硬件的協(xié)同進(jìn)化

    ? ? ? ?人工智能(AI)的核心操控涉及算法、算力和數(shù)據(jù)三大要素的深度融合,其技術(shù)本質(zhì)是通過硬件與軟件的協(xié)同優(yōu)化實(shí)現(xiàn)對復(fù)雜任務(wù)的自主決策與執(zhí)行。這一過程依賴多層技術(shù)棧的精密配合,底層的芯片架構(gòu)
    的頭像 發(fā)表于 09-08 17:51 ?746次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:AI硬件AI濕件

    ,又分為真菌計(jì)算和基于DNA的計(jì)算。 圖4 基本的真菌計(jì)算機(jī)結(jié)構(gòu) 在用化學(xué)和生物方法實(shí)現(xiàn)AI功能的過程中,要經(jīng)歷5個(gè)階段,見圖5所示。 圖5 以化學(xué)和生物方法實(shí)現(xiàn)AI功能各階段 期待
    發(fā)表于 09-06 19:12

    NVIDIA助力樞途科技突破視頻提取具身數(shù)據(jù)技術(shù)鴻溝

    技術(shù),加速了互聯(lián)網(wǎng)視頻提取具身智能模型訓(xùn)練數(shù)據(jù),實(shí)現(xiàn)視頻三維大世界重建、任務(wù)語義信息理解、物體細(xì)節(jié)及軌跡提取、多模態(tài)數(shù)據(jù)采集、具身智能算法訓(xùn)練
    的頭像 發(fā)表于 08-30 16:11 ?1556次閱讀

    睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級

    NVIDIA Quantum-2交換機(jī)等主流設(shè)備。 平滑擴(kuò)展:與現(xiàn)有400G/100G設(shè)備無縫互通,降低數(shù)據(jù)中心升級成本。 多場景覆蓋:AI訓(xùn)練集群的“大象流”
    發(fā)表于 08-13 19:01

    加速AI未來,睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)

    800Gbps,完美適配大模型訓(xùn)練等高帶寬場景 廣泛兼容 :通過NVIDIA Quantum-2交換機(jī)、Spectrum-4以太網(wǎng)設(shè)備的嚴(yán)格兼容性測試 穩(wěn)定可靠 :平均無故障時(shí)間(MTBF)突破300萬
    發(fā)表于 08-13 16:38

    NVIDIA AI助力科學(xué)研究領(lǐng)域持續(xù)突破

    隨著 AI 技術(shù)的廣泛應(yīng)用,AI 正在成為科學(xué)研究的引擎。NVIDIA 作為重要的技術(shù)推手,持續(xù)驅(qū)動著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。
    的頭像 發(fā)表于 08-05 16:30 ?937次閱讀

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學(xué)探索,推動各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過深化合作提供先進(jìn)的技術(shù), PC 加速代
    的頭像 發(fā)表于 05-27 14:03 ?740次閱讀

    海思SD3403邊緣計(jì)算AI數(shù)據(jù)訓(xùn)練概述

    AI數(shù)據(jù)訓(xùn)練:基于用戶特定應(yīng)用場景,用戶采集照片或視頻,通過AI數(shù)據(jù)訓(xùn)練工程師**(用戶公司****員工)** ,進(jìn)行特征標(biāo)定后,將標(biāo)定好的訓(xùn)練
    發(fā)表于 04-28 11:11

    RAKsmart智能算力架構(gòu):異構(gòu)計(jì)算+低時(shí)延網(wǎng)絡(luò)驅(qū)動企業(yè)AI訓(xùn)練范式升級

    AI大模型參數(shù)量突破萬億、多模態(tài)應(yīng)用爆發(fā)的今天,企業(yè)AI訓(xùn)練正面臨算力效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能算力架構(gòu),以異構(gòu)計(jì)算資源池化與超低時(shí)延網(wǎng)絡(luò)為核心,重構(gòu)
    的頭像 發(fā)表于 04-17 09:29 ?591次閱讀

    首創(chuàng)開源架構(gòu),天璣AI開發(fā)套件讓端側(cè)AI模型接入得心應(yīng)手

    猛增50倍,將訓(xùn)練時(shí)間從一整天縮短至半小時(shí)。更快的端側(cè)LoRA訓(xùn)練,讓端側(cè)AI基于用戶端側(cè)數(shù)據(jù)提升個(gè)性化體驗(yàn),讓終端成為更懂用戶的個(gè)性化智慧伙伴。 智能體用戶體驗(yàn)的進(jìn)化,
    發(fā)表于 04-13 19:52

    NVIDIA實(shí)現(xiàn)神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能

    近日,NVIDIA 宣布了 NVIDIA RTX 神經(jīng)網(wǎng)絡(luò)渲染技術(shù)的突破性增強(qiáng)功能。NVIDIA 與微軟合作,將在 4 月的 Microsoft DirectX 預(yù)覽版中增加神經(jīng)網(wǎng)絡(luò)著
    的頭像 發(fā)表于 04-07 11:33 ?852次閱讀

    摩爾線程GPU原生FP8計(jì)算助力AI訓(xùn)練

    近日,摩爾線程正式開源MT-MegatronLM與MT-TransformerEngine兩大AI框架。通過深度融合FP8混合訓(xùn)練策略和高性能算子庫,這兩大框架在國產(chǎn)全功能GPU上實(shí)現(xiàn)
    的頭像 發(fā)表于 03-17 17:05 ?1185次閱讀
    摩爾線程GPU原生FP<b class='flag-5'>8</b>計(jì)算助力<b class='flag-5'>AI</b><b class='flag-5'>訓(xùn)練</b>