chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

攀登深度學(xué)習(xí)之巔 對(duì)AI領(lǐng)域會(huì)產(chǎn)生什么深遠(yuǎn)影響

Tensorflowers ? 來(lái)源:未知 ? 2019-02-23 10:54 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2018 年,由美國(guó)國(guó)家能源研究科學(xué)計(jì)算中心 (NERSC) 與 NVIDIA組成的聯(lián)合團(tuán)隊(duì)取得了一項(xiàng)突破性成就。他們成功將一種科學(xué)嚴(yán)謹(jǐn)?shù)?a target="_blank">深度學(xué)習(xí)應(yīng)用擴(kuò)展至 27000 多個(gè)NVIDIA V100Tensor 核心 GPU,攻克了此過(guò)程中百億億次運(yùn)算的難關(guān)。憑借該項(xiàng)成就,研究團(tuán)隊(duì)由此斬獲高性能計(jì)算領(lǐng)域的最高獎(jiǎng)項(xiàng)ACM 戈登貝爾獎(jiǎng)。除 2018 年的技術(shù)論文與新聞稿之外,我們還將在本文中探討這項(xiàng)成就對(duì) AI 領(lǐng)域產(chǎn)生的深遠(yuǎn)影響,以及未來(lái)面臨的開(kāi)放性挑戰(zhàn)。

由伯克利實(shí)驗(yàn)室與橡樹(shù)嶺國(guó)家實(shí)驗(yàn)室各自領(lǐng)導(dǎo)的兩個(gè)研究團(tuán)隊(duì)共享 2018 年 ACM 戈登貝爾獎(jiǎng)

深度學(xué)習(xí)軟件:性能與生產(chǎn)力

低級(jí)工具能為開(kāi)發(fā)者帶來(lái)精確度,高級(jí)工具則可提高工作效率,這二者之間總存在一個(gè)折衷點(diǎn)。我們已為此找到解決方案。在本次項(xiàng)目中,我們用高效的 PythonTensorFlow 表示網(wǎng)絡(luò)架構(gòu)與整體的應(yīng)用工作流。TensorFlow 反過(guò)來(lái)會(huì)利用在 C 和 C++ 環(huán)境中實(shí)施的例程來(lái)實(shí)現(xiàn)高性能,提供精確度,并解放開(kāi)發(fā)者以提高其工作效率。因此,在 8 個(gè)月的時(shí)間里,我們的團(tuán)隊(duì)從頭開(kāi)始構(gòu)建網(wǎng)絡(luò)原型,并在全球最大的高性能計(jì)算 (HPC) 系統(tǒng) Summit 上對(duì)其性能與擴(kuò)展作出了優(yōu)化。

我們相信,此項(xiàng)目能夠展示出研究人員長(zhǎng)期推測(cè)的 HPC 與 AI 軟件堆棧的實(shí)際融合效果,即以 C/C++ 編寫(xiě)的高性能庫(kù) (CuDNN) 和框架 (TensorFlow),以及通過(guò) Python 公開(kāi)的高效接口。同理,我們還在 NCCL 和 MPI 中實(shí)施經(jīng)高度優(yōu)化且基于拓?fù)涓兄?a target="_blank">通信集合,但通過(guò)簡(jiǎn)單高效的 Horovod 接口實(shí)現(xiàn)公開(kāi)。展望未來(lái),我們相信,在助力科學(xué)家及更廣泛的研究社區(qū)探索更復(fù)雜架構(gòu)的過(guò)程中,為混合并行模式(數(shù)據(jù)、模型、流水線(xiàn))提供透明支持將至關(guān)重要。

深度學(xué)習(xí)硬件:GPU 和混合精度

本次項(xiàng)目利用 NVIDIA Volta GPU 來(lái)訓(xùn)練 DeepLabv3+ 分割網(wǎng)絡(luò)。在混合精度模式下,Volta 上可達(dá)到的峰值性能為 125 萬(wàn)億次浮點(diǎn)運(yùn)算。該模式由 NVIDIA 通過(guò) Tensor 核心 GPU 架構(gòu)推出,可執(zhí)行 FP16 精度計(jì)算并能以 FP32 精度模式累積結(jié)果。在本項(xiàng)目開(kāi)展之前,該領(lǐng)域存在一個(gè)仍待解決的問(wèn)題,即現(xiàn)實(shí)的科學(xué)應(yīng)用能否利用 FP16(不損失精確度)并獲得較高的峰值性能。我們的研究最終證明,對(duì)于科學(xué)領(lǐng)域的模式識(shí)別問(wèn)題,16 位精度可能足以滿(mǎn)足相關(guān)需求。此外,對(duì)于擁有 4000 多個(gè)計(jì)算核心的復(fù)雜應(yīng)用而言,極高的峰值亦有可能實(shí)現(xiàn):在規(guī)模龐大的 GPU 集群上,我們的應(yīng)用實(shí)現(xiàn)了每塊 GPU 大約 40 萬(wàn)億次浮點(diǎn)運(yùn)算的峰值性能。

我們相信,這些結(jié)果為科學(xué)應(yīng)用打開(kāi)了通往低精度加速器的一扇大門(mén)。雖然原始數(shù)據(jù)集可能具有高精度(64 位或 32 位),但我們或許仍可以在不損失收斂或穩(wěn)定性的前提下,以低精度模式執(zhí)行模式識(shí)別任務(wù)。

開(kāi)放性挑戰(zhàn)

如要在當(dāng)代的 HPC 系統(tǒng)上實(shí)現(xiàn)百億億級(jí)的性能,我們需對(duì)所有組件仔細(xì)調(diào)優(yōu),包括硬件(CPU、GPU、NVLink、文件系統(tǒng)、網(wǎng)絡(luò)互連)和軟件。雖然我們的項(xiàng)目成功實(shí)現(xiàn)了大幅調(diào)優(yōu)、優(yōu)化和擴(kuò)展,但我們想指出兩項(xiàng)挑戰(zhàn),以便向行業(yè)及研究社區(qū)征求更多意見(jiàn)。

大規(guī)模數(shù)據(jù)管理

得益于 GPU 架構(gòu)在加快計(jì)算方面取得的進(jìn)展,我們現(xiàn)已能在單個(gè)硅處理器上暢享高于 100 萬(wàn)億次浮點(diǎn)運(yùn)算級(jí)的性能。隨著 GPU 速度越來(lái)越快,向其輸送數(shù)據(jù)的能力會(huì)逐漸限制性能。本次項(xiàng)目中,我們對(duì) 20 太字節(jié)的數(shù)據(jù)集展開(kāi)分析,這實(shí)際上需要整個(gè) Summit 系統(tǒng)保持每秒大約 4 太字節(jié)的 I/O 速率。Summit 上的 GPFS 文件系統(tǒng)根本無(wú)法勝任該項(xiàng)任務(wù),在 NERSC Cori 系統(tǒng)的 Lustre 文件系統(tǒng)上執(zhí)行的類(lèi)似實(shí)驗(yàn)也以徹底失敗而告終。對(duì)于這兩種情況,在節(jié)點(diǎn)本地 NVMe上暫存數(shù)據(jù)和突發(fā)緩沖區(qū)技術(shù)便顯得至關(guān)重要。

傳統(tǒng)的 HPC 文件系統(tǒng)主要用于支持以寫(xiě)入為主的工作負(fù)載;而深度學(xué)習(xí)工作負(fù)載則屬于讀取密集型負(fù)載,對(duì)數(shù)據(jù)帶寬和元數(shù)據(jù)操作速率要求頗高。如要支持大規(guī)模深度學(xué)習(xí)工作負(fù)載,我們可能必須先對(duì)緩存分層、分片和混編操作提供透明支持。

大規(guī)模收斂

提供深度學(xué)習(xí)解決方案的時(shí)間由兩部分構(gòu)成:計(jì)算擴(kuò)展效率和統(tǒng)計(jì)擴(kuò)展效率。我們的研究已經(jīng)展示出卓越的計(jì)算擴(kuò)展性能,并且提供了許多有關(guān)系統(tǒng)級(jí)注意事項(xiàng)的建議。一個(gè)未解決的問(wèn)題是,如何使用 SGD(隨機(jī)梯度下降)的其中一個(gè)收斂屬性取代大批量(在本項(xiàng)目中,批量大小高于 27000)。

在 HPC 資源上提供高度并行性具有正反兩方面作用。如要以超高并發(fā)級(jí)別在大規(guī)模資源上運(yùn)行,我們需在短時(shí)間內(nèi)對(duì)超參數(shù)進(jìn)行調(diào)優(yōu)。有關(guān)收斂算法行為的啟發(fā)式方法可能會(huì)或不會(huì)繼承自較小規(guī)模的運(yùn)行。盡管目前對(duì)于選擇各類(lèi)超參數(shù)所產(chǎn)生效果的實(shí)證評(píng)估都很合理,但我們預(yù)計(jì),科學(xué)界將需要更好的指導(dǎo)原則,以及用于解決新問(wèn)題的收斂保證。

我們相信,在解決收斂問(wèn)題的過(guò)程中,進(jìn)一步開(kāi)發(fā) LARS 與 LARC 等新算法和潛在的高階優(yōu)化方法將是至關(guān)重要的一環(huán)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5090

    瀏覽量

    134387
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49706

    瀏覽量

    261166
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5589

    瀏覽量

    123880

原文標(biāo)題:攀登百億億級(jí)深度學(xué)習(xí)之巔

文章出處:【微信號(hào):tensorflowers,微信公眾號(hào):Tensorflowers】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為數(shù)字技術(shù)推動(dòng)交通高質(zhì)量發(fā)展

    當(dāng)前,人工智能(AI)浪潮席卷全球,成為新一輪科技革命和產(chǎn)業(yè)變革的重要驅(qū)動(dòng)力量,將對(duì)全球經(jīng)濟(jì)社會(huì)發(fā)展和人類(lèi)文明進(jìn)步產(chǎn)生深遠(yuǎn)影響。傳統(tǒng)的生產(chǎn)、生活與學(xué)習(xí)方式,將被深刻重構(gòu)。千行萬(wàn)業(yè)的數(shù)智
    的頭像 發(fā)表于 10-30 11:15 ?474次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+第二章 實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法與架構(gòu)

    、Transformer 模型的后繼者 二、用創(chuàng)新方法實(shí)現(xiàn)深度學(xué)習(xí)AI芯片 1、基于開(kāi)源RISC-V的AI加速器 RISC-V是一種開(kāi)源、模塊化的指令集架構(gòu)(ISA)。優(yōu)勢(shì)如下: ①模
    發(fā)表于 09-12 17:30

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+內(nèi)容總覽

    ,其中第一章是概論,主要介紹大模型浪潮下AI芯片的需求與挑戰(zhàn)。第二章和第三章分別介紹實(shí)現(xiàn)深度學(xué)習(xí)AI芯片的創(chuàng)新方法和架構(gòu)。以及一些新型的算法和思路。第四章是全面介紹半導(dǎo)體芯產(chǎn)業(yè)的前沿技
    發(fā)表于 09-05 15:10

    AI 芯片浪潮下,職場(chǎng)晉升新契機(jī)?

    中能充分展現(xiàn)個(gè)人對(duì)行業(yè)的貢獻(xiàn)。 持續(xù)學(xué)習(xí)助力 AI 芯片與職稱(chēng)雙贏(yíng) AI 芯片領(lǐng)域知識(shí)更新迅速,持續(xù)學(xué)習(xí)是保持競(jìng)爭(zhēng)力的關(guān)鍵,這一點(diǎn)在職稱(chēng)評(píng)審
    發(fā)表于 08-19 08:58

    自動(dòng)駕駛中Transformer大模型會(huì)取代深度學(xué)習(xí)嗎?

    [首發(fā)于智駕最前沿微信公眾號(hào)]近年來(lái),隨著ChatGPT、Claude、文心一言等大語(yǔ)言模型在生成文本、對(duì)話(huà)交互等領(lǐng)域的驚艷表現(xiàn),“Transformer架構(gòu)是否正在取代傳統(tǒng)深度學(xué)習(xí)”這一話(huà)題一直被
    的頭像 發(fā)表于 08-13 09:15 ?3892次閱讀
    自動(dòng)駕駛中Transformer大模型<b class='flag-5'>會(huì)</b>取代<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>嗎?

    任正非說(shuō) AI已經(jīng)確定是第四次工業(yè)革命 那么如何從容地加入進(jìn)來(lái)呢?

    ,TensorFlow、PyTorch用于構(gòu)建和訓(xùn)練神經(jīng)網(wǎng)絡(luò)。以Python為例,通過(guò)編寫(xiě)簡(jiǎn)單的程序來(lái)處理數(shù)據(jù),如讀取數(shù)據(jù)集、進(jìn)行數(shù)據(jù)清洗和預(yù)處理,這是進(jìn)入AI領(lǐng)域的基本技能。 學(xué)習(xí)機(jī)器學(xué)習(xí)
    發(fā)表于 07-08 17:44

    部分外資廠(chǎng)商IGBT模塊失效報(bào)告作假對(duì)中國(guó)功率模塊市場(chǎng)的深遠(yuǎn)影響

    部分IGBT模塊廠(chǎng)商失效報(bào)告作假的根本原因及其對(duì)中國(guó)功率模塊市場(chǎng)的深遠(yuǎn)影響,可以從技術(shù)、商業(yè)、行業(yè)競(jìng)爭(zhēng)等多維度分析,并結(jié)合中國(guó)功率模塊市場(chǎng)的動(dòng)態(tài)變化進(jìn)行綜合評(píng)估: 一、失效報(bào)告作假的根本原因 技術(shù)
    的頭像 發(fā)表于 05-23 08:37 ?701次閱讀
    部分外資廠(chǎng)商IGBT模塊失效報(bào)告作假對(duì)中國(guó)功率模塊市場(chǎng)的<b class='flag-5'>深遠(yuǎn)影響</b>

    【「零基礎(chǔ)開(kāi)發(fā)AI Agent」閱讀體驗(yàn)】+ 入門(mén)篇學(xué)習(xí)

    工程、RAG技術(shù)、和AI Agent是3個(gè)重要方面。其中AI Agent作為2024年最新興的技術(shù)領(lǐng)域,具備很好的應(yīng)用前景,本書(shū)對(duì)零基礎(chǔ)小白普及和應(yīng)用AI Agent有著很好的指導(dǎo)作用
    發(fā)表于 05-02 09:26

    嵌入式AI技術(shù)深度學(xué)習(xí):數(shù)據(jù)樣本預(yù)處理過(guò)程中使用合適的特征變換對(duì)深度學(xué)習(xí)的意義

    ? 作者:蘇勇Andrew 使用神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)機(jī)器學(xué)習(xí),網(wǎng)絡(luò)的每個(gè)層都將對(duì)輸入的數(shù)據(jù)做一次抽象,多層神經(jīng)網(wǎng)絡(luò)構(gòu)成深度學(xué)習(xí)的框架,可以深度理解數(shù)據(jù)中所要表示的規(guī)律。從原理上看,使用
    的頭像 發(fā)表于 04-02 18:21 ?1264次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開(kāi)發(fā)視頻應(yīng)用

    再次感謝發(fā)燒友提供的閱讀體驗(yàn)活動(dòng)。本期跟隨《AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》這本書(shū)學(xué)習(xí)如何構(gòu)建開(kāi)發(fā)一個(gè)視頻應(yīng)用。AI Agent是一種智能應(yīng)用,能夠根據(jù)用戶(hù)需求和環(huán)境變化做出相應(yīng)響應(yīng)。通常基于
    發(fā)表于 03-05 19:52

    AI芯片:科技變革的核心驅(qū)動(dòng)力

    近年來(lái),人工智能(AI)的飛速發(fā)展對(duì)眾多行業(yè)產(chǎn)生深遠(yuǎn)影響,芯片領(lǐng)域也不例外。AI在芯片設(shè)計(jì)、制造及應(yīng)用等方面帶來(lái)了革新性的改變,成為推動(dòng)芯
    的頭像 發(fā)表于 02-18 17:45 ?1377次閱讀

    軍事應(yīng)用中深度學(xué)習(xí)的挑戰(zhàn)與機(jī)遇

    人工智能尤其是深度學(xué)習(xí)技術(shù)的最新進(jìn)展,加速了不同應(yīng)用領(lǐng)域的創(chuàng)新與發(fā)展。深度學(xué)習(xí)技術(shù)的發(fā)展深刻影響了軍事發(fā)展趨勢(shì),導(dǎo)致戰(zhàn)爭(zhēng)形式和模式發(fā)生重大變
    的頭像 發(fā)表于 02-14 11:15 ?810次閱讀

    Gartner預(yù)測(cè):AI將重塑銷(xiāo)售行業(yè)格局

    市場(chǎng)調(diào)查機(jī)構(gòu)Gartner近日發(fā)布了一項(xiàng)重要預(yù)測(cè),指出AI(人工智能)的普及將對(duì)銷(xiāo)售行業(yè)產(chǎn)生深遠(yuǎn)影響。隨著AI技術(shù)的不斷發(fā)展,銷(xiāo)售人員的技能需求、客戶(hù)需求以及銷(xiāo)售策略都將發(fā)生顯著變化
    的頭像 發(fā)表于 02-14 11:10 ?994次閱讀

    AI自動(dòng)化生產(chǎn):深度學(xué)習(xí)在質(zhì)量控制中的應(yīng)用

    隨著科技的飛速發(fā)展,人工智能(AI)與深度學(xué)習(xí)技術(shù)正逐步滲透到各個(gè)行業(yè),特別是在自動(dòng)化生產(chǎn)中,其潛力與價(jià)值愈發(fā)凸顯。深度學(xué)習(xí)軟件不僅使人工和
    的頭像 發(fā)表于 01-17 16:35 ?1198次閱讀
    <b class='flag-5'>AI</b>自動(dòng)化生產(chǎn):<b class='flag-5'>深度</b><b class='flag-5'>學(xué)習(xí)</b>在質(zhì)量控制中的應(yīng)用

    深度參與信創(chuàng)生態(tài)建設(shè),九科信息聯(lián)袂統(tǒng)信發(fā)布AI數(shù)字員工

    12月10日,備受科技界矚目的2024中國(guó)操作系統(tǒng)大會(huì)在北京盛大啟幕。本次大會(huì)由統(tǒng)信牽頭,重點(diǎn)探討科技產(chǎn)業(yè)的新變化,特別是生成式AI等新技術(shù)對(duì)操作系統(tǒng)及基礎(chǔ)軟件領(lǐng)域深遠(yuǎn)影響。現(xiàn)場(chǎng)匯聚了眾多信創(chuàng)生
    的頭像 發(fā)表于 12-25 09:56 ?783次閱讀
    <b class='flag-5'>深度</b>參與信創(chuàng)生態(tài)建設(shè),九科信息聯(lián)袂統(tǒng)信發(fā)布<b class='flag-5'>AI</b>數(shù)字員工