chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

混合精度訓練的優(yōu)勢!將自動混合精度用于主流深度學習框架

NVIDIA英偉達企業(yè)解決方案 ? 來源:lp ? 2019-04-03 11:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統(tǒng)上,深度神經(jīng)網(wǎng)絡訓練采用的是IEEE單精度格式,但借助混合精度,可采用半精度進行訓練,同時保持單精度的網(wǎng)絡精度。這種同時采用單精度和半精度表示的技術被稱為混合精度技術。

混合精度訓練的優(yōu)勢

通過使用Tensor核心,可加速數(shù)學密集型運算,如線性和卷積層。

與單精度相比,通過訪問一半的字節(jié)來加速內(nèi)存受限的運算。

降低訓練模型的內(nèi)存要求,支持更大規(guī)模的模型或更大規(guī)模的批量訓練。

啟用混合精度包括兩個步驟:移植模型,以適時使用半精度數(shù)據(jù)類型;以及使用損耗定標,以保留小梯度值。

僅通過添加幾行代碼,TensorFlow、PyTorch和MXNet中的自動混合精確功能就能助力深度學習研究人員和工程師基于NVIDIA Volta和Turing GPU實現(xiàn)高達3倍的AI訓練加速。

將自動混合精度用于主流深度學習框架

TensorFlow

NVIDIA NGC容器注冊表中TensorFlow容器可提供自動混合精度功能。要在容器內(nèi)啟用此功能,只需設置一個環(huán)境變量:

export TF_ENABLE_AUTO_MIXED_PRECISION=1

或者,您也可以在TensorFlow Python腳本中設置環(huán)境變量:

os.environ['TF_ENABLE_AUTO_MIXED_PRECISION'] = '1'

自動混合精度使用單一環(huán)境變量,在TensorFlow內(nèi)部應用這兩個步驟,并在必要時進行更細粒度的控制。

PyTorch

GitHub的Apex存儲庫中提供了自動混合精度功能。可將以下兩行代碼添加至當前訓練腳本中以啟用該功能:

model, optimizer = amp.initialize(model, optimizer)

with amp.scale_loss(loss, optimizer) as scaled_loss:scaled_loss.backward()

MXNet

我們正在構建適用于MXNet的自動混合精度功能。您可通過GitHub了解我們的工作進展??蓪⒁韵麓a行添加至當前訓練腳本中以啟用該功能:

amp.init()amp.init_trainer(trainer)with amp.scale_loss(loss, trainer) as scaled_loss:autograd.backward(scaled_loss)

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4819

    瀏覽量

    106071
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5036

    瀏覽量

    133748
  • 深度學習
    +關注

    關注

    73

    文章

    5586

    瀏覽量

    123646

原文標題:Tensor核心系列課 | 探究適用于深度學習的自動混合精度

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達企業(yè)解決方案】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國際巨頭重金投入,國產(chǎn)深度學習框架OneFlow有何優(yōu)勢?

    的ResNet50-v1.5和BERT-base兩個模型中,無論是Float32類型還是自動混合精度,在同樣的算法和硬件條件下,吞吐率及加速比均優(yōu)于其他深度
    的頭像 發(fā)表于 12-17 09:31 ?4866次閱讀

    混合系統(tǒng)的優(yōu)勢所在

    優(yōu)勢,因此混合系統(tǒng)能夠大大提升測試系統(tǒng)的靈活性。當您的系統(tǒng)中只有一種總線或平臺的時候,您能選擇的儀器就會受到這種總線的限制,這可能會妨礙您使用其他更適合您系統(tǒng)需求的儀器。您一定希望根據(jù)性能,精度以及
    發(fā)表于 02-25 23:36

    Nanopi深度學習之路(1)深度學習框架分析

    就能實現(xiàn)!還請關注我后面的日記。實際上我也是剛剛有時間學習深度學習,我是個純初學者,但面對深度學習里的各種復雜理論和公式推導,自己實現(xiàn)個小功
    發(fā)表于 06-04 22:32

    主流深度學習框架比較

    DL:主流深度學習框架多個方向PK比較
    發(fā)表于 12-26 11:10

    什么是深度學習?使用FPGA進行深度學習的好處?

    延遲,這對深度學習推理也很有效。上述圖像識別的深度學習有望應用于自動駕駛等對
    發(fā)表于 02-17 16:56

    PyTorch 1.6即將原生支持自動混合精度訓練

    即將在 PyTorch 1.6上發(fā)布的 torch.cuda.amp 混合精度訓練模塊實現(xiàn)了它的承諾,只需增加幾行新代碼就可以提高大型模型訓練50-60% 的速度。
    的頭像 發(fā)表于 07-14 16:06 ?3522次閱讀
    PyTorch 1.6即將原生支持<b class='flag-5'>自動</b><b class='flag-5'>混合</b><b class='flag-5'>精度</b><b class='flag-5'>訓練</b>

    淺談字節(jié)跳動開源8比特混合精度Transformer引擎

    如何繼續(xù)提升速度?降低計算精度是比較直接的方法。2017 年以來,fp16 混合精度技術 [2] 獲得了廣泛應用。在對模型效果無損的前提下,將模型訓練和推理的速度提升了 50% 以上。
    發(fā)表于 11-01 10:19 ?917次閱讀

    深度學習框架是什么?深度學習框架有哪些?

    深度學習框架是什么?深度學習框架有哪些?? 深度
    的頭像 發(fā)表于 08-17 16:03 ?3725次閱讀

    深度學習框架區(qū)分訓練還是推理嗎

    深度學習框架區(qū)分訓練還是推理嗎 深度學習框架是一個非
    的頭像 發(fā)表于 08-17 16:03 ?1982次閱讀

    深度學習框架的作用是什么

    深度學習框架的作用是什么 深度學習是一種計算機技術,它利用人工神經(jīng)網(wǎng)絡來模擬人類的學習過程。由于
    的頭像 發(fā)表于 08-17 16:10 ?2177次閱讀

    深度學習框架tensorflow介紹

    深度學習框架tensorflow介紹 深度學習框架TensorFlow簡介
    的頭像 發(fā)表于 08-17 16:11 ?3224次閱讀

    深度學習算法庫框架學習

    深度學習算法庫框架的相關知識點以及它們之間的比較。 1. Tensorflow Tensorflow是Google家的深度學習
    的頭像 發(fā)表于 08-17 16:11 ?1223次閱讀

    深度學習框架連接技術

    深度學習框架連接技術 深度學習框架是一個能夠幫助機器學習
    的頭像 發(fā)表于 08-17 16:11 ?1212次閱讀

    深度學習框架深度學習算法教程

    基于神經(jīng)網(wǎng)絡的機器學習方法。 深度學習算法可以分為兩大類:監(jiān)督學習和無監(jiān)督學習。監(jiān)督學習的基本任
    的頭像 發(fā)表于 08-17 16:11 ?1665次閱讀

    視覺深度學習遷移學習訓練框架Torchvision介紹

    Torchvision是基于Pytorch的視覺深度學習遷移學習訓練框架,當前支持的圖像分類、對象檢測、實例分割、語義分割、姿態(tài)評估模型的遷
    的頭像 發(fā)表于 09-22 09:49 ?1659次閱讀
    視覺<b class='flag-5'>深度</b><b class='flag-5'>學習</b>遷移<b class='flag-5'>學習</b><b class='flag-5'>訓練</b><b class='flag-5'>框架</b>Torchvision介紹