chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Microsoft開源了零冗余優(yōu)化器版本2(ZeRO-2)

倩倩 ? 來源:文財(cái)網(wǎng) ? 2020-07-22 15:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Microsoft開源了零冗余優(yōu)化器版本2(ZeRO-2),這是一種分布式深度學(xué)習(xí)優(yōu)化算法,可根據(jù)集群大小進(jìn)行超線性擴(kuò)展。與以前的分布式學(xué)習(xí)技術(shù)相比,Microsoft使用ZeRO-2培訓(xùn)了10倍的1000億參數(shù)自然語言處理(NLP)模型。

程序經(jīng)理Rangan Majumder和杰出的工程師Wang Junhua在博客中寫道,描述了該算法及其實(shí)驗(yàn)。ZeRO-2是Microsoft開源DeepSpeed庫的一部分,用于深度學(xué)習(xí)培訓(xùn)優(yōu)化。ZeRO-2優(yōu)化了訓(xùn)練過程中的內(nèi)存消耗,允許對多達(dá)1,700億個(gè)參數(shù)的模型進(jìn)行分布式訓(xùn)練。該算法還減少了分布式集群中工作節(jié)點(diǎn)之間的通信,實(shí)現(xiàn)了超線性并行加速,從而將培訓(xùn)時(shí)間減少了多達(dá)10倍。DeepSpeed團(tuán)隊(duì)在1,024個(gè)GPU的集群上使用ZeRO-2,達(dá)到了創(chuàng)紀(jì)錄的44分鐘的時(shí)間來訓(xùn)練BERT自然語言模型,比NVIDIA的結(jié)果提高了30%以上。

NLP研究的最新趨勢表明,通過在較大數(shù)據(jù)集上訓(xùn)練的較大模型,可以提高準(zhǔn)確性。OpenAI提出了一套“縮放定律”,表明模型精度與模型大小具有冪律關(guān)系,并且最近通過創(chuàng)建具有1750億個(gè)參數(shù)的GPT-3模型對該想法進(jìn)行了測試。由于這些模型太大而無法容納單個(gè)GPU的內(nèi)存,因此對其進(jìn)行訓(xùn)練需要一堆機(jī)器和模型并行訓(xùn)練技術(shù),以在整個(gè)集群中分配參數(shù)。有幾種實(shí)現(xiàn)有效的模型并行性的開源框架,包括GPipe和NVIDIA的Megatron,但是由于集群節(jié)點(diǎn)之間的通信開銷,它們具有次線性加速,并且使用框架通常需要模型重構(gòu)。

ZeRO-2使用以下三種策略來減少訓(xùn)練所需的內(nèi)存:減少模型狀態(tài)內(nèi)存需求,將層激活卸載到CPU以及減少內(nèi)存碎片。ZeRO-2可以通過在并行進(jìn)程之間劃分梯度和參數(shù),將模型狀態(tài)內(nèi)存需求減少多達(dá)8倍。層激活值是從前向訓(xùn)練過程中保存的,以便稍后在后向過程中使用,但是ZeRO-2將它們暫時(shí)從GPU的內(nèi)存移動(dòng)到主機(jī)CPU的內(nèi)存。最后,即使可用內(nèi)存不連續(xù),即使內(nèi)存可用,內(nèi)存分配也可能失敗。ZeRO-2通過為連續(xù)用途(例如激活和漸變)預(yù)先分配連續(xù)的內(nèi)存塊來減少碎片。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5589

    瀏覽量

    123880
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    629

    瀏覽量

    14557
  • nlp
    nlp
    +關(guān)注

    關(guān)注

    1

    文章

    491

    瀏覽量

    23182
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    理解傳感偏Sensor Bias (offset)

    zero-goffset對于加速度計(jì))和速率偏移(zero-rateoffset對于陀螺儀)。圖1-MTManager中慣性數(shù)據(jù)的屏幕截圖(所有3個(gè)軸的角速度)圖2-Z
    的頭像 發(fā)表于 11-17 12:02 ?185次閱讀
    理解傳感<b class='flag-5'>器</b><b class='flag-5'>零</b>偏Sensor Bias (offset)

    開源鴻蒙6.0 Release版本重磅發(fā)布

    近日,在長沙國際會議中心舉辦的開源鴻蒙技術(shù)大會2025上,開放原子開源鴻蒙(即OpenAtom OpenHarmony,簡稱“開源鴻蒙”)項(xiàng)目群正式發(fā)布開源鴻蒙6.0 Release
    的頭像 發(fā)表于 10-10 16:49 ?2143次閱讀

    開源Made with KiCad(134):Icepi Zero - 基于Lattice ECP5的便攜FPGA開發(fā)板

    =02070198-e0ce-4a9c-9d3b-bf71cef6644d PCB License Solderpad Hardware License v2.1 倉庫 & 下載 可以在Github中獲取開源倉庫: https://github.com/cheyao/icepi-
    的頭像 發(fā)表于 07-14 11:21 ?3243次閱讀
    <b class='flag-5'>開源</b>Made with KiCad(134):Icepi <b class='flag-5'>Zero</b> - 基于Lattice ECP5的便攜FPGA開發(fā)板

    開源——基于STM32F407VET6知增強(qiáng)板的四路獨(dú)立計(jì)時(shí)

    : 1.4 連接實(shí)物圖 二、軟件環(huán)境配置1.開源開發(fā)工具(Lingzhi IDE) 2.安裝必要的庫:Adafruit_GFX Adafruit_ST77893.配置開發(fā)板類型
    發(fā)表于 07-01 10:31

    樹莓派 Zero 2 W 是開啟智能家居生活的理想之選!

    想嘗試智能家居自動(dòng)化,又不想花費(fèi)太多?樹莓派Zero2W或許正是你開啟智能家居之旅所需的理想設(shè)備。小板子大潛力想打造一個(gè)智能家居?這想法超棒!一旦掌握技巧,自動(dòng)化控制燈光、插座、傳感等設(shè)備,既有
    的頭像 發(fā)表于 06-24 16:24 ?534次閱讀
    樹莓派 <b class='flag-5'>Zero</b> <b class='flag-5'>2</b> W 是開啟智能家居生活的理想之選!

    開源——STM32F103RBT6驅(qū)動(dòng) ICM20948 九軸傳感及 vofa + 上位機(jī)可視化教程

    STM32F1本教程使用知標(biāo)準(zhǔn)板(STM32F103RBT6)通過I2C驅(qū)動(dòng)ICM20948九軸傳感,實(shí)現(xiàn)姿態(tài)解算,并通過串口將數(shù)據(jù)實(shí)時(shí)發(fā)送至VOFA+上位機(jī)進(jìn)行3D可視化。代碼基于開源
    發(fā)表于 06-09 14:53

    開源分享】:開源小巧的FPGA開發(fā)板——Icepi Zero

    。程序員可以使用它在多種架構(gòu)上測試他們的代碼。 Icepi Zero 還有一個(gè)板載 USB 到 JTAG 轉(zhuǎn)換,因此不需要外部編程。此外,Icepi Zero 是完全
    發(fā)表于 06-09 14:01

    知經(jīng)驗(yàn)——STM32F4驅(qū)動(dòng)ICM20948 九軸運(yùn)動(dòng)傳感 + VOFA上位機(jī)可視化驗(yàn)證與抗漂移優(yōu)化

    ;3cm距離 三、深度優(yōu)化方案:全鏈路抗漂策略3.1 傳感配置優(yōu)化(ICM20948.cpp) 在initICM20948函數(shù)中優(yōu)化配置
    發(fā)表于 06-06 10:03

    用 樹莓派 Zero 打造的智能漫游車!

    使用PXFMini和樹莓派Zero打造您自己的自主漫游車。本項(xiàng)目所用組件硬件組件ErleRoboticsPXFmini×1樹莓派Zero×1樹莓派2ModelB×1樹莓派3ModelB×1軟件應(yīng)用與在線服務(wù)APM飛行
    的頭像 發(fā)表于 05-13 16:39 ?853次閱讀
    用 樹莓派 <b class='flag-5'>Zero</b> 打造的智能漫游車!

    Banana Pi 與瑞薩電子攜手共同推動(dòng)開源創(chuàng)新:BPI-AI2N

    :瑞薩RZ/V2N高性能處理與Banana PI開源硬件平臺的深度融合。 開源優(yōu)勢 :提供部分硬件設(shè)計(jì)資料、SDK及開發(fā)文檔。 生態(tài)共建 :聯(lián)合開發(fā)者社區(qū)推出定制化開發(fā)套件,支持A
    發(fā)表于 03-12 09:43

    構(gòu)建開源OpenVINO?工具套件后,模型優(yōu)化位于何處呢?

    構(gòu)建開源OpenVINO?工具套件后,模型優(yōu)化位于何處?
    發(fā)表于 03-06 08:18

    Made with KiCad(117):ShaRPiKeebo 樹莓派 Zero 2W 擴(kuò)展板

    “?一個(gè)小型的 Linux 計(jì)算機(jī),集成了鍵盤、日光下可讀的屏幕和長距離收發(fā)。核心板是 Raspberry Pi Zero W 或 2W。?” Made with KiCad 系列將支持新的展示
    的頭像 發(fā)表于 03-04 11:12 ?1187次閱讀
    Made with KiCad(117):ShaRPiKeebo 樹莓派 <b class='flag-5'>Zero</b> <b class='flag-5'>2</b>W 擴(kuò)展板

    hyper 2012 r2,Hyper 2012 R2:經(jīng)典版本功能與使用

    :經(jīng)典版本功能與使用。 ? ?Hyper-V2012R2是微軟推出的一款經(jīng)典虛擬化平臺,廣泛應(yīng)用于服務(wù)虛擬化和資源整合。作為WindowsServer2012R2的一部分,Hyper
    的頭像 發(fā)表于 02-08 10:11 ?965次閱讀
    hyper 2012 r<b class='flag-5'>2</b>,Hyper 2012 R<b class='flag-5'>2</b>:經(jīng)典<b class='flag-5'>版本</b>功能與使用

    開源鴻蒙5.0 Release版本關(guān)鍵特性解讀

    概述 開源鴻蒙 5.0 Release版本開源鴻蒙操作系統(tǒng)的一個(gè)里程碑,在系統(tǒng)能力、性能優(yōu)化等多個(gè)方面進(jìn)一步增強(qiáng)。本文將從系統(tǒng)功能、性能優(yōu)化
    的頭像 發(fā)表于 12-23 13:58 ?4276次閱讀

    ?Banana Pi BPi-M4 Zero 開源硬件開發(fā)板評測試: 全志科技H618 方案設(shè)計(jì)

    Banana Pi 推出了全志 H618 開發(fā)系統(tǒng)的第二個(gè)版本,標(biāo)記為 V2.0,名稱為 BPi-M4 Zero,采用 Raspberry Pi Zero 格式。不久前,我們寫過BPi-M4
    的頭像 發(fā)表于 12-03 17:58 ?3159次閱讀
    ?Banana Pi BPi-M4 <b class='flag-5'>Zero</b> <b class='flag-5'>開源</b>硬件開發(fā)板評測試: 全志科技H618 方案設(shè)計(jì)