chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

微軟和谷歌分別開源分布式深度學(xué)習(xí)框架對比

工程師鄧生 ? 來源:大數(shù)據(jù)文摘微信公眾號 ? 作者:Miggy ? 2020-11-01 10:49 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

微軟和谷歌一直在積極研究用于訓(xùn)練深度神經(jīng)網(wǎng)絡(luò)的新框架,并且在最近將各自的成果開源——微軟的 PipeDream 和谷歌的 GPipe。

原則上看,他們都遵循了類似的原則來訓(xùn)練深度學(xué)習(xí)模型。這兩個(gè)項(xiàng)目已在各自的研究論文(PipeDream,GPipe)中進(jìn)行了詳細(xì)介紹,這篇文章將對此進(jìn)行總結(jié)。

先放上 GitHub 開源地址:

微軟:

https://github.com/msr-fiddle/pipedream

谷歌:

https://github.com/tensorflow/lingvo/blob/master/lingvo/core/gpipe.py

眾所周知,在實(shí)驗(yàn)過程中,雖然訓(xùn)練基本模型比較瑣碎,但復(fù)雜度卻隨模型的質(zhì)量和大小線性增加。例如,2014 年 ImageNet 視覺識別挑戰(zhàn)賽的冠軍是 GoogleNet,它通過 400 萬個(gè)參數(shù)獲得了 74.8% 的 top1 準(zhǔn)確性,而僅僅三年之后,2017 年 ImageNet 挑戰(zhàn)賽的冠軍就使用 1.458 億個(gè)參數(shù)(多了 36 倍)的最新神經(jīng)網(wǎng)絡(luò)實(shí)現(xiàn)了 top1 準(zhǔn)確率——82.7%。但是,在同一時(shí)期,GPU 內(nèi)存僅增加了約 3 倍。

隨著模型縮放以達(dá)到更高的準(zhǔn)確性,對這些模型的訓(xùn)練變得越來越具有挑戰(zhàn)性。前面的樣本也顯示了,依靠 GPU 基礎(chǔ)結(jié)構(gòu)的改進(jìn)來實(shí)現(xiàn)更好的訓(xùn)練是不可持續(xù)的。我們需要分布式計(jì)算方法,這些方法可以并行化跨不同節(jié)點(diǎn)的訓(xùn)練工作量,以擴(kuò)展訓(xùn)練規(guī)模。分布式訓(xùn)練的概念聽起來很瑣碎,但實(shí)際上卻極其復(fù)雜。

谷歌的 GPipe GPipe

專注于擴(kuò)展深度學(xué)習(xí)計(jì)劃的訓(xùn)練工作量。從基礎(chǔ)架構(gòu)的角度來看,訓(xùn)練過程的復(fù)雜性是深度學(xué)習(xí)模型經(jīng)常被忽視的一個(gè)方面。訓(xùn)練數(shù)據(jù)集越來越大,越來越復(fù)雜。例如,在醫(yī)療保健領(lǐng)域,需要使用數(shù)百萬個(gè)高分辨率圖像進(jìn)行訓(xùn)練的模型并不罕見。結(jié)果,訓(xùn)練過程通常要花費(fèi)很長時(shí)間才能完成,并且內(nèi)存和 CPU 消耗非常大。

思考深度學(xué)習(xí)模型的分布式的有效方法是將其劃分為數(shù)據(jù)分布式和模型分布式。數(shù)據(jù)分布式方法采用大型機(jī)器集群,將輸入數(shù)據(jù)拆分到它們之間。模型分布式嘗試將模型移至具有特定硬件的加速器,例如 GPU 或 TPU,以加速模型訓(xùn)練。

概念上看,幾乎所有訓(xùn)練數(shù)據(jù)集都可以按照一定的邏輯進(jìn)行分布式訓(xùn)練,但是關(guān)于模型的說法卻不盡相同。例如,一些深度學(xué)習(xí)模型由可以獨(dú)立訓(xùn)練的并行分支組成。在那種情況下,經(jīng)典策略是將計(jì)算劃分為多個(gè)分區(qū),并將不同的分區(qū)分配給不同的分支。但是,這種策略在按順序堆疊各層的深度學(xué)習(xí)模型中是不足的。

GPipe 通過利用一種稱為流水線的技術(shù)將數(shù)據(jù)和模型分布式結(jié)合在一起。從概念上講,GPipe 是一個(gè)分布式機(jī)器學(xué)習(xí)庫,它使用同步隨機(jī)梯度下降和流水線分布式進(jìn)行訓(xùn)練,適用于由多個(gè)連續(xù)層組成的任何 DNN。

GPipe 在不同的加速器之間劃分模型,并自動將一小批訓(xùn)練樣本拆分為較小的微批。該模型允許 GPipe 的加速器并行運(yùn)行,從而最大限度地提高了訓(xùn)練過程的可擴(kuò)展性。

下圖說明了具有連續(xù)層的神經(jīng)網(wǎng)絡(luò)的 GPipe 模型在四個(gè)加速器之間分配。Fk 是第 k 個(gè)分區(qū)的復(fù)合正向計(jì)算函數(shù)。Bk 是相應(yīng)的反向傳播函數(shù)。Bk 取決于上層的 Bk + 1 和 Fk 的中間激活。在頂級模型中,我們可以看到網(wǎng)絡(luò)的順序性質(zhì)如何導(dǎo)致資源利用不足。下圖顯示了 GPipe 方法,其中將輸入的迷你批處理分為較小的宏批處理,這些宏批處理可由加速器同時(shí)處理。

圖片來源:

https://arxiv.org/pdf/1811.06965.pdf

微軟的 PipeDream

幾個(gè)月前,微軟研究院宣布創(chuàng)建 Project Fiddle,這是一系列旨在簡化分布式深度學(xué)習(xí)的研究項(xiàng)目。PipeDreams 是 Fiddle 項(xiàng)目首次發(fā)布的版本之一,專注于深度學(xué)習(xí)模型訓(xùn)練的并行化。

PipeDream 采用與其他方法不同的方法來利用稱為管道分布式的技術(shù)來擴(kuò)展深度學(xué)習(xí)模型的訓(xùn)練。這種方法試圖解決數(shù)據(jù)和模型并行技術(shù)的一些挑戰(zhàn),例如 GPipe 中使用的技術(shù)。

通常,在云基礎(chǔ)架構(gòu)上進(jìn)行訓(xùn)練時(shí),數(shù)據(jù)并行方法在規(guī)模上會承受較高的通信成本,并且隨著時(shí)間的推移會提高 GPU 計(jì)算速度。類似地,模型分布式技術(shù)通常在利用硬件資源上更加效率低下,程序員需要決定如何在給定硬件部署的情況下拆分其特定模型,給他們帶來了不必要的負(fù)擔(dān)。

圖片來源:

http://www.microsoft.com/zh-cn/research/uploads/prod/2019/08/fiddle_pipedream_sosp19.pdf

PipeDream 嘗試通過使用稱為管道分布式的技術(shù)來克服數(shù)據(jù)模型分布式方法的一些挑戰(zhàn)。

從概念上講,管道分布計(jì)算涉及將 DNN 模型的各層劃分為多個(gè)階段,其中每個(gè)階段均由模型中的一組連續(xù)層組成。每個(gè)階段都映射到一個(gè)單獨(dú)的 GPU,該 GPU 對該階段中的所有層執(zhí)行正向傳遞(和反向傳遞)。

給定一個(gè)特定的深度神經(jīng)網(wǎng)絡(luò),PipeDream 會基于在單個(gè) GPU 上執(zhí)行的簡短概要分析,自動確定如何對 DNN 的運(yùn)算符進(jìn)行分區(qū),在不同階段之間平衡計(jì)算負(fù)載,同時(shí)最大程度地減少與目標(biāo)平臺的通信。即使存在模型多樣性(計(jì)算和通信)和平臺多樣性(互連拓?fù)浜头謱訋挘?,PipeDream 也會有效地實(shí)現(xiàn)負(fù)載平衡。PipeDream 訓(xùn)練分布式的方法的原理比數(shù)據(jù)模型分布式方法具有多個(gè)優(yōu)點(diǎn)。

對于初學(xué)者而言,PipeDream 需要在工作程序節(jié)點(diǎn)之間進(jìn)行較少的通信,因?yàn)楣艿缊?zhí)行中的每個(gè)工作程序僅需要將漸變的子集和輸出激活信息傳達(dá)給單個(gè)其他工作程序。

圖片來源:

https://www.microsoft.com/zh-cn/research/uploads/prod/2019/08/fiddle_pipedream_sosp19.pdf

訓(xùn)練分布式是構(gòu)建更大、更準(zhǔn)確的深度學(xué)習(xí)模型的關(guān)鍵挑戰(zhàn)之一。分布式訓(xùn)練方法是深度學(xué)習(xí)社區(qū)中一個(gè)活躍的研究領(lǐng)域,需要將有效的并發(fā)編程技術(shù)與深度學(xué)習(xí)模型的本質(zhì)相結(jié)合。盡管仍處于早期階段,但 Google 的 GPipe 和 Microsoft 的 PipeDream 本身已經(jīng)是很優(yōu)秀的產(chǎn)品,它是深度學(xué)習(xí)開發(fā)人員可用的兩種最具創(chuàng)造性的分布式訓(xùn)練方法。
責(zé)任編輯:PSY

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 微軟
    +關(guān)注

    關(guān)注

    4

    文章

    6734

    瀏覽量

    107560
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6250

    瀏覽量

    110734
  • 神經(jīng)網(wǎng)絡(luò)

    關(guān)注

    42

    文章

    4831

    瀏覽量

    107261
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    SC-3568HA:解鎖鴻蒙全權(quán)限API與分布式能力的工業(yè)控制平臺

    傳統(tǒng)嵌入開發(fā)面臨硬件碎片化、高權(quán)限功能缺失、分布式協(xié)同復(fù)雜及自動化測試不足等痛點(diǎn)。SC-3568HA開發(fā)板基于鴻蒙系統(tǒng),通過統(tǒng)一內(nèi)核抽象層和硬件驅(qū)動框架解決兼容問題,開放全量系統(tǒng)API支持高權(quán)限
    的頭像 發(fā)表于 12-18 11:27 ?6907次閱讀
    SC-3568HA:解鎖鴻蒙全權(quán)限API與<b class='flag-5'>分布式</b>能力的工業(yè)控制平臺

    如何解決分布式光伏計(jì)量難題?

    分布式光伏成增長主力 據(jù)《2025-2030年中國分布式光伏行業(yè)市場前景預(yù)測及未來發(fā)展趨勢研究報(bào)告》顯示,2024年中國分布式光伏新增裝機(jī)118.18GW,同比增長23%,占光伏新增裝機(jī)總量的43
    的頭像 發(fā)表于 11-07 14:55 ?247次閱讀
    如何解決<b class='flag-5'>分布式</b>光伏計(jì)量難題?

    【節(jié)能學(xué)院】Acrel-1000DP分布式光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW 分布式光伏中應(yīng)用

    摘要:在“雙碳”和新型電力系統(tǒng)建設(shè)背景下,分布式光伏接入比例不斷提高,對配電網(wǎng)電壓、調(diào)度運(yùn)行及調(diào)峰等環(huán)節(jié)造成強(qiáng)烈沖擊。本文設(shè)計(jì)包含平臺層、設(shè)備層二層架構(gòu)體系的分布式光伏管控平臺,以及小容量工商業(yè)
    的頭像 發(fā)表于 08-23 08:04 ?3401次閱讀
    【節(jié)能學(xué)院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中應(yīng)用

    分布式光伏發(fā)電監(jiān)測系統(tǒng)技術(shù)方案

    分布式光伏發(fā)電監(jiān)測系統(tǒng)技術(shù)方案 柏峰【BF-GFQX】一、系統(tǒng)目標(biāo) :分布式光伏發(fā)電監(jiān)測系統(tǒng)旨在通過智能化的監(jiān)測手段,實(shí)現(xiàn)對分布式光伏電站的全方位、高精度、實(shí)時(shí)化管理。該系統(tǒng)能
    的頭像 發(fā)表于 08-22 10:51 ?3046次閱讀
    <b class='flag-5'>分布式</b>光伏發(fā)電監(jiān)測系統(tǒng)技術(shù)方案

    分布式光伏總出問題?安科瑞分布式光伏監(jiān)控系統(tǒng)來“救場”

    一、分布式光伏的痛點(diǎn)大揭秘 在 “雙碳” 目標(biāo)的大力推動下,分布式光伏作為綠色能源領(lǐng)域的重要力量,正以前所未有的速度蓬勃發(fā)展,越來越多的企業(yè)和家庭選擇安裝分布式光伏系統(tǒng)。然而,隨著分布式
    的頭像 發(fā)表于 07-16 16:50 ?740次閱讀
    <b class='flag-5'>分布式</b>光伏總出問題?安科瑞<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)來“救場”

    Ceph分布式存儲系統(tǒng)解析

    在當(dāng)今數(shù)據(jù)爆炸的時(shí)代,企業(yè)對存儲系統(tǒng)的需求日益增長,傳統(tǒng)的集中式存儲已經(jīng)無法滿足大規(guī)模數(shù)據(jù)處理的要求。分布式存儲系統(tǒng)應(yīng)運(yùn)而生,而Ceph作為開源分布式存儲系統(tǒng)的佼佼者,以其高可用性、高擴(kuò)展性和統(tǒng)一存儲架構(gòu)贏得了眾多企業(yè)的青睞。
    的頭像 發(fā)表于 07-14 11:15 ?872次閱讀

    雙電機(jī)分布式驅(qū)動汽車高速穩(wěn)定性機(jī)電耦合控制

    摘要:為了利用所設(shè)計(jì)的雙電機(jī)防滑差速驅(qū)動系統(tǒng)來提高分布式驅(qū)動汽車的動力學(xué)性能,在前期同軸耦合驅(qū)動控制理論研究的基礎(chǔ)上,開展該車的高速穩(wěn)定性機(jī)電耦合控制研究。建立并驗(yàn)證包含所設(shè)計(jì)驅(qū)動系統(tǒng)在內(nèi)的分布式
    發(fā)表于 06-18 16:37

    潤和軟件StackRUNS異構(gòu)分布式推理框架的應(yīng)用案例

    江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)自主研發(fā)的StackRUNS異構(gòu)分布式推理框架已在實(shí)際場景中取得顯著成效,成功應(yīng)用于大型園區(qū)多模態(tài)模型演練及高校滿血版DeepSeek-MoE 671B的運(yùn)行,有效推動了大模型技術(shù)的快速落地。
    的頭像 發(fā)表于 06-13 09:11 ?1203次閱讀
    潤和軟件StackRUNS異構(gòu)<b class='flag-5'>分布式</b>推理<b class='flag-5'>框架</b>的應(yīng)用案例

    潤和軟件發(fā)布StackRUNS異構(gòu)分布式推理框架

    當(dāng)下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應(yīng)用場景日益復(fù)雜,企業(yè)正面臨異構(gòu)算力資源碎片化帶來的嚴(yán)峻挑戰(zhàn)。為應(yīng)對行業(yè)痛點(diǎn),江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發(fā)布自主研發(fā)的StackRUNS異構(gòu)分布式推理框架,高效融合異構(gòu)算力,精細(xì)化配置算力資源,釋放算力效能。
    的頭像 發(fā)表于 06-13 09:10 ?1372次閱讀
    潤和軟件發(fā)布StackRUNS異構(gòu)<b class='flag-5'>分布式</b>推理<b class='flag-5'>框架</b>

    曙光存儲領(lǐng)跑中國分布式存儲市場

    近日,賽迪顧問發(fā)布《中國分布式存儲市場研究報(bào)告(2025)》,指出2024 年中國分布式存儲市場首次超過集中式存儲,規(guī)模達(dá) 198.2 億元,增速 43.7%。
    的頭像 發(fā)表于 05-19 16:50 ?1148次閱讀

    分布式光伏電力問題層出不窮?安科瑞分布式光伏運(yùn)維系統(tǒng)來“救場”

    一、分布式光伏電力運(yùn)維,痛點(diǎn)大揭秘? ? 分布式光伏作為實(shí)現(xiàn)綠色能源轉(zhuǎn)型的關(guān)鍵一環(huán),近年來在我國得到了迅猛發(fā)展。國家能源局?jǐn)?shù)據(jù)顯示,截至 2023 年底,中國分布式光伏電站累計(jì)并網(wǎng)容量約為 2.5
    的頭像 發(fā)表于 05-07 17:14 ?844次閱讀
    <b class='flag-5'>分布式</b>光伏電力問題層出不窮?安科瑞<b class='flag-5'>分布式</b>光伏運(yùn)維系統(tǒng)來“救場”

    使用VirtualLab Fusion中分布式計(jì)算的AR波導(dǎo)測試圖像模擬

    總計(jì)算時(shí)間超過31小時(shí)。通過使用一個(gè)由8個(gè)多核PC組成的網(wǎng)絡(luò),提供35個(gè)客戶端分布式計(jì)算,將模擬時(shí)間減少到1小時(shí)5分鐘?;灸M任務(wù)基本任務(wù)集合:FOV使用分布式計(jì)算的集合模擬概述模擬時(shí)間節(jié)省96%的計(jì)算時(shí)間?。?!
    發(fā)表于 04-10 08:48

    分布式光伏發(fā)運(yùn)維系統(tǒng)實(shí)際應(yīng)用案例分享

    安科瑞劉鴻鵬 摘?要 分布式光伏發(fā)電系統(tǒng)其核心特點(diǎn)是發(fā)電設(shè)備靠近用電負(fù)荷中心,通常安裝在屋頂、建筑立面或閑置空地上,截至2025年,分布式光伏發(fā)電系統(tǒng)在全球和中國范圍內(nèi)取得了顯著發(fā)展,成為能源轉(zhuǎn)型
    的頭像 發(fā)表于 04-09 14:46 ?1151次閱讀
    <b class='flag-5'>分布式</b>光伏發(fā)運(yùn)維系統(tǒng)實(shí)際應(yīng)用案例分享

    淺談工商企業(yè)用電管理的分布式儲能設(shè)計(jì)

    文章設(shè)計(jì)了一種新的用于工商業(yè)用電管理的分布式儲能系統(tǒng)。由于儲能系統(tǒng)硬件置換成本高,選擇在傳統(tǒng)儲能系統(tǒng)的硬件框架基礎(chǔ)上,對控制軟件進(jìn)行優(yōu)化設(shè)計(jì),建立分布式儲能系統(tǒng)模型,分析發(fā)電量、儲電量及損失電量三者之間的關(guān)系,并分析其優(yōu)化需求。
    的頭像 發(fā)表于 03-24 15:43 ?3349次閱讀
    淺談工商企業(yè)用電管理的<b class='flag-5'>分布式</b>儲能設(shè)計(jì)

    分布式光伏如何實(shí)現(xiàn)防逆流?

    分布式光伏如何實(shí)現(xiàn)防逆流
    的頭像 發(fā)表于 03-24 13:31 ?709次閱讀
    <b class='flag-5'>分布式</b>光伏如何實(shí)現(xiàn)防逆流?