chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

和谷歌研究人員一起探索數(shù)據(jù)并行的邊界極限

nlfO_thejiangme ? 來源:YXQ ? 2019-03-22 08:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在過去的幾年里,神經(jīng)網(wǎng)絡(luò)在圖像分類、機(jī)器翻譯和語音識別等領(lǐng)域獲得了長足的進(jìn)步,取得了十分優(yōu)異的結(jié)果。這樣的成績離不開軟件和硬件的對訓(xùn)練過程的加速和改進(jìn)。更快速的訓(xùn)練使得模型質(zhì)量飛速提升,不僅在相同的時(shí)間內(nèi)可以處理更多的數(shù)據(jù),也使得研究人員得以迅速嘗試更多的想法,研究出更好的模型。

隨著軟硬件和數(shù)據(jù)中心云計(jì)算的迅速發(fā)展,支撐神經(jīng)網(wǎng)絡(luò)的算力大幅提升,讓模型訓(xùn)練地又好又快。但該如何利用這前所未有的算力來得到更好的結(jié)果是擺在所有研究人員面前的一個(gè)問題,我們是否應(yīng)該用更大的算力來實(shí)現(xiàn)更快的訓(xùn)練呢?

并行計(jì)算

分布式計(jì)算是使用大規(guī)模算力最常用的方法,可以同時(shí)使用不同平臺和不同架構(gòu)的處理器。在訓(xùn)練神經(jīng)網(wǎng)絡(luò)的時(shí)候,一般會使用模型并行和數(shù)據(jù)并行兩種方式。其中模型并行會將模型分別置于不同的計(jì)算單元上,使得大規(guī)模的模型訓(xùn)練成為可能,但通常需要對網(wǎng)絡(luò)架構(gòu)進(jìn)行裁剪以適應(yīng)不同的處理器。而數(shù)據(jù)并行著是將訓(xùn)練樣本分散在多個(gè)計(jì)算單元上,并將訓(xùn)練結(jié)果進(jìn)行同步。

數(shù)據(jù)并行幾乎可以用于任何模型的訓(xùn)練加速,它是目前使用最為廣泛也最為簡單的神經(jīng)網(wǎng)絡(luò)并行訓(xùn)練手段。對于想SGD等常見的訓(xùn)練優(yōu)化算法來說,數(shù)據(jù)并行的規(guī)模與訓(xùn)練樣本的批量大小息息相關(guān)。我們需要探索對于數(shù)據(jù)并行方法的局限性,以及如何充分利用數(shù)據(jù)并行方法來加速訓(xùn)練。

實(shí)驗(yàn)中使用的模型、數(shù)據(jù)集和優(yōu)化器。

谷歌的研究人員在先前的研究中評測了數(shù)據(jù)并行對于神經(jīng)網(wǎng)絡(luò)訓(xùn)練的影響,深入探索了批次(batch)的大小與訓(xùn)練時(shí)間的關(guān)系,并在六種不同的神經(jīng)網(wǎng)絡(luò)/數(shù)據(jù)集上利用三種不同的優(yōu)化方法進(jìn)行了測試。在實(shí)驗(yàn)中研究人員在約450個(gè)負(fù)載上訓(xùn)練了超過100k個(gè)模型并發(fā)現(xiàn)了訓(xùn)練時(shí)間與批量大小的關(guān)系。

研究人員分別從數(shù)據(jù)集、網(wǎng)絡(luò)架構(gòu)、優(yōu)化器等角度探索了這一關(guān)系的變化,發(fā)現(xiàn)在不同的負(fù)載上訓(xùn)練時(shí)間和批量大小的關(guān)系發(fā)生了劇烈的變化。研究結(jié)果中包含了71M個(gè)模型的測評結(jié)果,完整的描繪了100k個(gè)模型的訓(xùn)練曲線,并在論文中的24個(gè)圖中充分體現(xiàn)了出來。

訓(xùn)練時(shí)間與批量大小間的普遍聯(lián)系

在理想的數(shù)據(jù)并行系統(tǒng)中,模型間的同步時(shí)間可忽略不計(jì),訓(xùn)練時(shí)間可以使用訓(xùn)練的步數(shù)(steps)來測定。在這一假設(shè)下,研究人員從實(shí)驗(yàn)的結(jié)果中發(fā)現(xiàn)了三個(gè)區(qū)間的關(guān)系:在完美區(qū)間內(nèi)訓(xùn)練時(shí)間隨著批量大小線性減小,隨之而來的是遞減拐點(diǎn),最后將達(dá)到最大數(shù)據(jù)并行的極限,無論如何增大批量的大小即使不考慮硬件,模型的訓(xùn)練時(shí)間也不會明顯減小。

盡管上述的基本關(guān)系在不同測試中成立,但研究人員發(fā)現(xiàn)上述過程中的拐點(diǎn)在不同數(shù)據(jù)集和神經(jīng)網(wǎng)絡(luò)架構(gòu)中的表現(xiàn)十分不同。這意味著簡單的數(shù)據(jù)并行可以再當(dāng)今硬件極限的基礎(chǔ)上為某些工作提供加速,但除此之外有些工作也許還需要其他方法來充分利用大規(guī)模算力。

在上面的例子中可以看到,ResNet-8在CIFAR-10并不能從超過1024的批大小中獲得明顯的加速,而ResNet-50在ImageNet上則可以一直將批大小提升到65536以上來減小訓(xùn)練時(shí)間。

優(yōu)化任務(wù)

如果可以預(yù)測出哪一種負(fù)載最適合于數(shù)據(jù)并行訓(xùn)練,我們就可以針對性的修改任務(wù)負(fù)載以充分利用硬件算力。但遺憾的是實(shí)驗(yàn)結(jié)果并沒有給出一個(gè)明確的計(jì)算最大有效批次的方法。拐點(diǎn)與網(wǎng)絡(luò)架構(gòu)、數(shù)據(jù)集、優(yōu)化器都有著密切的關(guān)系。例如在相同的數(shù)據(jù)集和優(yōu)化器上,不同的架構(gòu)可能會有截然不同的最大可用批次數(shù)量。

研究人員認(rèn)為這主要來源于網(wǎng)絡(luò)寬度和深度的不同,但對于某些網(wǎng)絡(luò)來說甚至沒有深度和寬度的概念,所以無法得到一個(gè)較為清晰的關(guān)系來計(jì)算最大可用批次數(shù)量。甚至當(dāng)我們發(fā)現(xiàn)有的網(wǎng)絡(luò)架構(gòu)可以接受更大的批次,但在不同數(shù)據(jù)集上的表現(xiàn)又無法得到統(tǒng)一的結(jié)論,有時(shí)小數(shù)據(jù)集上大批次的表現(xiàn)甚至要好于大數(shù)據(jù)上的結(jié)果。

fig 4圖中顯示了遷移模型和LSTM模型在相同數(shù)據(jù)集上最大批次的不同,右圖則顯示了較大的數(shù)據(jù)集與最大batch也沒有絕對的相關(guān)性,LM1B規(guī)模較小但可以達(dá)到較大的batch。但毋庸置疑的是,在優(yōu)化算法上的微小改動(dòng)都會使得訓(xùn)練結(jié)果在增加批量大小的過程中發(fā)生極大的變化。這意味著我們可以通過設(shè)計(jì)新的優(yōu)化器來最大化的利用數(shù)據(jù)并行的能力。

未來的工作

雖然利用通過增加批量大小來提高數(shù)據(jù)并行能力是提速的有效手段,但由于衰減效應(yīng)的存在無法達(dá)到硬件的極限能力。研究表明優(yōu)化算法也許可以指導(dǎo)我們找到充分利用硬件算力的解決方案。研究人員未來的工作將集中于對于不同優(yōu)化器的測評,探索恩能夠加速數(shù)據(jù)并行能力的新方法,盡可能的延伸批量大小對應(yīng)訓(xùn)練時(shí)間的加速范圍。

如果想探索研究人員們在千百個(gè)模型上訓(xùn)練出的數(shù)據(jù),可以直接訪問colab:https://colab.research.google.com/github/google-research/google-research/blob/master/batch_science/reproduce_paper_plots.ipynb詳細(xì)過程見論文包含了24個(gè)豐富完整的測評圖,描繪了神經(jīng)網(wǎng)絡(luò)訓(xùn)練過程各種參數(shù)隨批量變化的完整過程:https://arxiv.org/pdf/1811.03600.pdf

ref:https://ai.googleblog.com/2019/03/measuring-limits-of-data-parallel.html

Paper:https://arxiv.org/pdf/1811.03600.pdf

代碼:https://colab.research.google.com/github/google-research/google-research/blob/master/batch_science/reproduce_paper_plots.ipynb

https://blog.skymind.ai/distributed-deep-learning-part-1-an-introduction-to-distributed-training-of-neural-networks/https://blog.inten.to/hardware-for-deep-learning-part-3-gpu-8906c1644664?gi=bdd1e2e4331ehttps://ai.googleblog.com/2019/03/measuring-limits-of-data-parallel.htmlhttps://blog.csdn.net/xbinworld/article/details/74781605

Headpic from: https://dribbble.com/shots/4038074-Data-Center

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6238

    瀏覽量

    109835
  • 并行計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    29

    瀏覽量

    9683
  • 分布式計(jì)算
    +關(guān)注

    關(guān)注

    0

    文章

    28

    瀏覽量

    4645

原文標(biāo)題:和谷歌研究人員一起,探索數(shù)據(jù)并行的邊界極限

文章出處:【微信號:thejiangmen,微信公眾號:將門創(chuàng)投】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    光纖能與電線一起走嗎

    光纖與電線在特定條件下可以一起布線,但需嚴(yán)格遵守安全規(guī)范和物理隔離要求,以下是詳細(xì)分析: 、光纖與電線的物理特性差異 光纖 傳輸介質(zhì):以光信號傳輸數(shù)據(jù),不導(dǎo)電,因此不受電磁干擾(EMI
    的頭像 發(fā)表于 07-14 10:40 ?3022次閱讀

    研究人員開發(fā)出基于NVIDIA技術(shù)的AI模型用于檢測瘧疾

    瘧疾曾度在委內(nèi)瑞拉銷聲匿跡,但如今正卷土重來。研究人員已經(jīng)訓(xùn)練出個(gè)模型來幫助檢測這種傳染病。
    的頭像 發(fā)表于 04-25 09:58 ?617次閱讀

    屏蔽網(wǎng)線可以和電線一起

    屏蔽網(wǎng)線與電線不建議一起走線,原因主要有以下幾點(diǎn): 電磁干擾:電源線在傳輸電能時(shí)會產(chǎn)生電磁場,而屏蔽網(wǎng)線中的導(dǎo)線可能會受到這個(gè)電磁場的干擾。這種干擾可能導(dǎo)致屏蔽網(wǎng)線的信號質(zhì)量下降、速度變慢,甚至無法
    的頭像 發(fā)表于 03-07 10:47 ?1267次閱讀

    NVIDIA GPU助力科研人員探索外星世界

    NVIDIA GPU 驅(qū)動(dòng)的深度學(xué)習(xí)在短短幾秒內(nèi)解讀出了卡西尼號土星探測器多年來收集的海量數(shù)據(jù),為科研人員探索外星世界提供了更加智能的方式。
    的頭像 發(fā)表于 02-27 10:37 ?731次閱讀

    TeleAI提出COPO對齊方法:8B模型超越Llama3-70B的表現(xiàn)

    新大陸。 正如人類在面對未知時(shí)展現(xiàn)出的探索行為,在人工智能領(lǐng)域,尤其在大型語言模型(LLMs)理解語言和知識中,研究人員正嘗試賦予 LLM 類似的探索能力,從而突破其在給定數(shù)據(jù)集中學(xué)習(xí)
    的頭像 發(fā)表于 02-17 17:31 ?578次閱讀
    TeleAI提出COPO對齊方法:8B模型超越Llama3-70B的表現(xiàn)

    AN-166:與Linduino一起飛行中更新

    電子發(fā)燒友網(wǎng)站提供《AN-166:與Linduino一起飛行中更新.pdf》資料免費(fèi)下載
    發(fā)表于 01-12 10:09 ?0次下載
    AN-166:與Linduino<b class='flag-5'>一起</b>飛行中更新

    和Dr Peter一起學(xué)KiCad 4.8:設(shè)計(jì)規(guī)則檢查(DRC)

    和Dr Peter一起學(xué)KiCad 4.8:設(shè)計(jì)規(guī)則檢查(DRC)
    的頭像 發(fā)表于 12-25 14:55 ?2531次閱讀
    和Dr Peter<b class='flag-5'>一起</b>學(xué)KiCad 4.8:設(shè)計(jì)規(guī)則檢查(DRC)

    快來“一起鴻蒙吧”!體驗(yàn)更出色,智慧再升級

    當(dāng)鴻蒙遇上脫口秀,會擦出什么樣的火花?“一起鴻蒙吧”給出了答案。華為邀請了呼蘭、賈耗、漫才兄弟、龐博、小鹿等藝人,用脫口秀獨(dú)有的風(fēng)趣幽默方式,將原生鴻蒙帶入觀眾的視野。從真實(shí)的應(yīng)用場景出發(fā),脫口秀
    的頭像 發(fā)表于 12-25 14:45 ?564次閱讀
    快來“<b class='flag-5'>一起</b>鴻蒙吧”!體驗(yàn)更出色,智慧再升級

    視覺AI之旅:一起探索 FiftyOne ——第二部分 入門指南

    /journey-into-visual-ai-exploring-fiftyone-together-part-ii-getting-started-14cca5adfcd3 ? ? ,前言 上次我們介紹了《視覺AI之旅:一起探索
    的頭像 發(fā)表于 12-24 17:00 ?585次閱讀
    視覺AI之旅:<b class='flag-5'>一起</b><b class='flag-5'>探索</b> FiftyOne ——第二部分  入門指南

    將UCC39002與3個(gè)PT4484模塊一起使用

    電子發(fā)燒友網(wǎng)站提供《將UCC39002與3個(gè)PT4484模塊一起使用.pdf》資料免費(fèi)下載
    發(fā)表于 12-21 10:23 ?0次下載
    將UCC39002與3個(gè)PT4484模塊<b class='flag-5'>一起</b>使用

    研究人員利用激光束開創(chuàng)量子計(jì)算新局面

    演示設(shè)備 威特沃特斯蘭德大學(xué)(Wits)的物理學(xué)家利用激光束和日常顯示技術(shù)開發(fā)出了種創(chuàng)新的計(jì)算系統(tǒng),標(biāo)志著在尋求更強(qiáng)大的量子計(jì)算解決方案方面取得了重大飛躍。 該大學(xué)結(jié)構(gòu)光實(shí)驗(yàn)室的研究人員取得的這
    的頭像 發(fā)表于 12-18 06:24 ?507次閱讀
    <b class='flag-5'>研究人員</b>利用激光束開創(chuàng)量子計(jì)算新局面

    NVIDIA與谷歌量子AI部門達(dá)成合作

    NVIDIA CUDA-Q 平臺使谷歌量子 AI 研究人員能夠?yàn)槠淞孔佑?jì)算機(jī)創(chuàng)建大規(guī)模的數(shù)字模型,以解決設(shè)計(jì)中面臨的各種挑戰(zhàn)
    的頭像 發(fā)表于 11-20 09:39 ?949次閱讀

    將ADS7883與DAC8501一起使用遇到的疑問求解

    我想將ADS7883與DAC8501一起使用,使用個(gè)SPI外設(shè)控制,但是DAC8501個(gè)周期有24位數(shù)據(jù),而ADS7883僅有16位數(shù)據(jù)
    發(fā)表于 11-14 08:34

    請問三片PCM1864如何級聯(lián)在一起?

    現(xiàn)用三片PCM1864實(shí)現(xiàn)多路MIC信號實(shí)時(shí)采集,時(shí)鐘信號接在一起,數(shù)據(jù)信號分別接到DM8168的McASP接口的AXn的數(shù)據(jù)接口上。來做級聯(lián)是否可以。
    發(fā)表于 10-24 08:08

    請問tas5731m PBTL模式,單聲道輸出(AB連一起,CD連一起)如何實(shí)現(xiàn)左右聲道的混音輸出?

    請問tas5731m PBTL模式,單聲道輸出(AB連一起,CD連一起)如何實(shí)現(xiàn)左右聲道的混音輸出 還有開發(fā)軟件里能直接拉線么
    發(fā)表于 10-17 06:23