chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

機器學習并行化的自適應(yīng)、可組合與自動化問題

人工智能與大數(shù)據(jù)技術(shù) ? 來源:機器之心 ? 作者:機器之心 ? 2020-11-23 11:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CMU 機器人研究所張昊(Hao Zhang)博士論文新鮮出爐,主要圍繞著機器學習并行化的自適應(yīng)、可組合與自動化問題展開。

隨著近年來,機器學習領(lǐng)域的創(chuàng)新不斷加速,SysML 的研究者已經(jīng)創(chuàng)建了在多個設(shè)備或計算節(jié)點上并行機器學習訓練的算法和系統(tǒng)。機器學習模型在結(jié)構(gòu)上變得越來越復(fù)雜,許多系統(tǒng)都試圖提供全面的性能。尤其是,機器學習擴展通常會低估從一個適當?shù)姆植疾呗杂成涞侥P退枰闹R與時間。此外,將并行訓練系統(tǒng)應(yīng)用于復(fù)雜模型更是增加了非常規(guī)的開發(fā)成本,且性能通常低于預(yù)期。 近日,CMU 機器人研究所博士張昊公布了自己的博士學位論文《機器學習并行化的自適應(yīng)、可組合與自動化》,旨在找出并解決并行 ML 技術(shù)和系統(tǒng)實現(xiàn)在可用性和性能方面的研究挑戰(zhàn)。 具體而言,該論文從可編程性、并行化表示、性能優(yōu)化、系統(tǒng)架構(gòu)和自動并行化技術(shù)等幾方面對分布式并行 ML 展開了研究,并認為分布式并行機器學習可以同時實現(xiàn)簡潔性和高效性。此外,該論文表明,并行 ML 的性能可以通過生成自適應(yīng) ML 模型結(jié)構(gòu)和集群資源范式的策略實現(xiàn)大幅度提升,同時通過將「如何并行化」這一核心問題形式化為端到端優(yōu)化目標以及構(gòu)建可組合分布式 ML 系統(tǒng)來自動優(yōu)化這類自適應(yīng)、自定義策略,進而可以解決可用性挑戰(zhàn)。

論文鏈接:https://www.cs.cmu.edu/~hzhang2/files/hao_zhang_doctoral_dissertation.pdf 機器之心對該論文的核心內(nèi)容進行了簡要介紹,感興趣的讀者可以閱讀原論文。 論文內(nèi)容介紹 這篇論文主要由三部分組成,如下圖所示,第 1 部分(第三章 - 第五章):在單個機器學習并行化層面,使用自適應(yīng)并行化理解和優(yōu)化并行機器學習性能;第 2 部分(第六章 - 第七章):為機器學習并行開發(fā)統(tǒng)一的表示和可組合系統(tǒng);第 3 部分(第八章):機器學習并行化的自動化。

論文結(jié)構(gòu)概覽 論文第一部分提出了一個簡單的設(shè)計原則自適應(yīng)并行(adaptive parallelism),根據(jù)模型構(gòu)建要素(比如層)的特定 ML 屬性,將合適的并行化技術(shù)應(yīng)用于模型組成要素中。作者以 BERT 為例,總結(jié)出了實現(xiàn)這種自適應(yīng)的基本原理和三個核心概念,分別是子模型策略組合、多個并行化方面的系統(tǒng)優(yōu)化和資源感知。此外,作者推導出了一系列優(yōu)化和實現(xiàn)方法,從不同層面去提升 ML 并行化。研究結(jié)果表明其顯著提高了 ML 訓練在集群上的效率和可擴展性。 第二部分對這種方法進行了概述,并且面向機器學習并行化任務(wù)的兩個常見范式:單節(jié)點動態(tài)批處理和分布式機器學習并行,作者將機器學習的并行化表述為端到端的優(yōu)化問題,并尋找其自動化的解決方法。作者提出了原則表征來表示兩類機器學習并行,以及可組合的系統(tǒng)架構(gòu) Cavs 與 AutoDist。它們能夠快速組合不可見模型的并行化策略,提升并行化表現(xiàn),并簡化并行機器學習程序。

Facebook AI 提出的 DETR 的架構(gòu)圖 在此基礎(chǔ)上,論文第三部分提出一個自動并行化框架 AutoSync,用于自動優(yōu)化數(shù)據(jù)并行分布訓練中的同步策略。它實現(xiàn)了「開箱即用」的高性能,可以通過提出的表征進行空間導航,并自動識別同步策略,這些策略比現(xiàn)有的手工優(yōu)化系統(tǒng)的速度提高了 1.2-1.6 倍,降低了分布式 ML 的技術(shù)障礙,并幫助更大范圍的用戶訪問它。總結(jié)來說,這篇論文提出的相關(guān)技術(shù)和系統(tǒng)驗證了分布式環(huán)境下面向大規(guī)模機器學習訓練的端到端編譯系統(tǒng)的概念與原型實現(xiàn)。

AutoSync 策略的自動優(yōu)化流程算法

AutoSync 中的策略空間包含了現(xiàn)有系統(tǒng)中的很多高級策略 語言模型的分布式預(yù)訓練示例 預(yù)訓練語言表征已成為 NLP 系統(tǒng)中最普遍、最關(guān)鍵的部分。使用與任務(wù)無關(guān)的語言模型框架,可以對從 web 抓取的未標記文本進行無監(jiān)督的訓練,只需預(yù)測下一個單詞或句子。預(yù)訓練表征可以靈活地應(yīng)用于下游任務(wù),針對特定任務(wù)的損失和數(shù)據(jù)集進行微調(diào),或是通過少量上下文學習。 近年來,人們在開發(fā)更強大的任務(wù)無關(guān) LM 架構(gòu)方面取得了巨大進展,從單層詞向量表征到遞歸神經(jīng)網(wǎng)絡(luò)的多層表征和上下文狀態(tài),以及最新的基于遞歸 transformer 的架構(gòu)。 下圖展示了一個著名的例子——雙深度 Transformer(BERT)——屬于第三類。不管網(wǎng)絡(luò)架構(gòu)如何,語言模型通常包含許多參數(shù),而這些參數(shù)是在大規(guī)模文本語料庫上訓練出來的,這是因為它們的建模能力隨其大小以及文本掃描量成正比。

假設(shè)我們對訓練 BERT 感興趣,在基于 AWS 的 GPU 集群上使用 TensorFlow 等框架實現(xiàn)。我們可以使用最先進的開源訓練系統(tǒng)——Horovod,開始數(shù)據(jù)并行訓練。 應(yīng)用 Horovod 轉(zhuǎn)換單機 BERT 訓練代碼,涉及將原始的框架內(nèi)置優(yōu)化器與 Horovod 修補的優(yōu)化器包裝在一起。然后 Horovod 會在集群節(jié)點上使用 collective allreduce 或 allgather 來平均和應(yīng)用梯度。

這些 TensorFlow+Horovod 代碼片段展示了 Horovod 如何給優(yōu)化器打補丁,以及如何為分布式訓練進行非常小的代碼改變。 雖然可能會在目標集群上部署訓練,但獲得的擴展不太可能隨著添加更多資源而成比例增長(理想情況下,線性擴展與加速器的數(shù)量成比例增長):所有的語言模型都有嵌入層,這些層擁有很多模型參數(shù),但在每個設(shè)備上的每次訓練迭代中訪問很少,減少或聚集其梯度都會導致不必要的網(wǎng)絡(luò)運作;BERT 中的 transformer 是矩陣參數(shù)化、計算密集型的,與 Horovod 中的常規(guī)做法一樣,將梯度分組在一個縮減環(huán)(reduction ring)中,很容易使以太網(wǎng)帶寬或異構(gòu)集群 (如 AWS) 的設(shè)備 Flops 飽和。 在這兩種情況下,設(shè)置都容易出現(xiàn)通信或計算混亂的情況,即訓練時間的縮短無法令人滿意,花費在訓練上的計算資源成本在經(jīng)濟上也不能接受。這表明,并行化的常規(guī)目標并沒有實現(xiàn)。 所以,本文提出的這種自適應(yīng)并行策略,能夠為并行化性能進行適當?shù)膬?yōu)化。 作者介紹 張昊在今年 9 月 2 日完成了博士學位的論文答辯,導師為 CMU 教授、Petuum 創(chuàng)始人邢波(Eric Xing)。獲得 CMU 機器人研究所的博士學位后,他將以博士后身份進入 UC 伯克利的 RISE 實驗室,與計算機科學系教授 Ion Stoica 共同工作。

他的研究興趣包括可擴展的機器學習、深度學習以及計算機視覺和自然語言處理領(lǐng)域的大規(guī)模機器學習應(yīng)用。他還協(xié)同設(shè)計了一系列模型、算法和系統(tǒng),在更大規(guī)模數(shù)據(jù)、問題、應(yīng)用中進行機器學習擴展,以簡化復(fù)雜機器學習模型和算法的原型開發(fā),使機器學習程序分布自動化。

責任編輯:lq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 計算機視覺
    +關(guān)注

    關(guān)注

    9

    文章

    1713

    瀏覽量

    47385
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8532

    瀏覽量

    135992
  • 自然語言處理
    +關(guān)注

    關(guān)注

    1

    文章

    629

    瀏覽量

    14509

原文標題:229頁,CMU博士張昊畢業(yè)論文公布,探索機器學習并行化的奧秘

文章出處:【微信號:TheBigData1024,微信公眾號:人工智能與大數(shù)據(jù)技術(shù)】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA Isaac Lab推動機器人技術(shù)突破

    Isaac Lab 是 Isaac Gym 的替代版本,該框架已將 GPU 原生機器人仿真擴展至大規(guī)模多模態(tài)學習的全新領(lǐng)域。Isaac Lab 整合了 GPU 并行的物理真實的仿真、逼真的渲染技術(shù),以及模塊
    的頭像 發(fā)表于 10-21 11:20 ?402次閱讀

    工業(yè)自動化的意義在哪

    ,為工業(yè)4.0和智能制造奠定基礎(chǔ)。以下是工業(yè)自動化的核心意義及具體體現(xiàn): 一、提升生產(chǎn)效率與質(zhì)量 24小時連續(xù)作業(yè) 自動化設(shè)備(如機器人、數(shù)控機床)可全天候運行,無需人工輪班,顯著提高設(shè)備利用率。例如,汽車焊裝生產(chǎn)線
    的頭像 發(fā)表于 09-23 17:32 ?404次閱讀

    現(xiàn)代農(nóng)業(yè)自動化的技術(shù)演進與應(yīng)用

    自動化依賴多源傳感網(wǎng)絡(luò)(如土壤濕度、光照、溫濕度傳感器)實時采集環(huán)境數(shù)據(jù),結(jié)合氣象預(yù)報和作物生長模型,通過云端或邊緣計算平臺(如AI芯片)進行數(shù)據(jù)分析,自動生成灌溉、施肥或病蟲害防治決策。例如,基于機器
    的頭像 發(fā)表于 09-09 11:38 ?284次閱讀

    富唯智能復(fù)合機器人力控技術(shù):重新定義精準自動化

    在工業(yè)自動化和智能醫(yī)療快速發(fā)展的今天,富唯智能憑借先進的復(fù)合機器人力控技術(shù),推出了新一代復(fù)合機器人解決方案。該方案深度融合協(xié)作機器人、自主移動機器
    的頭像 發(fā)表于 08-26 16:54 ?464次閱讀

    貿(mào)澤推出全新自動化資源中心

    新技術(shù)。借助這些資源,該領(lǐng)域的專業(yè)工程師將能夠了解控制系統(tǒng)、機器人和先進自動化軟件的新進展。 ? 工業(yè)自動化的核心在于提高效率和生產(chǎn)力、增強系統(tǒng)可靠性,同時降低營運成本并強化安全協(xié)議。通過該資源中心,專業(yè)人員可以獲取深度文章,包
    的頭像 發(fā)表于 08-01 16:26 ?491次閱讀
    貿(mào)澤推出全新<b class='flag-5'>自動化</b>資源中心

    耐達訊自動化EtherCAT轉(zhuǎn)RS232:示波器連接的“開掛秘籍”

    ,很多示波器都采用它。耐達訊自動化EtherCAT轉(zhuǎn)RS232網(wǎng)關(guān)就像個“神奇翻譯官”,把EtherCAT的語言“翻譯”成RS232能懂的,讓它們能攜手合作。 我認識的一位工程師就碰到了難題。他們在做
    發(fā)表于 07-23 15:31

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境中的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)
    的頭像 發(fā)表于 07-15 16:32 ?405次閱讀
    <b class='flag-5'>自動化</b>計算機的功能與用途

    機器人和自動化的未來(2)

    本文是第二屆電力電子科普征文大賽的獲獎作品,來自西南交通大學黃雯珂的投稿。3機器人與自動化的未來展望隨著機器人和自動化技術(shù)的不斷進步,未來的世界將會是一個高度
    的頭像 發(fā)表于 04-26 08:33 ?488次閱讀
    <b class='flag-5'>機器</b>人和<b class='flag-5'>自動化</b>的未來(2)

    智能舵機:AI融合下的自動化新紀元

    自動化的浪潮中,智能舵機以其獨特的魅力和卓越的性能,正引領(lǐng)著自動化產(chǎn)業(yè)邁向新的高度。今天,讓我們一起走進智能舵機的世界,感受AI技術(shù)為其帶來的無限可能。 一、智能舵機:自適應(yīng)控制的先鋒 智能舵機
    的頭像 發(fā)表于 03-28 15:44 ?515次閱讀
    智能舵機:AI融合下的<b class='flag-5'>自動化</b>新紀元

    傳感器在機器人和自動化領(lǐng)域的應(yīng)用

    環(huán)境適應(yīng)性的要求日益提升,而磁編碼器和磁位置傳感器憑借其高分辨率、非接觸測量以及抗干擾能力,成為實現(xiàn)這些應(yīng)用的核心技術(shù)。本文將為您探討這兩種關(guān)鍵傳感器在機器人與自動化技術(shù)中的應(yīng)用,以及Melexis(邁來芯)的相關(guān)解決方案。
    的頭像 發(fā)表于 03-06 16:17 ?1032次閱讀

    HFSS 自動化建模工具

    因工作需求,自己寫的HFSS參數(shù)自動化建模工具,目前只實現(xiàn)了常用的四種模型,可定制,如需可聯(lián)系 qq:1300038043 附件下載鏈接:https://pan.baidu.com/s/1TVeTTFiJw-pxSyT1AT8IQA 提取碼: kxup
    發(fā)表于 02-27 17:44

    羅克韋爾自動化推出DataReady智能機器

    作為工業(yè)自動化、信息和數(shù)字轉(zhuǎn)型領(lǐng)域的全球領(lǐng)先企業(yè)之一, 羅克韋爾自動化宣布旗下 FactoryTalk Optix 產(chǎn)品組合再添新兵 -
    的頭像 發(fā)表于 12-31 14:42 ?939次閱讀

    自動化創(chuàng)建UI并解析數(shù)據(jù)

    *附件:32960_auto.rar備注:Main.vi是ui自動化2.1.vi,配置文件為32960.B.ini。 目前可以實現(xiàn)根據(jù)配置文件自動化創(chuàng)建控件并布局,且可以自動解析接收到的數(shù)據(jù)內(nèi)容寫入
    發(fā)表于 12-10 08:41

    自動化創(chuàng)建UI并解析數(shù)據(jù)

    Labview實現(xiàn)動態(tài)增加控件效果 - *附件:32960_auto.rar 備注:Main.vi是ui自動化2.1.vi,配置文件為32960.B.ini。 目前可以實現(xiàn)根據(jù)配置文件自動化創(chuàng)建控件
    發(fā)表于 11-29 11:26

    自動化系統(tǒng)中傳感器的應(yīng)用實例

    自動化 1.1 機器人技術(shù) 在工業(yè)自動化中,機器人技術(shù)是一個重要的應(yīng)用領(lǐng)域。傳感器使機器人能夠感知周圍環(huán)境,執(zhí)行精確的操作。例如,力/扭矩傳
    的頭像 發(fā)表于 11-19 15:26 ?2525次閱讀