chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AutoML又一利器來了!谷歌宣布開源AdaNet

DPVg_AI_era ? 來源:未知 ? 作者:李倩 ? 2018-11-01 09:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AutoML又一利器來了!今天,谷歌宣布開源AdaNet,這是一個輕量級的基于TensorFlow的框架,可以在最少的專家干預下自動學習高質(zhì)量的模型。

今天,谷歌宣布開源AdaNet,這是一個輕量級的基于TensorFlow的框架,可以在最少的專家干預下自動學習高質(zhì)量的模型。

這個項目基于Cortes等人2017年提出的AdaNet算法,用于學習作為子網(wǎng)絡集合的神經(jīng)網(wǎng)絡的結(jié)構(gòu)。

谷歌AI負責人Jeff Dean表示,這是谷歌AutoML整體工作的一部分,并且,谷歌同時提供了AdaNet的開源版本和教程notebook。

該團隊在介紹博客中表示:“AdaNet以我們最近的強化學習和基于進化的AutoML研究為基礎,在提供學習保證的同時實現(xiàn)了快速、靈活。重要的是,AdaNet提供了一個通用框架,不僅可以學習神經(jīng)網(wǎng)絡架構(gòu),還可以學習集成,以獲得更好的模型?!?/p>

AdaNet提供以下特征:

Estimator API,可輕松訓練、評估和服務AdaNet模型。

學習在TensorFlow中集成用戶定義的子網(wǎng)。

用于在單個 train() 調(diào)用中搜索子網(wǎng)架構(gòu)和參數(shù)的接口。

關于CPUGPU的分布式訓練(我們正在開發(fā)TPU支持)。

一流的TensorBoard integration。

提供理論學習。

基于集成學習的自動搜索工具

集成學習(Ensemble learning)是將不同機器學習(ML)模型預測結(jié)合起來的技術,廣泛用于神經(jīng)網(wǎng)絡,以實現(xiàn)最先進的性能。得益于豐富的經(jīng)驗和理論保證,集成學習在許多Kaggle競賽中取得了成功,例如Netflix Prize。

由于訓練時間長,集成學習在實踐中使用不多,而且選擇哪個ML模型需要根據(jù)其領域?qū)I(yè)知識來。

但隨著計算能力和專用深度學習硬件(如TPU)變得更容易獲得,機器學習模型的一個趨勢是變得更大,集成(ensemble)也就變得更加重要。

現(xiàn)在,AdaNet就是這樣一個工具,可以自動搜索神經(jīng)網(wǎng)絡架構(gòu),并學會將最好的架構(gòu)組合成一個高質(zhì)量的模型。

AdaNet易于使用,并能創(chuàng)建高質(zhì)量的模型,為ML實踐者節(jié)省了用于選擇最佳神經(jīng)網(wǎng)絡架構(gòu)的時間,實現(xiàn)了一種將學習神經(jīng)架構(gòu)作為子網(wǎng)絡集合的自適應算法。

AdaNet能夠添加不同深度和寬度的子網(wǎng)絡,以創(chuàng)建多樣化的集合,并通過參數(shù)數(shù)量來改進性能。

AdaNet自適應地產(chǎn)生了神經(jīng)網(wǎng)絡的集成。在每次迭代中,它測量每個候選對象的集成損失,并選擇最佳的一個,然后進入下一次迭代。

快速且易于使用

AdaNet實現(xiàn)了TensorFlow Estimator接口,通過封裝訓練、評估、預測和服務導出,大大簡化了機器學習編程。它集成了開源工具,如TensorFlow Hub模塊,TensorFlow Model Analysis和Google Cloud的Hyperparameter Tuner。分布式訓練支持可顯著縮短訓練時間,并可與可用的CPU和加速器(例如GPU)進行線性擴展。

AdaNet在CIFAR-100上每個訓練步驟(X軸)的精度(y軸)。藍線是訓練集上的性能,紅線是測試集上的性能。每一百萬步開始訓練一個新的子網(wǎng)絡,并最終提高整體的性能。在添加新子網(wǎng)之前,灰線和綠線是集合的準確度。

由于TensorBoard是用于在訓練期間可視化模型性鞥的最佳TensorFlow功能之一,AdaNet可與其無縫集成,以監(jiān)控子網(wǎng)絡訓練,集合組合和性能。當AdaNet完成訓練后,它會導出一個可以使用TensorFlow Serving部署的SavedModel。

學習保證

構(gòu)建神經(jīng)網(wǎng)絡集合面臨這么幾個挑戰(zhàn):要考慮的最佳子網(wǎng)架構(gòu)是什么?再此使用相同的架構(gòu)或鼓勵多樣性是不是最佳選擇?雖然具有更多參數(shù)的復雜子網(wǎng)將在訓練集上表現(xiàn)更好,但由于其存在更強的復雜性,它們可能不會適用于未知數(shù)據(jù)。這些挑戰(zhàn)來自評估模型性能的過程。我們可以評估一個訓練集子集的性能,但這樣做會減少可用于訓練神經(jīng)網(wǎng)絡的示例數(shù)量。

相反,AdaNet的方法(在ICML 2017的“ AdaNet:人工神經(jīng)網(wǎng)絡的自適應結(jié)構(gòu)學習 ”一文中提出)是為了優(yōu)化一個對象,以平衡集合在訓練集上的表現(xiàn)與其適用于未知數(shù)據(jù)的能力之間的權(quán)衡。集合這樣選擇子網(wǎng)絡:只有當候選子網(wǎng)絡改進了總體的訓練損失,而不是影響了整體的泛化能力時,才包含這個候選子網(wǎng)絡。這保證了:

1.集合的泛化誤差受到訓練誤差和復雜性的限制。

2.通過優(yōu)化對象,我們可以直接將限制最小化。

優(yōu)化對象的一個實際好處是:它不需要保留集來選擇要添加到集合中的候選子網(wǎng)。這還將帶來另一個好處:我們可以使用更多的訓練數(shù)據(jù)來訓練子網(wǎng)。

可擴展性

我們認為,為滿足研究和生產(chǎn)制作AutoML框架的關鍵在于不僅要提供合理的默認值,還要允許用戶嘗試自己子網(wǎng)及模型的定義。因此,機器學習研究人員、從業(yè)人員和愛好者均可報名定義自己的AdaNet adanet.subnetwork.Builder,通過使用高級別的TensorFlow API,如tf.layers。

已經(jīng)在其系統(tǒng)中集成TensorFlow模型的用戶可以輕松地將他們的TensorFlow代碼轉(zhuǎn)換為AdaNet子網(wǎng),并使用adanet.Estimator提高模型性能,同時獲得學習保證。AdaNet將探測他們定義的候選子網(wǎng)的搜索空間,并學習整合子網(wǎng)。例如,我們采用了NASNet-A CIFAR架構(gòu)的開源實現(xiàn)方式,將其轉(zhuǎn)換為子網(wǎng),并在八次AdaNet迭代后對CIFAR-10最先進的結(jié)果進行改進。此外,我們的模型使用更少的參數(shù)實現(xiàn)了這一結(jié)果:

Zoph等人2018年提出的NASNet-A模型的性能,以及AdaNet學習在CIFAR-10上將小型NASNet-A子網(wǎng)結(jié)合起來的性能比較。

用戶也可以通過canned或定制tf.contrib.estimator.Heads將自定義損失函數(shù)用作AdaNet對象的一部分,以便訓練回歸、分類和多任務學習問題。

用戶還可以通過擴展adanet.subnetwork.Generator類來完全定義候選子網(wǎng)絡的搜索空間。這允許他們根據(jù)可用硬件增大或減小搜索空間。子網(wǎng)絡的搜索空間可以很簡單,只需使用不同的隨機種子復制相同的子網(wǎng)絡配置,就能訓練具有不同超參數(shù)組合的數(shù)十個子網(wǎng)絡,并讓AdaNet選擇要包含在最終集合中的子網(wǎng)絡。

谷歌的研究團隊提供了GitHub repo和tutorial notebook,并且包含了一些使用dense layers和卷積的示例幫助大家入門。

AdaNet的數(shù)據(jù)集、工作原理和應用范圍

今天,該項目的成員也在Reddit和ycombinator上回答讀者提問,我們精選了一些回答:

1、請問你使用該算法嘗試了哪些數(shù)據(jù)集?它是否只適用于圖像分類,比如Google的AutoML產(chǎn)品?

我們在圖像識別之外的幾個大型數(shù)據(jù)集上使用了AdaNet,包括結(jié)構(gòu)化數(shù)據(jù)(參見原始論文)和一些NLP數(shù)據(jù)集。在大多數(shù)情況下,AdaNet的性能優(yōu)于獨立訓練的任何單個子網(wǎng)絡(這些子網(wǎng)絡可能使用非常復雜的架構(gòu),如NASNet-A)。

當然,如何定義一個優(yōu)化搜索空間,并使用合理的搜索啟發(fā)方式/算法對于獲得最佳的最終模型非常重要,而且一般最佳的模型是使用強大的先驗,就像最先進的模型,并讓AdaNet學習將這些模型的不同變化結(jié)合起來。

但是,如果你希望AdaNet能夠通用于任意數(shù)據(jù)集,可以嘗試定義合理的搜索空間,比如搜索日益復雜的完全連接的神經(jīng)網(wǎng)絡,并允許AdaNet學習將其組合到最佳模型中。

最終,這就是我們設計的AdaNet具備高度靈活性的原因:我們希望任何人嘗試建立對自己的數(shù)據(jù)集有意義的子網(wǎng)絡搜索空間,以便獲得最佳性能的最終模型。

2、官方資源庫中的示例是個更好的例子,說明了AdaNet的工作原理:

https://github.com/tensorflow/adanet/blob/master/adanet/examples/tutorials/adanet_objective.ipynb

盡管名字叫“AutoML”,但實際上似乎仍需要做很多工作才能實現(xiàn)模型的優(yōu)化。 (第二個示例在這方面的表現(xiàn)相對更好一些:

https://github.com/tensorflow/adanet/blob/master/adanet/examples/tutorials/customizing_adanet.ipynb)

確實,雖然AdaNet項目目前還不包含最先進的架構(gòu)搜索策略/搜索空間,但它確實為研究人員提供了一個抽象對象(adanet.subnetwork.Generator)來實現(xiàn)神經(jīng)架構(gòu)搜索算法,同時提供了適合用戶的生產(chǎn)友好型的TF Estimator界面,讓算法開發(fā)更容易集成到生產(chǎn)過程中,而且,已經(jīng)使用TF Estimator生態(tài)系統(tǒng)的用戶也可以更快地從這些開發(fā)成果中受益。

我想指出的是,盡管AdaNet的某些方面并不那么先進,但我們已經(jīng)看到AdaNet在各種各樣的任務上取得了良好的效果。大家都來試試看吧!

當然,我們不會停下腳步!我們很高興自己也在這個領域工作,我們今后將繼續(xù)更新這個項目。

3、我還沒有細讀,但抱歉問一句;:AdaNet可以處理具有可變長度skip connections的塊嗎?(比如DenseNet),甚至能夠提供AmoebaNet風格的模型嗎?指導超參數(shù)/架構(gòu)選擇過程的元策略(網(wǎng)格搜索/貝葉斯等)有哪些呢?謝謝!

這是個好問題!在最簡單的情況下,AdaNet允許用戶將獨立子網(wǎng)從線性模型集成到用戶定義的DenseNet / AmoebaNet式網(wǎng)絡上。但更有趣的是在迭代之間共享信息(這些信息可以是張量輸出,或是哪些超參數(shù)表現(xiàn)最好),以便AdaNet進行神經(jīng)架構(gòu)搜索。用戶可以定義自己的adanet子網(wǎng)生成器,指定如何跨迭代過程調(diào)整訓練方式。

開箱即用的元策略其實和用戶簡單定義的啟發(fā)式算法差不多。但是,AdaNet框架足夠靈活,可以支持更智能的策略,并抽象出分布式訓練(Estimator),評估(TensorBoard)和服務(tf.SavedModel)的復雜度。

4、機器學習和深度學習取得了如此大的進步??梢怨烙嬕幌挛倚枰嗌貱PU 和成本才能獲得一些結(jié)果嗎?我的數(shù)據(jù)訓練量大約是20M的樣本(每個樣本1K數(shù)據(jù)點)。

這取決于你搜索的子網(wǎng)數(shù)量以及每個子網(wǎng)的訓練成本。你可以使用單個DNN定義搜索空間,并為其提供一次迭代,這與固定DNN Estimator的操作相同。

比如說,假設搜索空間包含5個DNN,每個DNN完成一次迭代訓練需要的成本為X,訓練10次迭代,你的訓練成本就是X x 5 x 10 = 50X。

但是,考慮到你使用AdaNet,可以考慮整合50個DNN進行探索、訓練和選擇等流程,此外,由于AdaNet是作為TensorFlow Estimator實現(xiàn)的,如果這就是你想要的,可以很容易地增加機器數(shù)量,以加快訓練速度。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6250

    瀏覽量

    110735
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4831

    瀏覽量

    107265
  • 強化學習
    +關注

    關注

    4

    文章

    270

    瀏覽量

    11936

原文標題:AutoML又一利器來了,谷歌宣布開源AdaNet(附教程)

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    谷歌評論卡,碰碰即可完成谷歌評論 #谷歌評論卡 #NFC標簽 #nfc卡

    谷歌
    深圳市融智興科技有限公司
    發(fā)布于 :2026年01月15日 17:02:00

    TCL首款基于開源鴻蒙的智慧健康空調(diào)發(fā)布

    12月18日,在TCL空調(diào)新品發(fā)布會上,基于開源鴻蒙打造的小藍翼P7 Ultra系列AI健康空調(diào)正式發(fā)布。這是TCL空調(diào)與開源鴻蒙生態(tài)深度融合的重要成果,也是開源鴻蒙賦能智慧家居的又一
    的頭像 發(fā)表于 12-25 09:33 ?317次閱讀

    泰凌微:布局端側(cè)AI,產(chǎn)品支持谷歌LiteRT、TVM開源模型

    ?電子發(fā)燒友網(wǎng)報道(文/李彎彎)泰凌微近日表示,公司與谷歌在智能家居、音頻等多個領域開展具體項目合作。其與谷歌已從單的遙控器芯片供應,發(fā)展為涵蓋音頻、智能家居、端側(cè)AI等多領域的深度合作關系
    的頭像 發(fā)表于 12-15 08:21 ?1w次閱讀

    為什么說uCentral是構(gòu)建開放網(wǎng)絡的開源利器?

    uCentral是TIP主導的開源網(wǎng)絡管理系統(tǒng),其核心uCentral Controller通過開放協(xié)議實現(xiàn)設備集中管控與自動化運維。該系統(tǒng)支持配置下發(fā)、狀態(tài)監(jiān)控和閉環(huán)自愈,在數(shù)據(jù)中心場景中要求底層交換機具備NETCONF/YANG、VXLAN等開放接口能力,為構(gòu)建智能云化網(wǎng)絡提供堅實基礎。
    的頭像 發(fā)表于 11-28 18:33 ?1168次閱讀
    為什么說uCentral是構(gòu)建開放網(wǎng)絡的<b class='flag-5'>開源</b><b class='flag-5'>利器</b>?

    開源鴻蒙和開源歐拉成為開放原子開源基金會首批畢業(yè)項目

    11月21日,在2025開放原子開發(fā)者大會開幕式上,開放原子開源基金會宣布旗下開源鴻蒙(OpenHarmony)與開源歐拉(openEuler)成為首批畢業(yè)項目。
    的頭像 發(fā)表于 11-25 17:22 ?766次閱讀

    芯原與谷歌聯(lián)合推出開源Coral NPU IP

    芯原股份近日宣布谷歌聯(lián)合推出面向始終在線、超低能耗端側(cè)大語言模型應用的Coral NPU IP。
    的頭像 發(fā)表于 11-13 11:24 ?507次閱讀
    芯原與<b class='flag-5'>谷歌</b>聯(lián)合推出<b class='flag-5'>開源</b>Coral NPU IP

    NVIDIA宣布開源Aerial軟件

    NVIDIA 開源其 Aerial 軟件,并將 NVIDIA Sionna 研究套件和 Aerial 測試平臺引入 NVIDIA DGX Spark 平臺,為研究人員提供強大的工具和便捷的訪問途徑,以加速 AI 原生無線創(chuàng)新。
    的頭像 發(fā)表于 11-03 15:14 ?806次閱讀

    正面迎戰(zhàn)英偉達CUDA,華為宣布CANN全面開源

    8月5日,在北京舉行的昇騰計算產(chǎn)業(yè)發(fā)展峰會上,華為輪值董事長徐直軍宣布,升騰 AI 核心軟件平臺 CANN 將全面開源,同時還將Mind 系列應用軟件及工具鏈同步開放,包括Mindstudio
    的頭像 發(fā)表于 08-06 14:34 ?9426次閱讀
    正面迎戰(zhàn)英偉達CUDA,華為<b class='flag-5'>宣布</b>CANN全面<b class='flag-5'>開源</b>

    華為正式開源盤古7B稠密和72B混合專家模型

    [中國,深圳,2025年6月30日] 今日,華為正式宣布開源盤古70億參數(shù)的稠密模型、盤古Pro MoE 720億參數(shù)的混合專家模型和基于昇騰的模型推理技術。 此舉是華為踐行昇騰生態(tài)戰(zhàn)略的又一
    的頭像 發(fā)表于 06-30 11:19 ?1250次閱讀

    開源鴻蒙統(tǒng)互聯(lián)分論壇圓滿舉辦

    萬物互聯(lián)時代到來,物聯(lián)網(wǎng)設備數(shù)量及設備連接數(shù)高速增長,如何實現(xiàn)高效、穩(wěn)定的設備間通信,成為行業(yè)重要的研究方向。作為開源操作系統(tǒng),開源鴻蒙帶來了全新的技術架構(gòu)和解決方案,其統(tǒng)互聯(lián)的技術
    的頭像 發(fā)表于 06-05 15:33 ?944次閱讀

    開源鴻蒙開發(fā)新體驗,開鴻Bot系列今日開啟預售!

    今日,深開鴻正式宣布,開鴻Bot系列產(chǎn)品——開鴻BotBook與開鴻BotMini全面開啟預售。該系列面向開源鴻蒙開發(fā)者量身打造,搭載基于OpenHarmony深度定制的KaihongOS桌面
    發(fā)表于 05-16 14:13

    明遠智睿SSD2351開發(fā)板:儀器儀表與智慧農(nóng)業(yè)的創(chuàng)新利器

    資料和一對一的技術支持,讓農(nóng)業(yè)科研人員和開發(fā)者可以根據(jù)實際需求對開發(fā)板進行定制和優(yōu)化,開發(fā)出更加適合智慧農(nóng)業(yè)發(fā)展的應用和解決方案。明遠智睿SSD2351開發(fā)板為儀器儀表和智慧農(nóng)業(yè)領域帶來了新的發(fā)展機遇,推動了這兩個領域的創(chuàng)新和進步。
    發(fā)表于 05-09 19:09

    DeepSeek宣布開源DeepGEMM

    DeepGEMM 是個專為簡潔高效的 FP8 通用矩陣乘法(GEMM)設計的庫,具有細粒度縮放功能,在Deepseek開源周的第三天Deepseek正式宣布開源DeepGEMM。 據(jù)
    的頭像 發(fā)表于 02-26 15:33 ?1134次閱讀

    Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器

    Banana Pi開源社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)利器
    的頭像 發(fā)表于 02-19 18:25 ?3551次閱讀
    Banana Pi<b class='flag-5'>開源</b>社區(qū)基于瑞芯微RK3588開發(fā)板,DeepSeek開發(fā)<b class='flag-5'>利器</b>

    谷歌公司被立案調(diào)查 谷歌股價暴跌 谷歌母公司Alphabet跌8%

    ,要求其改變市場壟斷現(xiàn)狀。去年8月,谷歌在美國遭遇重創(chuàng),被聯(lián)邦法官認定其搜索業(yè)務違反了美國反壟斷法。這判決為谷歌來了諸多限制性的建議,如美國司法部建議聯(lián)邦法院要求
    的頭像 發(fā)表于 02-06 16:23 ?1909次閱讀