chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

如意 ? 來源:機器之心 ? 作者:Andre Ye ? 2020-09-22 14:47 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

AutoML 是當(dāng)前深度學(xué)習(xí)領(lǐng)域的熱門話題。只需要很少的工作,AutoML 就能通過快速有效的方式,為你的 ML 任務(wù)構(gòu)建好網(wǎng)絡(luò)模型,并實現(xiàn)高準(zhǔn)確率。簡單有效!數(shù)據(jù)預(yù)處理、特征工程、特征提取和特征選擇等任務(wù)皆可通過 AutoML 自動構(gòu)建。

自動機器學(xué)習(xí)(Automated Machine Learning, AutoML)是一個新興的領(lǐng)域,在這個領(lǐng)域中,建立機器學(xué)習(xí)模型來建模數(shù)據(jù)的過程是自動化的。AutoML 使得建模更容易,并且每個人都更容易掌握。

在本文中,作者詳細(xì)介紹了四種自動化的 ML 工具包,分別是 auto-sklearn、TPOT、HyperOpt 以及 AutoKeras。如果你對 AutoML 感興趣,這四個 Python 庫是最好的選擇。作者還在文章結(jié)尾文章對這四個工具包進(jìn)行了比較。

auto-sklearn

auto-sklearn 是一個自動機器學(xué)習(xí)工具包,它與標(biāo)準(zhǔn) sklearn 接口無縫集成,因此社區(qū)中很多人都很熟悉該工具。通過使用最近的一些方法,比如貝葉斯優(yōu)化,該庫被用來導(dǎo)航模型的可能空間,并學(xué)習(xí)推理特定配置是否能很好地完成給定任務(wù)。

該庫由 Matthias Feurer 等人提出,技術(shù)細(xì)節(jié)請查閱論文《Efficient and Robust Machine Learning》。Feurer 在這篇論文中寫道:

我們提出了一個新的、基于 scikit-learn 的魯棒 AutoML 系統(tǒng),其中使用 15 個分類器、14 種特征預(yù)處理方法和 4 種數(shù)據(jù)預(yù)處理方法,生成了一個具有 110 個超參數(shù)的結(jié)構(gòu)化假設(shè)空間。

auto-sklearn 可能最適合剛接觸 AutoML 的用戶。除了發(fā)現(xiàn)數(shù)據(jù)集的數(shù)據(jù)準(zhǔn)備和模型選擇之外,該庫還可以從在類似數(shù)據(jù)集上表現(xiàn)良好的模型中學(xué)習(xí)。表現(xiàn)最好的模型聚集在一個集合中。

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

圖源:《Efficient and Robust Automated Machine Learning》

在高效實現(xiàn)方面,auto-sklearn 需要的用戶交互最少。使用 pip install auto-sklearn 即可安裝庫。

該庫可以使用的兩個主要類是 AutoSklearnClassifier 和 AutoSklearnRegressor,它們分別用來做分類和回歸任務(wù)。兩者具有相同的用戶指定參數(shù),其中最重要的是時間約束和集合大小。

更多 AutoSklearn 相關(guān)文檔請查閱:https://automl.github.io/auto-sklearn/master/。

TPOT

TPOT 是另一種基于 Python 的自動機器學(xué)習(xí)開發(fā)工具,該工具更關(guān)注數(shù)據(jù)準(zhǔn)備、建模算法和模型超參數(shù)。它通過一種基于進(jìn)化樹的結(jié),即自動設(shè)計和優(yōu)化機器學(xué)習(xí) pipelie 的樹表示工作流優(yōu)化(Tree-based Pipeline Optimization Tool, TPOT),從而實現(xiàn)特征選擇、預(yù)處理和構(gòu)建的自動化。

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

圖源:《Evaluation of a Tree-based Pipeline Optimization Tool for Automating Data Science》 。

程序或 pipeline 用樹表示。遺傳編程(Genetic Program, GP)選擇并演化某些程序,以最大化每個自動化機器學(xué)習(xí)管道的最終結(jié)果。

正如 Pedro Domingos 所說,「數(shù)據(jù)量大的愚蠢算法勝過數(shù)據(jù)有限的聰明算法」。事實就是這樣:TPOT 可以生成復(fù)雜的數(shù)據(jù)預(yù)處理 pipeline。

分析四種自動化的機器學(xué)習(xí)工具包,更好地建立網(wǎng)絡(luò)模型

潛在的 pipelie(圖源:TPOT 文檔)。

TPOT pipeline 優(yōu)化器可能需要幾個小時才能產(chǎn)生很好的結(jié)果,就像很多 AutoML 算法一樣(除非數(shù)據(jù)集很?。?。用戶可以在 Kaggle commits 或 Google Colab 中運行這些耗時的程序。

也許 TPOT 最好的特性是它將模型導(dǎo)出為 Python 代碼文件,后續(xù)可以使用它。具體文檔和教程示例參見以下兩個鏈接:

TPOT 文檔地址:https://epistasislab.github.io/tpot/。

TPOT 的教程示例地址:https://epistasislab.github.io/tpot/examples/

HyperOpt

HyperOpt 是一個用于貝葉斯優(yōu)化的 Python 庫,由 James Bergstra 開發(fā)。該庫專為大規(guī)模優(yōu)化具有數(shù)百個參數(shù)的模型而設(shè)計,顯式地用于優(yōu)化機器學(xué)習(xí) pipeline,并可選擇在多個核心和機器上擴展優(yōu)化過程。

但是,HyperOpt 很難直接使用,因為它非常具有技術(shù)性,需要仔細(xì)指定優(yōu)化程序和參數(shù)。相反,作者建議使用 HyperOpt-sklearn,這是一個融合了 sklearn 庫的 HyperOpt 包裝器。

具體來說,HyperOpt 雖然支持預(yù)處理,但非常關(guān)注進(jìn)入特定模型的幾十個超參數(shù)。就一次 HyperOpt sklearn 搜索的結(jié)果來說,它生成了一個沒有預(yù)處理的梯度提升分類器:

如何構(gòu)建 HyperOpt-sklearn 模型可以查看源文檔。它比 auto-sklearn 復(fù)雜得多,也比 TPOT 復(fù)雜一點。但是如果超參數(shù)很重要的話,它可能是值得的。

文檔地址:http://hyperopt.github.io/hyperopt-sklearn/

AutoKeras

與標(biāo)準(zhǔn)機器學(xué)習(xí)庫相比,神經(jīng)網(wǎng)絡(luò)和深度學(xué)習(xí)功能更強大,因此更難實現(xiàn)自動化。AutoKeras 庫有哪些功效呢?具體如下:

通過 AutoKeras,神經(jīng)框架搜索算法可以找到最佳架構(gòu),如單個網(wǎng)絡(luò)層中的神經(jīng)元數(shù)量、層數(shù)量、要合并的層、以及濾波器大小或 Dropout 中丟失神經(jīng)元百分比等特定于層的參數(shù)。一旦搜索完成,用戶可以將其作為普通的 TF/Keras 模型使用;

通過 AutoKeras,用戶可以構(gòu)建一個包含嵌入和空間縮減等復(fù)雜元素的模型,這些元素對于學(xué)習(xí)深度學(xué)習(xí)過程中的人來說是不太容易訪問的;

當(dāng)使用 AutoKeras 創(chuàng)建模型時,向量化或清除文本數(shù)據(jù)等許多預(yù)處理操作都能完成并進(jìn)行優(yōu)化;

初始化和訓(xùn)練一次搜索需要兩行代碼。AutoKeras 擁有一個類似于 keras 的界面,所以它并不難記憶和使用。

AutoKeras 支持文本、圖像和結(jié)構(gòu)化數(shù)據(jù),為初學(xué)者和尋求更多參與技術(shù)知識的人提供界面。AutoKeras 使用進(jìn)化神經(jīng)網(wǎng)絡(luò)架構(gòu)搜索方法來減輕研究人員的繁重和模棱兩可的工作。

盡管 AutoKeras 的運行需要很長時間,但用戶可以指定參數(shù)來控制運行時間、探索模型的數(shù)量以及搜索空間大小等。

AutoKeras 的相關(guān)內(nèi)容參閱以下兩個鏈接:

文檔地址:https://autokeras.com/

教程地址:https://towardsdatascience.com/automl-creating-top-performing-neural-networks-without-defining-architecture-c7d3b08cddc

四個庫各有特色,應(yīng)該選哪個?

用戶可以根據(jù)自己的需求選擇合適的 Python 庫,作者給出了以下幾個建議:

如果你的首要任務(wù)是獲取一個干凈、簡單的界面和相對快速的結(jié)果,選擇 auto-sklearn。另外:該庫與 sklearn 自然集成,可以使用常用的模型和方法,能很好地控制時間;

如果你的首要任務(wù)是實現(xiàn)高準(zhǔn)確率,并且不需要考慮長時間的訓(xùn)練,則使用 TPOT。額外收獲:為最佳模型輸出 Python 代碼;

如果你的首要任務(wù)是實現(xiàn)高準(zhǔn)確率,依然不需要考慮長時間的訓(xùn)練,也可選擇使用 HyperOpt-sklearn。該庫強調(diào)模型的超參數(shù)優(yōu)化,是否富有成效取決于數(shù)據(jù)集和算法;

如果你需要神經(jīng)網(wǎng)絡(luò)(警告:不要高估它們的能力),就使用 AutoKeras,尤其是以文本或圖像形式出現(xiàn)時。訓(xùn)練確實需要很長時間,但有很多措施可以控制時間和搜索空間大小。
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 自動化
    +關(guān)注

    關(guān)注

    30

    文章

    5880

    瀏覽量

    89045
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3645

    瀏覽量

    51685
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136207
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    現(xiàn)代農(nóng)業(yè)自動化的技術(shù)演進(jìn)與應(yīng)用

    自動化依賴多源傳感網(wǎng)絡(luò)(如土壤濕度、光照、溫濕度傳感器)實時采集環(huán)境數(shù)據(jù),結(jié)合氣象預(yù)報和作物生長模型,通過云端或邊緣計算平臺(如AI芯片)進(jìn)行數(shù)據(jù)分析,
    的頭像 發(fā)表于 09-09 11:38 ?382次閱讀

    天吶!耐達(dá)訊自動化Profibus 集線器讓水質(zhì)分析徹底“改頭換面”

    悄然成為解決這一問題的關(guān)鍵角色。 耐達(dá)訊自動化Profibus 集線器是一專門用于 Profibus 網(wǎng)絡(luò)的連接設(shè)備,它能夠擴展網(wǎng)絡(luò)節(jié)點數(shù)量,增強信號傳輸能力,提高
    的頭像 發(fā)表于 08-26 15:29 ?382次閱讀
    天吶!耐達(dá)訊<b class='flag-5'>自動化</b>Profibus 集線器讓水質(zhì)<b class='flag-5'>分析</b>徹底“改頭換面”

    自動化測試如何繞過Cloudflare驗證碼?Python + Selenium 腳本實戰(zhàn)指南!

    01什么是Cloudflare驗證碼Cloudflare提供網(wǎng)絡(luò)工具,并提供一套全面的安全功能,以保護(hù)網(wǎng)站免受各種在線威脅。Cloudflare驗證碼是一用于區(qū)分人類用戶和自動化機器
    的頭像 發(fā)表于 08-15 10:01 ?853次閱讀
    <b class='flag-5'>自動化</b>測試如何繞過Cloudflare驗證碼?Python + Selenium 腳本實戰(zhàn)指南!

    玉林在線自動測寬儀 自動化產(chǎn)線升級

    包包應(yīng)用廣泛,書包、背包、旅行包等,而包包帶子更是其重要組成部分,在自動化包包產(chǎn)線中,在線自動測寬儀可自動檢測帶寬度,剔除不合格品。并且其是光電測量原理,與材質(zhì)無關(guān),因此可適用于各種
    發(fā)表于 07-23 15:23

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是一家專注于超小型機器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開發(fā)了一獨特的神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 06-28 14:18

    RDMA簡介3之四種子協(xié)議對比

    RDMA協(xié)議共有四種子協(xié)議,分別為InfiniBand、iWARP、RoCE v1和RoCE v2協(xié)議。這四種協(xié)議使用統(tǒng)一的RDMA API,但在具體的網(wǎng)絡(luò)層級實現(xiàn)上有所不同,如圖1所示,接下來將
    發(fā)表于 06-04 16:05

    機器人和自動化的未來(2)

    本文是第二屆電力電子科普征文大賽的獲獎作品,來自西南交通大學(xué)黃雯珂的投稿。3機器人與自動化的未來展望隨著機器人和自動化技術(shù)的不斷進(jìn)步,未來的世界將會是一個高度
    的頭像 發(fā)表于 04-26 08:33 ?579次閱讀
    <b class='flag-5'>機器</b>人和<b class='flag-5'>自動化</b>的未來(2)

    工業(yè)自動化機器視覺技術(shù)的演變和未來發(fā)展趨勢

    機器視覺是一項使機器或工業(yè)設(shè)備能夠解釋和分析視覺數(shù)據(jù)的技術(shù),它將計算機科學(xué)與圖像處理技術(shù)相結(jié)合,實現(xiàn)了自動化的視覺檢查和分析。你也可以把它看
    的頭像 發(fā)表于 03-06 11:39 ?1626次閱讀
    工業(yè)<b class='flag-5'>自動化</b>中<b class='flag-5'>機器</b>視覺技術(shù)的演變和未來發(fā)展趨勢

    HFSS 自動化建模工具

    因工作需求,自己寫的HFSS參數(shù)自動化建模工具,目前只實現(xiàn)了常用的四種模型,可定制,如需可聯(lián)系 qq:1300038043 附件下載鏈接
    發(fā)表于 02-27 17:44

    云計算開發(fā)工具包的功能

    隨著云計算技術(shù)的不斷成熟,越來越多的企業(yè)開始將應(yīng)用和服務(wù)遷移到云端,以享受彈性計算資源、高可用性和成本效益等優(yōu)勢。為了加速這一進(jìn)程,云計算服務(wù)提供商推出了各種開發(fā)工具包。下面,AI部落小編帶您了解云計算開發(fā)工具包的主要功能。
    的頭像 發(fā)表于 02-21 11:02 ?540次閱讀

    IT自動化工具Ansible基礎(chǔ)入門

    Ansible是幫助運維人員實現(xiàn)自動化的最重要的工具之一。
    的頭像 發(fā)表于 02-07 10:00 ?1297次閱讀
    IT<b class='flag-5'>自動化工具</b>Ansible基礎(chǔ)入門

    Labview聲音和振動工具包示例文件Sound Level

    Labview 聲音和振動工具包示例文件,聲壓測試,有模擬和DAQ兩個文件。
    發(fā)表于 01-05 09:15 ?5次下載

    TSP工具包軟件的應(yīng)用說明

    在一個需要快速開發(fā)測試的行業(yè)中,有效的自動化和便捷代碼的開發(fā)需求比以往任何時候都顯得更加突出。企業(yè)在努力提高產(chǎn)品質(zhì)量的同時,更需要尋求更短的上市時間,合適的工具正是實現(xiàn)這一目標(biāo)的關(guān)鍵
    的頭像 發(fā)表于 01-03 15:53 ?3271次閱讀
    TSP<b class='flag-5'>工具包</b>軟件的應(yīng)用說明

    【「具身智能機器人系統(tǒng)」閱讀體驗】2.具身智能機器人大模型

    引入GPT這樣的大模型后,情況發(fā)生了根本性的變化。只需提供適當(dāng)?shù)奶崾驹~以及封裝好的機器人函數(shù)庫,大模型便能靈活地生成控制代碼,極大地簡化了開發(fā)過程,并提高了自動化水平。 此外,大
    發(fā)表于 12-29 23:04

    最新Simplicity SDK軟件開發(fā)工具包發(fā)布

    最新的SimplicitySDK軟件開發(fā)工具包已經(jīng)發(fā)布!此次更新針對SiliconLabs(芯科科技)第二代無線開發(fā)平臺帶來了包括藍(lán)牙6.0的信道探測(Channel Sounding
    的頭像 發(fā)表于 12-24 09:47 ?1453次閱讀