chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

讓機器學習更容易的14種自由開源軟件工具

如意 ? 來源:今日頭條 ? 作者:云智時代 ? 2020-09-29 15:00 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

通過一些易于實現(xiàn)的多樣化庫和框架能夠充分挖掘機器學習的預測能力。垃圾郵件過濾,面部識別,推薦引擎等等。當你要對大型數(shù)據(jù)集執(zhí)行預測分析或模式識別時,機器學習都是必經(jīng)之路。

自由開源軟件的激增,讓機器學習更容易在單機上大規(guī)模地通過大多數(shù)流行的編程語言實現(xiàn)。以下這些開源工具包括了適用于Python,R,C ++,Java,Scala,Clojure,JavaScript和Go之類的庫。

Apache Mahout

Apache Mahout提供了一種構(gòu)建用于托管機器學習應用程序環(huán)境的方法,該環(huán)境可以快速有效地擴展來滿足需求。

Mahout主要與Apache Spark一起工作,最初是為了運行分布式應用程序而設計,可以與Hadoop一起使用,但現(xiàn)在已擴展為與Flink和H2O等其他分布式后端一起使用。

Mahout在Scala中使用了一種域特定語言。版本0.14是對該項目做了主要內(nèi)部重構(gòu),默認基于Apache Spark 2.4.3。

Compose

Compose針對機器學習模型的一個常見問題,即標記原始數(shù)據(jù),這可能是一個緩慢而乏味的過程,但沒有它,機器學習模型就無法提供有用的結(jié)果。

通過Compose,用戶可以使用Python為數(shù)據(jù)編寫一組標記功能,因此可以通過編程方式進行標記??梢栽跀?shù)據(jù)上設置各種變換和閾值,以簡化標記過程。

Core ML Tools

Apple的Core ML框架能夠讓用戶將機器學習模型集成到應用程序中,但使用其自己獨特的學習模型格式。但幸運的是,不必以Core ML格式預先訓練模型就能使用它們;可以使用Core ML Tools將幾乎所有常用的機器學習框架中的模型轉(zhuǎn)換為Core ML。

Core ML Tools作為Python包運行,因此與大量的Python機器學習庫和工具集成在一起。TensorFlow,PyTorch,Keras,Caffe,ONNX,Scikit-learn,LibSVM和XGBoost的模型都可以轉(zhuǎn)換。神經(jīng)網(wǎng)絡模型還可以通過使用訓練后量化來優(yōu)化大小。

Cortex

Cortex提供了一種方便的方法來使用Python和TensorFlow,PyTorch,Scikit-learn和其他模型提供來自機器學習模型的預測服務。大多數(shù)Cortex軟件包僅包含幾個文件,即你的核心Python邏輯,描述要使用的模型,以及要分配的計算資源類型的cortex.yaml文件,以及用于安裝任何所需Python要求的require.txt文件。

整個程序包作為Docker容器部署到AWS或另一個與Docker兼容的托管系統(tǒng)。計算資源的分配方式與在Kubernetes中使用的定義相呼應,因此你可以使用GPU或Amazon Inferentia ASIC加快服務速度。

Featuretools

特征工程或特征創(chuàng)建涉及獲取用于訓練機器學習模型的數(shù)據(jù),并通常手動生成數(shù)據(jù)的經(jīng)過轉(zhuǎn)換和聚合的版本,這對于訓練模型更為有用。

Featuretools為用戶提供了通過綜合數(shù)據(jù)幀中的數(shù)據(jù)而構(gòu)建的高級Python對象來執(zhí)行此操作的功能,并且可以針對從一個或多個數(shù)據(jù)幀中提取的數(shù)據(jù)執(zhí)行此操作。Featuretools還為綜合操作提供了通用原語(例如,time_since_previous提供帶時間戳數(shù)據(jù)實例之間的時間間隔),因此用戶不必自己滾動這些原語。

GoLearn

GoLearn是針對Google Go語言的機器學習庫,其創(chuàng)建的目標是簡化和可定制性。簡單之處在于在庫中加載和處理數(shù)據(jù)的方式,該方式在SciPy和R之后進行了模式化??啥ㄖ菩栽谟谌绾卧趹贸绦蛑休p松擴展某些數(shù)據(jù)結(jié)構(gòu)。

Gradio

構(gòu)建機器學習應用程序時的一個常見挑戰(zhàn)是為模型訓練和預測服務機制構(gòu)建可靠且易于定制的UI。Gradio提供了用于創(chuàng)建基于Web的UI的工具,這些工具讓用戶可以與模型進行實時交互。

其中包括幾個示例項目,例如Inception V3圖像分類器的輸入接口或MNIST手寫識別模型,讓用戶對如何在自己的項目中使用Gradio有所了解。

H2O

H2O目前正在進行第三次大修訂,它為內(nèi)存中的機器學習提供了一個完整的平臺,從訓練到服務預測。H2O的算法適合于業(yè)務處理——比如欺詐或趨勢預測——而不是圖像分析。H2O可以獨立地與HDFS store交互,在YARN之上,在MapReduce中,或者直接在Amazon EC2實例中。

Hadoop專家可以使用Java與H2O進行交互,但是該框架還提供了針對Python,R和Scala的綁定,從而讓用戶也可以與這些平臺上可用的所有庫進行交互。還可以使用REST調(diào)用,將H2O集成到大多數(shù)管道中。

Oryx

由Cloudera Hadoop發(fā)行版的創(chuàng)建者提供的Oryx,使用Apache Spark和Apache Kafka在實時數(shù)據(jù)上運行機器學習模型。Oryx提供了一種構(gòu)建項目的方式,這些項目需要立即做出決定,例如推薦引擎或?qū)崟r異常檢測,這些都可以通過新數(shù)據(jù)和歷史數(shù)據(jù)獲得通知。

版本2.0對該項目幾乎進行了完全重新設計,其組件以lambda架構(gòu)松散耦合??梢噪S時添加新算法和這些算法的新抽象(例如,用于超參數(shù)選擇)。

PyTorch Lightning

當功能強大的項目流行時,通常會輔以易于使用的第三方項目。PyTorch Lightning為PyTorch提供了組織包裝,因此用戶可以專注于重要的代碼,而不必為每個項目編寫樣板。

PyTorch Lightning使用基于類的結(jié)構(gòu),因此PyTorch項目的每個常見步驟都封裝在類方法中。訓練和驗證循環(huán)是半自動化的,因此你只需要為每個步驟提供邏輯即可。在多個GPU或不同的硬件組合中設置訓練結(jié)果也更加容易,因為這樣做的指令和對象引用是集中的。

Scikit-learn

由于Python易于采用且?guī)缀踹m用于所有應用程序的庫的廣泛性,它已成為數(shù)學科學和統(tǒng)計學的首選編程語言。Scikit-learn通過在幾個現(xiàn)有的Python軟件包(NumPy,SciPy和Matplotlib)之上構(gòu)建數(shù)學和科學工作來利用這一廣度。

生成的庫可用于交互式“工作臺”應用程序或嵌入到其他軟件中并重新使用。該套件可通過BSD許可獲得,因此它是完全開放的,并且可重復使用。

Shogun

Shogun是這個工具中時間最長的項目之一。它創(chuàng)建于1999年,用C ++編寫,但是可以與Java,Python,C#,Ruby,R,Lua,Octave和Matlab一起使用。最新的主要版本6.0.0增加了對微軟Windows和Scala語言的本機支持。

雖然廣受歡迎,范圍廣泛,但Shogun也有競爭對手。另一個基于c++的機器學習庫Mlpack是在2011年才出現(xiàn)的,但是它聲稱比其他庫更快、更容易使用(通過一個更完整的API集)。

Spark MLlib

MLlib是Apache Spark和Apache Hadoop的機器學習庫,擁有許多常用算法和有用的數(shù)據(jù)類型,能夠快速,大規(guī)模地運行。盡管Java是在MLlib中工作的主要語言,但是Python用戶可以將MLlib與NumPy庫連接,Scala用戶可以針對MLlib編寫代碼,而R用戶可以從1.5版開始插入Spark。

MLlib的版本3專注于使用Spark的DataFrame API(與較早的RDD API相對),并提供了許多新的分類和評估功能。

另一個項目,MLbase,建立在MLlib的頂部,以使其更容易得出結(jié)果。用戶無需編寫代碼,而是使用SQL的聲明性語言進行查詢。

Weka

由Waikato大學的機器學習小組創(chuàng)建的Weka被稱為“無需編程的機器學習”。這是一個GUI工作臺,數(shù)據(jù)科學家無需編寫代碼即可組裝機器學習管道,訓練模型和運行預測。

Weka直接與R,Apache Spark和Python合作,后者通過直接包裝或通過通用數(shù)值庫(如NumPy,Pandas,SciPy和Scikit-learn)的接口進行工作。Weka的一大優(yōu)勢在于,它為工作的各個方面提供了可瀏覽的友好界面,包括包裝管理,預處理,分類和可視化。
責編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 編程
    +關注

    關注

    90

    文章

    3709

    瀏覽量

    96815
  • 機器學習
    +關注

    關注

    66

    文章

    8541

    瀏覽量

    136268
  • 開源工具
    +關注

    關注

    0

    文章

    27

    瀏覽量

    4737
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    國內(nèi)哪些生成式 AI 工具容易上手?企業(yè)真正看重的是“能馬上用起來”

    生成式 AI 工具在國內(nèi)越來越多,但企業(yè)真正關心的問題并不是“誰的模型更大”“誰的 API 更多”,而是一個現(xiàn)實的問題: 到底哪類工具容易在公司里用起來? 過去一年里,無論是市場部
    的頭像 發(fā)表于 12-08 10:55 ?161次閱讀

    TQKIT開發(fā)板工具系統(tǒng)功能調(diào)用簡單

    TQKIT開發(fā)板工具,將復雜的系統(tǒng)控制能力以接口形式開放給開發(fā)者,系統(tǒng)功能調(diào)用簡單。
    的頭像 發(fā)表于 12-08 09:27 ?164次閱讀
    TQKIT開發(fā)板<b class='flag-5'>工具</b><b class='flag-5'>讓</b>系統(tǒng)功能調(diào)用<b class='flag-5'>更</b>簡單

    人工智能AI必備的5款開源軟件推薦!

    開發(fā)領域里幾乎“人手必備”的軟件——它們不僅學習更輕松,也產(chǎn)品更快落地。 一、TensorFlow:深度學習界的“老將” 提起智能算法的
    的頭像 發(fā)表于 11-19 15:35 ?185次閱讀
    人工智能AI必備的5款<b class='flag-5'>開源</b><b class='flag-5'>軟件</b>推薦!

    NVIDIA宣布開源Aerial軟件

    NVIDIA 開源其 Aerial 軟件,并將 NVIDIA Sionna 研究套件和 Aerial 測試平臺引入 NVIDIA DGX Spark 平臺,為研究人員提供強大的工具和便捷的訪問途徑,以加速 AI 原生無線創(chuàng)新。
    的頭像 發(fā)表于 11-03 15:14 ?607次閱讀

    遨博機器人以 “專業(yè)智能” 破局,機器人從工業(yè)走向生活

    洪帥接受智博專訪,深入分享了企業(yè)在技術迭代、場景落地與未來布局上的思考。 從 “單一工具” 到 “智能體”,“具身智能” 重構(gòu)機器人價值 “今年遨博的躍進,能用‘專業(yè)’和‘智能’兩
    的頭像 發(fā)表于 10-12 20:50 ?303次閱讀

    思必馳天穹3.0交互自由隨心

    作為全屋智能語音交互系統(tǒng),天穹3.0基于思必馳中樞大模型構(gòu)建,融合了全鏈路語音交互技術,采用“云端 + SDK”架構(gòu),云端有多個大模型協(xié)同運行,能夠高效解決全屋智控場景中的諸多問題,為用戶提供自由、隨心的語音交互體驗,家居生活更美好。
    的頭像 發(fā)表于 07-01 14:44 ?718次閱讀

    開源鴻蒙工程工具分論壇圓滿舉辦

    近日,開源鴻蒙開發(fā)者大會2025(OHDC.2025)工程工具分論壇在深圳圓滿舉辦。本次分論壇由開源鴻蒙IDE SIG組長、華為終端BG工程工具技術專家唐春擔任出品人,主題為“
    的頭像 發(fā)表于 06-05 15:35 ?838次閱讀

    大象機器人攜手進迭時空推出 RISC-V 全棧開源六軸機械臂產(chǎn)品

    末端執(zhí)行器。 全棧開源 從RISC-V指令集、芯片SDK到機器人控制代碼100%開放,開發(fā)者可自由定制算法與控制邏輯。 官方apt倉庫提供deepseek-r1-distill-qwen-1.5b
    發(fā)表于 04-25 17:59

    開源項目!教你如何制作一個開源教育機械臂

    前言 我們的計劃始于2016年,當時有一個簡單的問題:我們?nèi)绾?b class='flag-5'>讓機器人和編程對每個人都可用? 是學習電子和編程的最佳工具之一,但使用帶有有線組件的試驗板對初學者來說可能具有挑戰(zhàn)性。為了
    發(fā)表于 03-10 11:22

    開源安全領航者!華為云 CodeArts Governance 構(gòu)建安全的軟件開發(fā)生命周期

    華為云 CodeArts Governance開源治理服務是針對軟件研發(fā)提供的一站式開源軟件治理平臺,從合法合規(guī)、網(wǎng)絡安全、供應安全等維度消減開源
    的頭像 發(fā)表于 02-12 16:50 ?3109次閱讀
    <b class='flag-5'>開源</b>安全領航者!華為云 CodeArts Governance 構(gòu)建<b class='flag-5'>更</b>安全的<b class='flag-5'>軟件</b>開發(fā)生命周期

    為什么要費這么大勁機器人像人一樣,而不是實用的形態(tài)?

    基礎設施兼容性 :人類社會的物理環(huán)境(樓梯、門把手、工具、家具等)是為人體結(jié)構(gòu)和動作設計的。人形機器容易直接融入這些環(huán)境,無需大規(guī)模改造基礎設施。 操作便利性 :人形
    的頭像 發(fā)表于 02-10 10:03 ?1083次閱讀

    醫(yī)院智慧,決策容易

    依托數(shù)字孿生技術,賦能智慧醫(yī)院,對使用者和決策者帶來了眾多的優(yōu)勢。數(shù)字孿生技術是將物理實體與數(shù)字模型相結(jié)合,實現(xiàn)實時監(jiān)測、仿真預測和智能決策的一先進技術。在智慧醫(yī)院中應用數(shù)字孿生技術,不僅可以提升醫(yī)療服務的質(zhì)量和效率,還可以促進醫(yī)學科研和醫(yī)療管理的創(chuàng)新發(fā)展。
    的頭像 發(fā)表于 02-06 16:51 ?454次閱讀

    嵌入式機器學習的應用特性與軟件開發(fā)環(huán)境

    設備和智能傳感器)上,這些設備通常具有有限的計算能力、存儲空間和功耗。本文將您介紹嵌入式機器學習的應用特性,以及常見的機器學習開發(fā)軟件與開發(fā)
    的頭像 發(fā)表于 01-25 17:05 ?1240次閱讀
    嵌入式<b class='flag-5'>機器</b><b class='flag-5'>學習</b>的應用特性與<b class='flag-5'>軟件</b>開發(fā)環(huán)境

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數(shù)據(jù)的機器學習方法。盡管深度學習(一般指神經(jīng)網(wǎng)絡算法)是一個強大的工具,目前也非常流行,但它的應用領域仍然有限。與深度學習相比
    的頭像 發(fā)表于 12-30 09:16 ?1992次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習</b>方法和應用指導

    開源項目!OpenCat—— 一個全能的平價四足機器

    感到厭倦?,F(xiàn)在孩子們可以在一新型玩具上學習物理和編程。機器人專家可以在一個便宜得多的平臺上專注于他們的行走算法。軟件開發(fā)人員可以在一個寵物般的機器
    發(fā)表于 12-16 11:44