chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

云計算機器學(xué)習(xí)平臺的標配功能及選購指南

如意 ? 來源:企業(yè)網(wǎng)D1Net ? 作者:Martin Heller ? 2020-08-18 11:27 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

云計算機器學(xué)習(xí)平臺提供的多種功能可以支持完整的機器學(xué)習(xí)生命周期。

為了創(chuàng)建有效的機器學(xué)習(xí)和深度學(xué)習(xí)模型,組織需要獲取大量的數(shù)據(jù),并對其執(zhí)行特征工程的方法,以及在合理的時間內(nèi)訓(xùn)練數(shù)據(jù)模型的方法。然后,組織需要一種方法來部署模型,監(jiān)視它們是否隨時間的推移而改變,以及根據(jù)需要重新訓(xùn)練它們。

如果組織已經(jīng)在計算資源和加速器(例如GPU)上進行了投資,則可以在內(nèi)部部署基礎(chǔ)設(shè)施完成所有這些操作,但是可能會發(fā)現(xiàn),如果資源足夠,它們在很多時間都處于閑置狀態(tài)。另一方面,有時在云平臺中運行整個管道,根據(jù)需要使用大量計算資源和加速器,然后釋放它們,可能更具成本效益。

主要的云計算提供商(以及其他云計算提供商)已投入大量精力來構(gòu)建其機器學(xué)習(xí)平臺,以支持從計劃項目到維護生產(chǎn)模型的完整機器學(xué)習(xí)生命周期。組織如何確定哪些云平臺可以滿足其需求?每個端到端機器學(xué)習(xí)平臺都應(yīng)提供以下12種功能。

1.接近自己的數(shù)據(jù)

如果組織擁有建立精確模型所需的大量數(shù)據(jù),則不希望將其傳輸?shù)绞澜绺鞯亍_@里的問題并不是距離,而是時間:數(shù)據(jù)傳輸速度最終受到光速限制,即使在帶寬無限的完美網(wǎng)絡(luò)上也是如此。長距離意味著等待時間更長。

對于非常大的數(shù)據(jù)集,理想的情況是在已經(jīng)存在數(shù)據(jù)的地方建立模型,從而不需要傳輸大量數(shù)據(jù)。一些數(shù)據(jù)庫在一定程度上支持這一點。

下一個最佳情況是數(shù)據(jù)與模型構(gòu)建軟件位于同一高速網(wǎng)絡(luò)上,這通常意味著在同一數(shù)據(jù)中心內(nèi)。如果組織擁有TB或更大容量的數(shù)據(jù),即使將數(shù)據(jù)從一個數(shù)據(jù)中心遷移到云計算可用性區(qū)域內(nèi)的另一個數(shù)據(jù)中心,也可能會造成嚴重的延遲。組織可以通過執(zhí)行增量更新來緩解這種情況。

最壞的情況是,組織必須在帶寬受限和高延遲的路徑上遠程移動大量數(shù)據(jù)。而在這方面,澳大利亞為此部署的跨太平洋電纜的工程令人驚嘆。

2.支持ETL或ELT管道

ETL(導(dǎo)出、轉(zhuǎn)換和加載)和ELT(導(dǎo)出、加載和轉(zhuǎn)換)是數(shù)據(jù)庫領(lǐng)域中常見的兩種數(shù)據(jù)管道配置。機器學(xué)習(xí)和深度學(xué)習(xí)擴大了對這些內(nèi)容的需求,尤其是轉(zhuǎn)換部分。當轉(zhuǎn)換需要更改時,ELT為組織提供更大的靈活性,因為加載階段通常是大數(shù)據(jù)最耗時的階段。

通常情況下,沒有進行處理的數(shù)據(jù)很嘈雜,需要過濾。此外,這些數(shù)據(jù)的范圍也有所不同:一個變量的最大值可能高達數(shù)百萬,而另一個變量的范圍可能是-0.1至-0.001。對于機器學(xué)習(xí)來說,必須將其變量轉(zhuǎn)換為標準化的范圍,以防止較大范圍的變量控制模型。具體的標準化范圍取決于模型使用的算法。

3.支持在線環(huán)境進行模型構(gòu)建

傳統(tǒng)的觀點是,組織應(yīng)該將數(shù)據(jù)導(dǎo)入桌面設(shè)備以進行模型構(gòu)建。建立良好的機器學(xué)習(xí)和深度學(xué)習(xí)模型所需的大量數(shù)據(jù)改變了局面:組織可以將一小部分數(shù)據(jù)樣本下載到桌面設(shè)備上,以進行探索性數(shù)據(jù)分析和模型構(gòu)建,但是對于生產(chǎn)模型,則需要訪問完整的模型數(shù)據(jù)。

Jupyter Notebooks、JupyterLab和Apache Zeppelin等基于Web的開發(fā)環(huán)境非常適合模型構(gòu)建。如果組織的數(shù)據(jù)與筆記本電腦環(huán)境位于同一云平臺中,則可以對數(shù)據(jù)進行分析,以很大程度地減少數(shù)據(jù)移動的時間。

4.支持擴展訓(xùn)練

除了訓(xùn)練模型之外,筆記本電池的計算和內(nèi)存要求通常很小。如果筆記本可以生成在多個大型虛擬機或容器上運行的訓(xùn)練作業(yè),則將大有幫助。如果訓(xùn)練可以訪問加速器(例如GPU、TPU和FPGA),也將有很大幫助;這些模型可以將數(shù)天的訓(xùn)練過程變成數(shù)小時。

5.支持AutoML和自動特征工程

并不是每個組織都擅長于選擇機器學(xué)習(xí)模型、選擇特征(模型使用的變量),以及從原始觀察中設(shè)計新特征。即使組織擅長這些任務(wù),它們也很耗時,而且可以在很大程度上實現(xiàn)自動化。

AutoML系統(tǒng)經(jīng)常嘗試使用許多模型來查看哪些模型可以產(chǎn)生優(yōu)秀目標函數(shù)值,例如回歸問題的最小平方誤差。出色的AutoML系統(tǒng)還可以執(zhí)行功能工程,并有效地利用它們的資源,以盡可能多的特征集合來追求優(yōu)質(zhì)的模型。

6.支持優(yōu)質(zhì)的機器學(xué)習(xí)和深度學(xué)習(xí)框架

大多數(shù)數(shù)據(jù)科學(xué)家擁有用于機器學(xué)習(xí)和深度學(xué)習(xí)技術(shù)的很喜歡的框架和編程語言。對于喜歡Python的人來說,Scikit學(xué)習(xí)通常是機器學(xué)習(xí)的最愛,而TensorFlow、PyTorch、Keras、MXNet通常是深度學(xué)習(xí)的首選。在Scala中,Spark MLlib往往是機器學(xué)習(xí)的首選。在R中,有許多原生機器學(xué)習(xí)包,以及與Python的良好接口。而在Java中,H2O.ai的評價很高,Java-ML和Deep Java Library也是如此。

云計算機器學(xué)習(xí)和深度學(xué)習(xí)平臺往往擁有自己的算法集合,并且它們通常以至少一種語言或作為具有特定入口點的容器來支持外部框架。在某些情況下,組織可以將自己的算法和統(tǒng)計方法與平臺的AutoML功能集成在一起,這非常方便。

一些云平臺還提供了自己的主要深度學(xué)習(xí)框架的調(diào)整版本。例如,AWS公司擁有TensorFlow的優(yōu)化版本,該公司聲稱可以為深度神經(jīng)網(wǎng)絡(luò)訓(xùn)練提供近乎線性的可擴展性。

7.提供預(yù)訓(xùn)練的模型并支持轉(zhuǎn)移學(xué)習(xí)

并非每個人都希望花費時間和資源來訓(xùn)練自己的模型,而即使當預(yù)訓(xùn)練的模型可用時,他們也不應(yīng)該如此。例如,ImageNet數(shù)據(jù)集非常龐大,并且要針對其訓(xùn)練比較先進的深度神經(jīng)網(wǎng)絡(luò)可能要花費數(shù)周的時間,因此在可能的情況下使用預(yù)先訓(xùn)練的模型是有意義的。

另一方面,經(jīng)過預(yù)訓(xùn)練的模型可能無法始終標識組織關(guān)心的對象。轉(zhuǎn)移學(xué)習(xí)可以幫助組織針對特定數(shù)據(jù)集自定義神經(jīng)網(wǎng)絡(luò)的最后幾層,而無需花費更多時間和資金來訓(xùn)練整個網(wǎng)絡(luò)。

8.提供優(yōu)化的人工智能服務(wù)

主要的云平臺為許多應(yīng)用程序提供了功能強大且經(jīng)過優(yōu)化的人工智能服務(wù),而不僅僅是圖像識別。其示例包括語言翻譯、語音轉(zhuǎn)換到文本、文本轉(zhuǎn)換到語音、預(yù)測和推薦。

這些服務(wù)已經(jīng)經(jīng)過訓(xùn)練和測試,其使用的數(shù)據(jù)量超出了企業(yè)通??色@得的數(shù)據(jù)量。它們還已經(jīng)部署在具有足夠計算資源(包括加速器)的服務(wù)端點上,以確保在全球負載下具有良好的響應(yīng)時間。

9.管理實驗

為組織的數(shù)據(jù)集找到優(yōu)秀模型的唯一方法是嘗試采用所有方法,無論是人工還是使用AutoML。這就留下了另一個問題:管理實驗。

良好的云計算機器學(xué)習(xí)平臺將為組織提供一種方式,可以查看和比較每個實驗的目標函數(shù)值(訓(xùn)練集和測試數(shù)據(jù))以及模型和混淆矩陣的大小。而能夠繪制所有這些圖表具有一定的優(yōu)勢。

10.支持模型部署以進行預(yù)測

一旦組織有了根據(jù)自己的條件選擇優(yōu)秀實驗的方法,就需要一種簡單的方法來部署模型。如果組織出于同一目的部署多個模型,則還需要一種在它們之間分配流量的方法來進行a/b測試。

11.監(jiān)控預(yù)測效果

數(shù)據(jù)隨著世界的變化而變化。這意味著組織無法部署模型而忘記它。與其相反,組織需要監(jiān)視為預(yù)測而提交的數(shù)據(jù)。當數(shù)據(jù)從原始訓(xùn)練數(shù)據(jù)集的基線開始發(fā)生明顯變化時,組織需要重新訓(xùn)練模型。

12.控制成本

最后,組織需要一些方法來控制模型產(chǎn)生的成本。部署用于生產(chǎn)推理的模型通常占到深度學(xué)習(xí)成本的90%,而訓(xùn)練僅占成本的10%。

控制預(yù)測成本的優(yōu)秀方法取決于組織的負載和模型的復(fù)雜性。如果負載很高,則可以使用加速器來避免添加更多虛擬機實例。如果負載可變,則隨著負載的增加或減少,組織可能能夠動態(tài)更改大小或?qū)嵗蛉萜鞯臄?shù)量。而且,如果組織的負載較少,則可以使用帶有部分加速器的非常小的實例來處理預(yù)測。

【編輯推薦】

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 云計算
    +關(guān)注

    關(guān)注

    39

    文章

    8022

    瀏覽量

    144465
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136981
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5599

    瀏覽量

    124406
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    5.8G頻段天線模塊選購指南與應(yīng)用方案解析

    無線通信技術(shù)的升級迭代,5.8G頻段天線模塊的市場需求顯著提升。本文基于權(quán)威數(shù)據(jù)平臺的市場分析,詳細解析5.8G天線模塊的選購指南、主流品牌廠商信息、優(yōu)勢產(chǎn)品以及應(yīng)用方案,為行業(yè)用戶提供全面、科學(xué)的技術(shù)參考。 一、5.8G頻段天線模塊市場
    的頭像 發(fā)表于 02-28 15:27 ?89次閱讀

    工業(yè)邊緣計算機是什么?有什么功能?

    工業(yè)邊緣計算機是部署在工業(yè)現(xiàn)場邊緣側(cè),具備計算、存儲、網(wǎng)絡(luò)能力,能就近處理工業(yè)數(shù)據(jù)并實現(xiàn)快速決策的專用設(shè)備。它通過將算力下沉至靠近數(shù)據(jù)源的位置,減少數(shù)據(jù)傳輸延遲,提升系統(tǒng)實時性和可靠性,成為工業(yè)
    的頭像 發(fā)表于 02-12 14:43 ?571次閱讀

    2025人體紅外感應(yīng)模塊選購指南與傳感器應(yīng)用方案解析

    和應(yīng)用也不斷升級。本文基于權(quán)威市場數(shù)據(jù)平臺的分析,詳細解析人體紅外感應(yīng)模塊的選購指南、主流品牌廠商信息、優(yōu)勢產(chǎn)品以及最新的應(yīng)用方案,為行業(yè)用戶提供全面、客觀的參考。 一、人體紅外感應(yīng)模塊市場發(fā)展概況 人體紅外感應(yīng)技
    的頭像 發(fā)表于 02-05 10:42 ?323次閱讀
    2025人體紅外感應(yīng)模塊<b class='flag-5'>選購指南</b>與傳感器應(yīng)用方案解析

    2025溫濕度變送器選購指南與傳感器應(yīng)用方案解析

    溫濕度變送器作為環(huán)境監(jiān)測和工業(yè)控制領(lǐng)域的重要設(shè)備,廣泛應(yīng)用于農(nóng)業(yè)、醫(yī)療、工業(yè)制造、物聯(lián)網(wǎng)等眾多行業(yè)。2025年,伴隨著傳感器技術(shù)的進一步發(fā)展,溫濕度變送器的性能不斷提升,市場需求也持續(xù)增長。本文將基于權(quán)威數(shù)據(jù)平臺的市場分析,詳細解析溫濕度變送器的選購指南、品牌廠商信息、優(yōu)
    的頭像 發(fā)表于 02-01 10:44 ?828次閱讀

    原子鐘如何選購:一篇專業(yè)的選購指南

    隨著科技的不斷發(fā)展,原子鐘已經(jīng)成為了許多領(lǐng)域中的精密儀器。從科學(xué)研究到日常生活,原子鐘的應(yīng)用越來越廣泛。那么,如何選購一個性能、價格合理的原子鐘呢?本文將為您提供一份詳細的選購指南。一、了解原子鐘
    的頭像 發(fā)表于 12-30 17:42 ?565次閱讀
    原子鐘如何<b class='flag-5'>選購</b>:一篇專業(yè)的<b class='flag-5'>選購指南</b>

    除草機器人氣密性檢測儀選購指南

    ,是質(zhì)量保證的關(guān)鍵。這份割草機器人氣密性檢測儀指南將帶您避開選購中的那些“坑”。一、割草機器人氣密性檢測儀抓住核心:不談精度的選購都是空談對
    的頭像 發(fā)表于 12-08 13:40 ?477次閱讀
    除草<b class='flag-5'>機器</b>人氣密性檢測儀<b class='flag-5'>選購指南</b>

    貿(mào)澤電子開售全新Arduino UNO Q單板計算機

    貿(mào)澤電子開售全新Arduino UNO Q單板計算機。Arduino UNO Q單板計算機(SBC)將高性能計算與實時控制結(jié)合,提供理想的創(chuàng)新平臺。
    的頭像 發(fā)表于 11-08 09:50 ?1364次閱讀

    護理PDA選購指南:2025年醫(yī)院必備的5大核心功能與品牌推薦

    本文深入帶您了解護理PDA對醫(yī)院工作效率與安全的重要性,對比分析國內(nèi)外品牌優(yōu)劣勢,并重點評測國產(chǎn)明星產(chǎn)品鳥鳥N73S護理PDA的醫(yī)療級防護、強悍掃碼、長續(xù)航等核心功能。結(jié)合床邊核對、移動查房等真實場景,為采購人員和護理人員提供一份詳盡的選購指南,助您為醫(yī)院選擇最合適、性價
    的頭像 發(fā)表于 08-22 17:35 ?5594次閱讀
    護理PDA<b class='flag-5'>選購指南</b>:2025年醫(yī)院必備的5大核心<b class='flag-5'>功能</b>與品牌推薦

    自動化計算機經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機的一些好處。1.溫度范圍寬自動化計算機經(jīng)過工程設(shè)計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠在各種不同的極端環(huán)境中運行。自動化計算機能夠
    的頭像 發(fā)表于 07-21 16:44 ?628次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    自動化計算機功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境中的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多
    的頭像 發(fā)表于 07-15 16:32 ?749次閱讀
    自動化<b class='flag-5'>計算機</b>的<b class='flag-5'>功能</b>與用途

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風(fēng)扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)自動化場景中
    的頭像 發(fā)表于 07-10 16:36 ?753次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    2025年G口大帶寬服務(wù)器選購指南:避坑這3點,省下50%成本!

    面對市場上琳瑯滿目的服務(wù)器產(chǎn)品,如何避免踩坑、實現(xiàn)成本與性能的平衡,成為企業(yè)和個人用戶關(guān)注的焦點。本文將從配置需求、避坑要點、成本控制三大維度,為您提供一份客觀、簡潔的2025年G口大帶寬服務(wù)器選購指南
    的頭像 發(fā)表于 07-10 10:17 ?1814次閱讀

    計算機網(wǎng)絡(luò)入門指南

    計算機網(wǎng)絡(luò)是指將地理位置不同且具有獨立功能的多臺計算機及其外部設(shè)備,通過通信線路連接起來,在網(wǎng)絡(luò)操作系統(tǒng)、網(wǎng)絡(luò)管理軟件及網(wǎng)絡(luò)通信協(xié)議的管理和協(xié)調(diào)下,實現(xiàn)資源共享和信息傳遞的計算機系統(tǒng)。
    的頭像 發(fā)表于 04-22 14:29 ?2267次閱讀
    <b class='flag-5'>計算機</b>網(wǎng)絡(luò)入門<b class='flag-5'>指南</b>

    NVIDIA 宣布推出 DGX Spark 個人 AI 計算機

    臺式超級計算機由 NVIDIA Grace Blackwell 驅(qū)動,為開發(fā)者、研究人員和數(shù)據(jù)科學(xué)家提供加速 AI 功能;系統(tǒng)由頭部計算機制造商(包括華碩、Dell Technologies、HP
    發(fā)表于 03-19 09:59 ?792次閱讀
       NVIDIA 宣布推出 DGX Spark 個人 AI <b class='flag-5'>計算機</b>

    英飛凌邊緣AI平臺通過Ultralytics YOLO模型增加對計算機視覺的支持

    計算機視覺的支持,擴大了當前對音頻、雷達和其他時間序列信號數(shù)據(jù)的支持范圍。在增加這項支持后,該平臺將能夠用于開發(fā)低功耗、低內(nèi)存的邊緣AI視覺模型。這將給諸多應(yīng)用領(lǐng)域的機器學(xué)習(xí)開發(fā)人員
    的頭像 發(fā)表于 03-11 15:11 ?818次閱讀
    英飛凌邊緣AI<b class='flag-5'>平臺</b>通過Ultralytics YOLO模型增加對<b class='flag-5'>計算機</b>視覺的支持