chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能科普:數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用

如意 ? 來(lái)源:機(jī)器之心 ? 作者:機(jī)器之心 ? 2020-10-15 11:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

ML Ops 是 AI 領(lǐng)域中一個(gè)相對(duì)較新的概念,可解釋為「機(jī)器學(xué)習(xí)操作」。如何更好地管理數(shù)據(jù)科學(xué)家和操作人員,以便有效地開(kāi)發(fā)、部署和監(jiān)視模型?其中數(shù)據(jù)質(zhì)量至關(guān)重要。

本文將介紹 ML Ops,并強(qiáng)調(diào)數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用。

ML Ops 的發(fā)展彌補(bǔ)了機(jī)器學(xué)習(xí)與傳統(tǒng)軟件工程之間的差距,而數(shù)據(jù)質(zhì)量是 ML Ops 工作流的關(guān)鍵,可以加速數(shù)據(jù)團(tuán)隊(duì),并維護(hù)對(duì)數(shù)據(jù)的信任。

什么是 ML Ops

ML Ops 這個(gè)術(shù)語(yǔ)從 DevOps 演變而來(lái)。

DevOps 是一組過(guò)程、方法與系統(tǒng)的統(tǒng)稱,用于促進(jìn)開(kāi)發(fā)(應(yīng)用程序 / 軟件工程)、技術(shù)運(yùn)營(yíng)和質(zhì)量保障(QA)部門(mén)之間的溝通、協(xié)作與整合。DevOps 旨在重視軟件開(kāi)發(fā)人員(Dev)和 IT 運(yùn)維技術(shù)人員(Ops)之間溝通合作的文化、運(yùn)動(dòng)或慣例。透過(guò)自動(dòng)化軟件交付和架構(gòu)變更的流程,來(lái)使得構(gòu)建、測(cè)試、發(fā)布軟件能夠更加地快捷、頻繁和可靠。

而 MLOps 基于可提高工作流效率的 DevOps 原理和做法,例如持續(xù)集成、持續(xù)交付和持續(xù)部署。ML Ops 將這些原理應(yīng)用到機(jī)器學(xué)習(xí)過(guò)程,其目標(biāo)是:

更快地試驗(yàn)和開(kāi)發(fā)模型

更快地將模型部署到生產(chǎn)環(huán)境

質(zhì)量保證

DevOps 的常用示例是使用多種工具對(duì)代碼進(jìn)行版本控制,如 git、代碼審查、持續(xù)集成(CI,即頻繁地將代碼合并到共享主線中)、自動(dòng)測(cè)試和持續(xù)部署(CD,即自動(dòng)將代碼合并到生產(chǎn)環(huán)境)。

在應(yīng)用于機(jī)器學(xué)習(xí)時(shí),ML Ops 旨在確保模型輸出質(zhì)量的同時(shí),加快機(jī)器學(xué)習(xí)模型的開(kāi)發(fā)和生產(chǎn)部署。但是,與軟件開(kāi)發(fā)不同,ML 需要處理代碼和數(shù)據(jù):

機(jī)器學(xué)習(xí)始于數(shù)據(jù),而數(shù)據(jù)來(lái)源不同,需要用代碼對(duì)不同來(lái)源數(shù)據(jù)進(jìn)行清洗、轉(zhuǎn)換和存儲(chǔ)。

然后,將處理好的數(shù)據(jù)提供給數(shù)據(jù)科學(xué)家,數(shù)據(jù)科學(xué)家進(jìn)行代碼編寫(xiě),完成特征工程、開(kāi)發(fā)、訓(xùn)練和測(cè)試機(jī)器學(xué)習(xí)模型,最終將這些模型部署到生產(chǎn)環(huán)境中。

在生產(chǎn)中,ML 模型是以代碼的形式存在的,輸入數(shù)據(jù)同樣可以從各種來(lái)源獲取,并創(chuàng)建用于輸入產(chǎn)品和業(yè)務(wù)流程的輸出數(shù)據(jù)。

人工智能科普:數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用

雖然上文的描述對(duì)該過(guò)程進(jìn)行了簡(jiǎn)化,但是仍然可以看出代碼和數(shù)據(jù)在 ML 環(huán)境中是緊密耦合的,而 ML Ops 需要兼顧兩者。

具體來(lái)說(shuō),這意味著 ML Ops 包含以下任務(wù):

對(duì)用于數(shù)據(jù)轉(zhuǎn)換和模型定義的代碼進(jìn)行版本控制;

在投入生產(chǎn)之前,對(duì)所獲取的數(shù)據(jù)和模型代碼進(jìn)行自動(dòng)測(cè)試;

在穩(wěn)定且可擴(kuò)展的環(huán)境中將模型部署到生產(chǎn)中;

監(jiān)控模型性能和輸出。

數(shù)據(jù)測(cè)試和文檔記錄如何適配 ML Ops?

ML Ops 旨在加速機(jī)器學(xué)習(xí)模型的開(kāi)發(fā)和生產(chǎn)部署,同時(shí)確保模型輸出的質(zhì)量。當(dāng)然,對(duì)于數(shù)據(jù)質(zhì)量人員來(lái)說(shuō),要實(shí)現(xiàn) ML 工作流中各個(gè)階段的加速和質(zhì)量,數(shù)據(jù)測(cè)試和文檔記錄是非常重要的:

在利益相關(guān)者方面,質(zhì)量差的數(shù)據(jù)會(huì)影響他們對(duì)系統(tǒng)的信任,從而對(duì)基于該系統(tǒng)做出決策產(chǎn)生負(fù)面影響。甚至更糟的是,未引起注意的數(shù)據(jù)質(zhì)量問(wèn)題可能導(dǎo)致錯(cuò)誤的結(jié)論,并糾正這些問(wèn)題又會(huì)浪費(fèi)很多時(shí)間。

在工程方面,急于修復(fù)下游消費(fèi)者注意到的數(shù)據(jù)質(zhì)量問(wèn)題,是消耗團(tuán)隊(duì)時(shí)間并緩慢侵蝕團(tuán)隊(duì)生產(chǎn)力和士氣的頭號(hào)問(wèn)題之一。

此外,數(shù)據(jù)文檔記錄對(duì)于所有利益相關(guān)者進(jìn)行數(shù)據(jù)交流、建立數(shù)據(jù)合同至關(guān)重要。

下文將從非常抽象的角度介紹 ML pipeline 中的各個(gè)階段,并討論數(shù)據(jù)測(cè)試和文檔記錄如何適應(yīng)每個(gè)階段。

1. 數(shù)據(jù)獲取階段

即使是在數(shù)據(jù)集處理的早期階段,從長(zhǎng)遠(yuǎn)來(lái)看,對(duì)數(shù)據(jù)進(jìn)行質(zhì)量檢查和文檔記錄可以極大地加速操作。對(duì)于工程師來(lái)說(shuō),可靠的數(shù)據(jù)測(cè)試非常重要,可以使他們安全地對(duì)數(shù)據(jù)獲取 pipeline 進(jìn)行更改,而不會(huì)造成不必要的問(wèn)題。同時(shí),當(dāng)從內(nèi)部和外部上游來(lái)源獲取數(shù)據(jù)時(shí),為了確保數(shù)據(jù)出現(xiàn)未預(yù)料的更改,在獲取階段進(jìn)行數(shù)據(jù)驗(yàn)證是非常重要的。

2. 模型開(kāi)發(fā)

本文將特征工程、模型訓(xùn)練和模型測(cè)試作為核心模型開(kāi)發(fā)流程的一部分。在這個(gè)不斷迭代的過(guò)程中,圍繞數(shù)據(jù)轉(zhuǎn)換代碼和支持?jǐn)?shù)據(jù)科學(xué)家的模型輸出提供支持,因此在一個(gè)地方進(jìn)行更改不會(huì)破壞其他地方的內(nèi)容。

在傳統(tǒng)的 DevOps 中,通過(guò) CI/CD 工作流進(jìn)行持續(xù)的測(cè)試,可以快速地找出因代碼修改而引入的任何問(wèn)題。更進(jìn)一步,大多數(shù)軟件工程團(tuán)隊(duì)要求開(kāi)發(fā)人員不僅要使用現(xiàn)有的測(cè)試來(lái)測(cè)試代碼,還要在創(chuàng)建新功能時(shí)添加新的測(cè)試。同樣,運(yùn)行測(cè)試以及編寫(xiě)新的測(cè)試應(yīng)該是 ML 模型開(kāi)發(fā)過(guò)程的一部分。

3. 在生產(chǎn)中運(yùn)行模型

與所有 ML Ops 一樣,在生產(chǎn)環(huán)境中運(yùn)行的模型依賴于代碼和輸入數(shù)據(jù),來(lái)產(chǎn)生可靠的結(jié)果。與數(shù)據(jù)獲取階段類(lèi)似,我們需要保護(hù)數(shù)據(jù)輸入,以避免由于代碼更改或?qū)嶋H數(shù)據(jù)更改而引起的不必要問(wèn)題。同時(shí),我們還應(yīng)該圍繞模型輸出進(jìn)行一些測(cè)試,以確保模型繼續(xù)滿足我們的期望。

尤其是在具有黑盒 ML 模型的環(huán)境中,建立和維護(hù)質(zhì)量標(biāo)準(zhǔn)對(duì)于模型輸出至關(guān)重要。同樣地,在共享區(qū)域記錄模型的預(yù)期輸出可以幫助數(shù)據(jù)團(tuán)隊(duì)和利益相關(guān)者定義和傳達(dá)「數(shù)據(jù)合同」,從而增加 ML pipeline 的透明度和信任度。

人工智能科普:數(shù)據(jù)質(zhì)量在 ML Ops 工作流中的關(guān)鍵作用

原文鏈接:https://greatexpectations.io/blog/ml-ops-data-quality/
責(zé)編AJX

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7315

    瀏覽量

    94043
  • 人工智能
    +關(guān)注

    關(guān)注

    1813

    文章

    49776

    瀏覽量

    261848
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8541

    瀏覽量

    136268
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    標(biāo)貝科技參編《人工智能質(zhì)量數(shù)據(jù)集建設(shè)指南》

    人工智能邁入“數(shù)據(jù)驅(qū)動(dòng)”的關(guān)鍵發(fā)展階段,高質(zhì)量數(shù)據(jù)集已成為突破技術(shù)瓶頸、推動(dòng)產(chǎn)業(yè)落地的核心引擎。日前,中國(guó)信息通信研究院
    的頭像 發(fā)表于 09-11 17:19 ?709次閱讀

    利用超微型 Neuton ML 模型解鎖 SoC 邊緣人工智能

    nRF52805),只占用幾千字節(jié)的非易失性存儲(chǔ)器(NVM)。這使得以前被認(rèn)為不可能的應(yīng)用也能增加 ML 功能。例如,您現(xiàn)在可以廣泛的傳感器網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)上進(jìn)行人工智能處理,而在這種網(wǎng)絡(luò)
    發(fā)表于 08-31 20:54

    挖到寶了!人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器

    ,技術(shù)自主可控 如今這個(gè)科技競(jìng)爭(zhēng)激烈的時(shí)代,國(guó)產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實(shí)驗(yàn)箱就做到了這一點(diǎn),采用國(guó)產(chǎn)化硬件,積極推進(jìn)全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國(guó)產(chǎn)化進(jìn)程,把國(guó)產(chǎn)自主可控的軟硬件平臺(tái)
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實(shí)驗(yàn)箱,高校新工科的寶藏神器!

    ,技術(shù)自主可控 如今這個(gè)科技競(jìng)爭(zhēng)激烈的時(shí)代,國(guó)產(chǎn)化硬件的重要性不言而喻。比鄰星人工智能綜合實(shí)驗(yàn)箱就做到了這一點(diǎn),采用國(guó)產(chǎn)化硬件,積極推進(jìn)全行業(yè)產(chǎn)業(yè)鏈上下游環(huán)節(jié)的國(guó)產(chǎn)化進(jìn)程,把國(guó)產(chǎn)自主可控的軟硬件平臺(tái)
    發(fā)表于 08-07 14:23

    關(guān)于人工智能處理器的11個(gè)誤解

    應(yīng)用,以及哪些是真實(shí)情況而哪些只是炒作,仍存在諸多誤解。GPU是最佳的人工智能處理器盡管GPU人工智能的實(shí)現(xiàn)過(guò)程中發(fā)揮了關(guān)鍵作用,而且如今它們的應(yīng)用也極為廣泛,但將其推
    的頭像 發(fā)表于 08-07 13:21 ?897次閱讀
    關(guān)于<b class='flag-5'>人工智能</b>處理器的11個(gè)誤解

    超小型Neuton機(jī)器學(xué)習(xí)模型, 在任何系統(tǒng)級(jí)芯片(SoC)上解鎖邊緣人工智能應(yīng)用.

    可以廣泛的傳感器網(wǎng)絡(luò)的每個(gè)節(jié)點(diǎn)上進(jìn)行人工智能處理,而在這種網(wǎng)絡(luò),傳感器的尺寸和成本是關(guān)鍵,空間也非常寶貴。
    發(fā)表于 07-31 11:38

    辰達(dá)MOSFETDC-DC變換器關(guān)鍵作用與優(yōu)化策略

    一、MOSFETDC-DC變換器關(guān)鍵作用開(kāi)關(guān)功能DC-DC變換器的核心工作原理是通過(guò)高頻開(kāi)關(guān)操作將輸入直流電壓轉(zhuǎn)換為所需的輸出直流電壓。MOSFET作為開(kāi)關(guān)元件,在此過(guò)程
    的頭像 發(fā)表于 07-02 10:04 ?495次閱讀
    辰達(dá)MOSFET<b class='flag-5'>在</b>DC-DC變換器<b class='flag-5'>中</b>的<b class='flag-5'>關(guān)鍵作用</b>與優(yōu)化策略

    工業(yè)相機(jī)焊縫跟蹤關(guān)鍵作用有哪些

    與形態(tài),幫助系統(tǒng)動(dòng)態(tài)調(diào)整焊槍軌跡,實(shí)現(xiàn)高精度、高效率的自動(dòng)化焊接,今天一起了解工業(yè)相機(jī)焊縫跟蹤關(guān)鍵作用有哪些。 焊接挑戰(zhàn)與視覺(jué)需求 傳統(tǒng)焊接
    的頭像 發(fā)表于 05-13 17:56 ?557次閱讀
    工業(yè)相機(jī)<b class='flag-5'>在</b>焊縫跟蹤<b class='flag-5'>中</b>的<b class='flag-5'>關(guān)鍵作用</b>有哪些

    PoE交換機(jī)安防監(jiān)控系統(tǒng)關(guān)鍵作用

    交換機(jī)安防監(jiān)控系統(tǒng)關(guān)鍵作用。 什么是PoE交換機(jī)? PoE交換機(jī)是一種通過(guò)單根以太網(wǎng)線纜同時(shí)為網(wǎng)絡(luò)設(shè)備提供數(shù)據(jù)傳輸和電源的設(shè)備,常用于IP攝像機(jī)、無(wú)線接入點(diǎn)(AP)和VoI
    發(fā)表于 03-24 16:41

    30KPA150A單向二極管電路設(shè)計(jì)關(guān)鍵作用

    30KPA150A單向二極管電路設(shè)計(jì)關(guān)鍵作用
    的頭像 發(fā)表于 03-12 14:46 ?548次閱讀
    30KPA150A單向二極管<b class='flag-5'>在</b>電路設(shè)計(jì)<b class='flag-5'>中</b>的<b class='flag-5'>關(guān)鍵作用</b>

    PCBA加工質(zhì)量保障:SMT鋼網(wǎng)的那些關(guān)鍵作用你知道嗎?

    。而在SMT加工過(guò)程,鋼網(wǎng)的使用是保證焊膏精確涂布、提升產(chǎn)品質(zhì)量關(guān)鍵技術(shù)之一。了解SMT鋼網(wǎng)的作用,能夠幫助企業(yè)優(yōu)化生產(chǎn)流程,減少不良品率,并提高整體生產(chǎn)效率。 ? SMT鋼網(wǎng)
    的頭像 發(fā)表于 03-07 09:37 ?1208次閱讀

    水穩(wěn)拌合站智能監(jiān)測(cè)管理系統(tǒng)水穩(wěn)拌合站質(zhì)量管理起到關(guān)鍵作用

    分析和統(tǒng)計(jì)展示功能,成為提升水穩(wěn)站質(zhì)量的重要技術(shù)工具。本文將探討智能監(jiān)測(cè)管理系統(tǒng)水穩(wěn)站關(guān)鍵作用,并分析其系統(tǒng)優(yōu)勢(shì)。 ??????1、
    的頭像 發(fā)表于 02-19 09:13 ?560次閱讀

    AI工作流自動(dòng)化是做什么的

    AI工作流自動(dòng)化是指利用人工智能技術(shù),對(duì)工作流的重復(fù)性、規(guī)則明確的任務(wù)進(jìn)行自動(dòng)化處理的過(guò)程。那么,AI工作流自動(dòng)化是做什么的呢?接下來(lái),
    的頭像 發(fā)表于 01-06 17:57 ?1463次閱讀

    2025年人工智能在工程領(lǐng)域的應(yīng)用趨勢(shì)

    人工智能在重塑工程范式方面發(fā)揮著關(guān)鍵作用,它提供的工具和方法可提高各個(gè)領(lǐng)域的精度、效率和適應(yīng)性。想要在人工智能競(jìng)賽中保持領(lǐng)先的工程領(lǐng)導(dǎo)者應(yīng)該關(guān)注四個(gè)關(guān)鍵領(lǐng)域的進(jìn)步:生成式
    的頭像 發(fā)表于 12-27 15:40 ?2193次閱讀

    【「具身智能機(jī)器人系統(tǒng)」閱讀體驗(yàn)】+數(shù)據(jù)具身人工智能的價(jià)值

    嵌入式人工智能(EAI)將人工智能集成到機(jī)器人等物理實(shí)體,使它們能夠感知、學(xué)習(xí)環(huán)境并與之動(dòng)態(tài)交互。這種能力使此類(lèi)機(jī)器人能夠人類(lèi)社會(huì)中有效地提供商品及服務(wù)。
    發(fā)表于 12-24 00:33