chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

找到適用現(xiàn)代機器學習模型的測試和Debug新方法

DPVg_AI_era ? 來源:lp ? 2019-04-08 13:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

傳統(tǒng)的軟件測試和debug方法很難適用于現(xiàn)代的機器學習系統(tǒng),DeepMind希望解決這一問題,開發(fā)面向預測模型的可靠驗證工具。這篇博客描述了能嚴格識別并排除學習預測模型中的錯誤的三種方法:對抗性測試,穩(wěn)健性學習和形式驗證。

自計算機編程誕生以來,軟件開發(fā)中就一直沒有離開過bug。隨著時間的推移,軟件開發(fā)人員已經(jīng)建立了一套在軟件實際發(fā)布前進行測試和debug的最佳方式,但這些方式并不適合現(xiàn)代的深度學習系統(tǒng)。

今天,機器學習的主流方法是在訓練數(shù)據(jù)集上訓練系統(tǒng),然后在另一組數(shù)據(jù)集上進行測試。即使在最壞的情況下,確保系統(tǒng)穩(wěn)健性或高性能也是至關(guān)重要的。本文描述了能夠嚴格識別并排除學習預測模型中的錯誤的三種方法:對抗性測試,穩(wěn)健性學習和形式驗證。

機器學習系統(tǒng)一般是不穩(wěn)健的。即使在特定領(lǐng)域中表現(xiàn)優(yōu)于人類的系統(tǒng),具體情況稍微改變,往往就可能導致無法解決簡單問題。比如圖像擾動的問題:如果在輸入圖像中添加少量精心計算的噪聲,那么本來在圖像分類任務中表現(xiàn)超過人類的的神經(jīng)網(wǎng)絡(luò),很容易將一只樹獺錯認成一輛跑車。

在圖片上加上一個對抗性輸入,可能導致分類器將一只樹懶錯誤識別為一輛跑車。兩個圖像在每個像素上的差異最多只有0.0078。結(jié)果第一張被歸類為三趾樹懶,置信度> 99%。第二個被歸類為一輛跑車,概率> 99%。

其實這不是什么新問題。計算機程序總是有bug。幾十年來,軟件工程師開發(fā)了種類繁多的技術(shù)工具包,從單元測試到形式驗證。這些方法在傳統(tǒng)軟件上運行良好,但是由于這些模型的規(guī)模和缺乏結(jié)構(gòu)性(可能包含數(shù)億個參數(shù)),想用這些方法來嚴格測試神經(jīng)網(wǎng)絡(luò)等機器學習模型是非常困難的。開發(fā)能夠確保機器學習系統(tǒng)在部署時穩(wěn)健性的新方法勢在必行。

程序員的角度來看,與系統(tǒng)的規(guī)范(即預期功能)不一致的任何行為都屬于bug。DeepMind不僅評估了機器學習系統(tǒng)的技術(shù)是否與訓練集和測試集一致,還評估了這些技術(shù)的作用與系統(tǒng)的期望屬性的規(guī)范描述中是否一致。這些屬性可能包括對輸入中足夠小的擾動的穩(wěn)健性,避免災難性故障的安全約束,或產(chǎn)生符合物理定律的預測能力等。

本文討論機器學習社區(qū)面臨的三個重要技術(shù)挑戰(zhàn),因為我們共同致力于嚴格開發(fā)和部署與所需規(guī)格可靠一致的機器學習系統(tǒng):

高效測試實際功能與屬性規(guī)范的一致性。我們探索有效的方法,來測試機器學習系統(tǒng)是否與設(shè)計者和系統(tǒng)用戶所期望的屬性相一致。揭示二者差異的一種方法是在評估期間系統(tǒng)地搜索最壞情況下的結(jié)果。

訓練機器學習模型,使其產(chǎn)生屬性一致的預測。即使有了大量的訓練數(shù)據(jù),標準的機器學習算法也可以產(chǎn)生與理想屬性不一致的預測模型。這要求我們重新考慮訓練算法,這些算法不僅能夠很好地擬合訓練數(shù)據(jù),而且要與屬性列表上的要求保持一致。

正式證明機器學習模型是規(guī)范性一致的。雖然形式驗證領(lǐng)域幾十年來一直在研究這種算法,也取得了令人矚目的進展,但很難輕易擴展到現(xiàn)代深度學習領(lǐng)域。

測試規(guī)范一致性

面對對抗性實例下的穩(wěn)健性問題,是深度學習中研究相對充分的問題。這項工作的一個主要主題是評估模型在強對抗性攻擊下的穩(wěn)健性,以及設(shè)計可有效分析的透明模型。我們發(fā)現(xiàn)許多模型在弱對抗下進行評估時看上去很穩(wěn)健。但遇見針對更強的對抗時,精度幾乎下降為零。

目前大多數(shù)研究都集中在監(jiān)督學習(主要是圖像分類)的背景下,但是需要將這些想法擴展到其他條件。在最近關(guān)于對抗災難性故障方法的研究中,我們將這些想法用于測試確保關(guān)鍵設(shè)置的強化學習智能體上。開發(fā)這類自主系統(tǒng)的挑戰(zhàn)之一是,由于一個錯誤就可能產(chǎn)生嚴重后果,因此即使非常小的失敗概率也是不可接受的。

我們的目標是設(shè)計一個“對手”,能讓我們提前檢測這些故障。與圖像分類器一樣,針對弱攻擊進行評估,很容易產(chǎn)生錯誤的安全感。我們?yōu)閺娀瘜W習對抗性測試開發(fā)了兩種互補的方法。首先,使用無衍生優(yōu)化來對智能體的預期回報進行最小化。接著,學習一種對抗值函數(shù),該函數(shù)根據(jù)經(jīng)驗預測哪種情況最有可能導致智能體的失敗。然后使用此學習函數(shù)進行優(yōu)化,將評估重點放在最有問題的輸入上。這些方法只構(gòu)成了豐富且不斷增長的潛在算法空間的一小部分,我們對能夠?qū)χ悄荏w的未來發(fā)展進行嚴格評估感到興奮。

這兩種方法已經(jīng)比隨機測試產(chǎn)生了很大的改進,可以在幾分鐘內(nèi)檢測到過去需要花費數(shù)天才能發(fā)現(xiàn)(甚至完全無法發(fā)現(xiàn))的問題。我們還發(fā)現(xiàn),對抗性測試可能會發(fā)現(xiàn)我們的智能體出現(xiàn)了與隨機測試集的評估結(jié)果性質(zhì)不同的行為。

在對抗性環(huán)境下,我們發(fā)現(xiàn)執(zhí)行3D導航任務的智能體仍然無法在十分簡單的迷宮中完全找到目標,即使它們在非對抗性環(huán)境下的平均表現(xiàn)已經(jīng)和人類相當。此外,我們需要設(shè)計能夠抵御自然故障的系統(tǒng)。

在隨機抽樣中,我們幾乎從來沒觀察到具有高失敗概率的地圖,但是在對抗性測試下,這樣的地圖確實存在。即使在去掉了許多墻壁之后,智能體在這些地圖下的失敗概率仍然很高。

訓練規(guī)范一致性的模型

對抗性測試是為了找到違背規(guī)范的反例。因此往往會高估模型與這些規(guī)范的一致性。在數(shù)學上,規(guī)范是必須在神經(jīng)網(wǎng)絡(luò)的輸入和輸出之間保持的某種關(guān)系。這種關(guān)系可以通過某些關(guān)鍵輸入和輸出參數(shù)的上限和下限的形式來體現(xiàn)。

受此啟發(fā),DeepMind的團隊和其他團隊研究了與對抗性測試程序無關(guān)的算法(用于評估規(guī)范一致性。這可以從幾何學上理解 - 我們可以約束給定的一組輸入的情況下,限制輸出空間來最嚴重地違反規(guī)范。如果此界限范圍相對于網(wǎng)絡(luò)參數(shù)是可微分的并且可以快速計算,則可以在訓練期間使用,通過網(wǎng)絡(luò)的每個層傳播原始邊界框。

結(jié)果表明,區(qū)間界限傳播是快速有效的,并且可以獲得強有力的結(jié)果。尤其是能夠降低MNIST和CIFAR-10數(shù)據(jù)集上的圖像分類中的現(xiàn)有技術(shù)的錯誤率。

未來的下一個前沿領(lǐng)域?qū)⑹菍W習正確的幾何抽象,計算更嚴格的輸出空間過度概率。我們還希望訓練網(wǎng)絡(luò)與更復雜的規(guī)范一致,捕獲理想的行為,比如上文提到的不變性和與物理定律的一致性。

形式驗證

嚴格的測試和訓練有助于構(gòu)建強大的機器學習系統(tǒng)。但是,沒有多少測試可以完全保證系統(tǒng)的行為符合我們的要求。在大模型中,由于輸入擾動的選擇極為龐大,因此列舉給定輸入集的所有可能輸出(例如對圖像的無窮小的擾動)是難以處理。但是,與訓練一樣,我們可以通過在輸出集上設(shè)置幾何邊界來找到更有效的方法。正式驗證是DeepMind正在進行的研究的主題。

機器學習社區(qū)已經(jīng)有了幾個關(guān)于如何計算網(wǎng)絡(luò)輸出空間上的精確幾何邊界的有趣思路。我們的方法基于優(yōu)化和二元性,將驗證問題轉(zhuǎn)化為優(yōu)化問題。。下圖以圖形方式說明了該方法。

這種方法使我們能夠?qū)Ⅱ炞C算法的適用性擴展到更一般的網(wǎng)絡(luò)(激活函數(shù),體系結(jié)構(gòu)),更一般性的規(guī)范和更復雜的深度學習模型(生成模型,神經(jīng)過程等)

未來方向

我們需要做更多的工作來構(gòu)建自動化工具,以確保現(xiàn)實世界中的AI系統(tǒng)做出“正確的事情”,為實現(xiàn)這個目標,未來需要在這些方向上發(fā)力:

學習對抗性評估和驗證:隨著AI系統(tǒng)的擴展和復雜度的提升,設(shè)計適合AI模型的對抗性評估和驗證算法將變得越來越困難。如果我們可以利用AI的強大功能來推進評估和驗證,那么這個過程可以大大加快,并實現(xiàn)擴展。

開發(fā)用于對抗性評估和驗證的公開工具:為AI工程師和從業(yè)者提供易于使用的工具是非常重要的,可以在AI系統(tǒng)造成廣泛的負面影響之前闡明其可能的故障模式。這需要一定程度的對抗性評估和驗證算法的標準化。

擴大對抗性實例的應用范圍:到目前為止,大多數(shù)關(guān)于對抗性實例的研究都集中在對小擾動(通常是圖像)的模型不變性上。這為開發(fā)對抗性評估,穩(wěn)健性學習和驗證方法提供了極好的測試平臺。我們已經(jīng)開始探索與現(xiàn)實世界直接相關(guān)的屬性的替代規(guī)范,并對未來在這方面的研究感到興奮。

學習規(guī)范:在AI系統(tǒng)中獲得“正確”行為的規(guī)范通常難以精確表述。當我們構(gòu)建能夠展示復雜行為并在非結(jié)構(gòu)化環(huán)境中行動的越來越智能的代理時,將需要構(gòu)建可以使用部分人類規(guī)范并從評估反饋中學習進一步規(guī)范的系統(tǒng)。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器學習
    +關(guān)注

    關(guān)注

    66

    文章

    8503

    瀏覽量

    134637
  • DEBUG
    +關(guān)注

    關(guān)注

    3

    文章

    95

    瀏覽量

    20566
  • 深度學習
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122803

原文標題:DeepMind新研究:三招解決機器學習模型debug難題

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    無刷直流電機反電勢過零檢測新方法

    新方法。在三相采樣等效電路上分別并聯(lián)一組三極管控制的電阻分壓開關(guān)電路,參考電機轉(zhuǎn)速線性調(diào)節(jié)控制信號占空比,以此控制三極管通斷,從而調(diào)節(jié)電阻分樂開關(guān)電路阻值,可以避免高速時反電勢幅值高于檢測電路供電電壓
    發(fā)表于 06-26 13:50

    機器學習模型市場前景如何

    當今,隨著算法的不斷優(yōu)化、數(shù)據(jù)量的爆炸式增長以及計算能力的飛速提升,機器學習模型的市場前景愈發(fā)廣闊。下面,AI部落小編將探討機器學習
    的頭像 發(fā)表于 02-13 09:39 ?365次閱讀

    傳統(tǒng)機器學習方法和應用指導

    用于開發(fā)生物學數(shù)據(jù)的機器學習方法。盡管深度學習(一般指神經(jīng)網(wǎng)絡(luò)算法)是一個強大的工具,目前也非常流行,但它的應用領(lǐng)域仍然有限。與深度學習相比,傳統(tǒng)
    的頭像 發(fā)表于 12-30 09:16 ?1194次閱讀
    傳統(tǒng)<b class='flag-5'>機器</b><b class='flag-5'>學習方法</b>和應用指導

    大華股份榮獲中國創(chuàng)新方法大賽一等獎

    近日,備受矚目的2024年中國創(chuàng)新方法大賽全國總決賽在重慶圓滿落下帷幕。此次大賽由中國科協(xié)與重慶市人民政府聯(lián)合主辦,吸引了眾多創(chuàng)新企業(yè)和團隊參與,共同展示創(chuàng)新成果,角逐榮譽獎項。 在這場創(chuàng)新盛宴中
    的頭像 發(fā)表于 12-27 14:50 ?565次閱讀

    《具身智能機器人系統(tǒng)》第7-9章閱讀心得之具身智能機器人與大模型

    醫(yī)療領(lǐng)域,手術(shù)輔助機器人需要毫米級的精確控制,書中有介紹基于視覺伺服的實時控制算法,以及如何利用大模型優(yōu)化手術(shù)路徑規(guī)劃。工業(yè)場景中,協(xié)作機器人面臨的主要挑戰(zhàn)是快速適應新工藝流程。具身智能通過在線
    發(fā)表于 12-24 15:03

    基于遺傳算法的QD-SOA設(shè)計新方法

    了QD-SOA的設(shè)計,提出了一種基于遺傳算法的QD-SOA設(shè)計新方法。由于具有用于設(shè)計的模型是必不可少的,因此在第一步中獲得數(shù)值模型。然后,利用從數(shù)值模型中采樣的訓練數(shù)據(jù)建立人工神經(jīng)網(wǎng)
    的頭像 發(fā)表于 12-17 09:58 ?463次閱讀
    基于遺傳算法的QD-SOA設(shè)計<b class='flag-5'>新方法</b>

    一種降低VIO/VSLAM系統(tǒng)漂移的新方法

    本文提出了一種新方法,通過使用點到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點云與數(shù)字孿生體進行對齊,從而實現(xiàn)精確且全球一致的定位,無需視覺數(shù)據(jù)關(guān)聯(lián)。所提方法為VIO/VSLAM系統(tǒng)提供了緊密
    的頭像 發(fā)表于 12-13 11:18 ?706次閱讀
    一種降低VIO/VSLAM系統(tǒng)漂移的<b class='flag-5'>新方法</b>

    大華股份榮獲2024年中國創(chuàng)新方法大賽一等獎

    近日,由中國科協(xié)、重慶市人民政府舉辦的2024年中國創(chuàng)新方法大賽全國總決賽在重慶落下帷幕。大華股份靈活運用創(chuàng)新方法、突破行業(yè)性技術(shù)難題,憑借“不懼強光,分毫必現(xiàn),基于TRIZ的強逆光銳捕技術(shù)”項目,斬獲全國一等獎。
    的頭像 發(fā)表于 12-04 17:19 ?762次閱讀

    利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法

    本文介紹了一種利用全息技術(shù)在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。 研究人員提出了一種在硅晶圓內(nèi)部制造納米結(jié)構(gòu)的新方法。傳統(tǒng)上,晶圓上的微結(jié)構(gòu)加工,僅限于通過光刻技術(shù)在晶圓表面加工納米結(jié)構(gòu)。 然而,除了晶
    的頭像 發(fā)表于 11-18 11:45 ?749次閱讀

    AI大模型與深度學習的關(guān)系

    AI大模型與深度學習之間存在著密不可分的關(guān)系,它們互為促進,相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學習是AI大模型的基礎(chǔ) 技術(shù)支撐 :深度學習
    的頭像 發(fā)表于 10-23 15:25 ?2900次閱讀

    AI大模型與傳統(tǒng)機器學習的區(qū)別

    AI大模型與傳統(tǒng)機器學習在多個方面存在顯著的區(qū)別。以下是對這些區(qū)別的介紹: 一、模型規(guī)模與復雜度 AI大模型 :通常包含數(shù)十億甚至數(shù)萬億的參
    的頭像 發(fā)表于 10-23 15:01 ?2596次閱讀

    構(gòu)建語音控制機器人 - 線性模型機器學習

    輪子并識別音頻信號,但它仍然無法通過語音命令控制或按預定義路徑行駛。 線性控制模型 首先要解決的問題是實現(xiàn)直線驅(qū)動。為此,我們使用線性模型來控制提供給車輪的電壓。使用線性模型適合對汽車系統(tǒng)進行建模,因為線性系統(tǒng)更容易分析,并且我
    的頭像 發(fā)表于 10-02 16:31 ?581次閱讀
    構(gòu)建語音控制<b class='flag-5'>機器</b>人 - 線性<b class='flag-5'>模型</b>和<b class='flag-5'>機器</b><b class='flag-5'>學習</b>

    保護4-20 mA,±20-mA模擬輸入的新方法

    電子發(fā)燒友網(wǎng)站提供《保護4-20 mA,±20-mA模擬輸入的新方法.pdf》資料免費下載
    發(fā)表于 09-24 09:27 ?0次下載
    保護4-20 mA,±20-mA模擬輸入的<b class='flag-5'>新方法</b>

    FP8模型訓練中Debug優(yōu)化思路

    目前,市場上許多公司都積極開展基于 FP8 的大模型訓練,以提高計算效率和性能。在此,我們整理并總結(jié)了客戶及 NVIDIA 技術(shù)團隊在 FP8 模型訓練過程中的 debug 思路和方法
    的頭像 發(fā)表于 09-06 14:36 ?932次閱讀
    FP8<b class='flag-5'>模型</b>訓練中<b class='flag-5'>Debug</b>優(yōu)化思路

    實踐JLink 7.62手動增加新MCU型號支持新方法

    大家好,我是痞子衡,是正經(jīng)搞技術(shù)的痞子。今天痞子衡給大家分享的是實踐JLink 7.62手動增加新MCU型號支持新方法
    的頭像 發(fā)表于 08-08 15:25 ?1407次閱讀
    實踐JLink 7.62手動增加新MCU型號支持<b class='flag-5'>新方法</b>