編者按:如果不用寫代碼就能對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行審查,那會(huì)是怎樣的體驗(yàn)?今天,谷歌開(kāi)源了一款工具,名為What-If,具體有以下幾種功能:
對(duì)推斷結(jié)果可視化;
編輯數(shù)據(jù)點(diǎn),看模型會(huì)有怎樣的反應(yīng);
研究單一特征對(duì)模型的影響;
研究反事實(shí)樣本;
用相似度安排樣本;
查看混淆矩陣和ROC曲線;
測(cè)試算法公平性。
以下是論智對(duì)這一工具進(jìn)行的詳細(xì)介紹:
打造高效的機(jī)器學(xué)習(xí)系統(tǒng)意味著要問(wèn)很多問(wèn)題,僅僅訓(xùn)練模型是不夠的,優(yōu)秀的機(jī)器學(xué)習(xí)專家會(huì)像偵探一樣,對(duì)模型進(jìn)行詳細(xì)調(diào)查,以更好地理解它們:數(shù)據(jù)點(diǎn)的改變將如何影響模型的預(yù)測(cè)?針對(duì)不同的群體,模型的表現(xiàn)有何不同?我要測(cè)試的數(shù)據(jù)集中包含多少種類的數(shù)據(jù)?
想要回答這類問(wèn)題可并不容易。研究機(jī)器學(xué)習(xí)模型的使用場(chǎng)景通常要用定制的、一次性的代碼分析。這一過(guò)程不僅低效,而且對(duì)不會(huì)編程的人員也不友好。谷歌AI PAIR計(jì)劃其中一個(gè)努力方向就是讓更多的人能參與到機(jī)器學(xué)習(xí)系統(tǒng)的檢查、評(píng)估和debug中來(lái)。
今天,我們發(fā)布What-If工具,這是一款新的開(kāi)源TensorBoard網(wǎng)頁(yè)應(yīng)用,能讓我們無(wú)需編寫代碼就能分析一款機(jī)器學(xué)習(xí)模型。給定一個(gè)TensorFlow模型和數(shù)據(jù)集,What-If工具可以展示出表現(xiàn)模型結(jié)果的交互界面。
What-If工具,展示了250張人臉圖像和模型在其中檢測(cè)微笑的結(jié)果
What-If工具有多種功能,包括用Facets自動(dòng)對(duì)你的數(shù)據(jù)集進(jìn)行可視化、從數(shù)據(jù)集中手動(dòng)編輯樣本的能力以及觀察這些變化帶來(lái)的影響、并且自動(dòng)生成partial dependence plots,展示模型的預(yù)測(cè)是如何隨著單一特征的變化而變化的。接下來(lái)就是對(duì)這兩種特征的詳細(xì)介紹。
在一個(gè)數(shù)據(jù)點(diǎn)上探索what-if場(chǎng)景
只需要點(diǎn)擊鼠標(biāo),你就能比較一個(gè)數(shù)據(jù)點(diǎn)和另一個(gè)相似的數(shù)據(jù)點(diǎn),但模型在后者上預(yù)測(cè)出了不同的結(jié)果。我們將這樣的數(shù)據(jù)點(diǎn)稱為“counterfactuals”,它們可以告訴你有關(guān)模型決策邊界的信息。
在下方的截圖中,這款工具就用到了一個(gè)二元分類模型上,它是根據(jù)UCI的人口普查數(shù)據(jù)來(lái)判斷某人的收入是否大于5萬(wàn)美元。這是很多機(jī)器學(xué)習(xí)研究者都會(huì)用到的預(yù)測(cè)模型,尤其是分析算法的公平性時(shí)。在這個(gè)案例中,對(duì)于選擇的數(shù)據(jù)點(diǎn),模型預(yù)測(cè)出的結(jié)果有73%的置信度認(rèn)為該人的收入高于5萬(wàn)美金。該工具自動(dòng)定位了數(shù)據(jù)集中另一位與之相似的對(duì)象,但模型預(yù)測(cè)他的收入小于5萬(wàn)美金,并將這兩個(gè)目標(biāo)進(jìn)行了比對(duì)。在這種情況下,對(duì)年齡和職業(yè)進(jìn)行稍稍改動(dòng),模型的預(yù)測(cè)就有了變化。
比較counterfactuals
分析模型性能和算法公平性
你還可以探索不同分類閾值所帶來(lái)的不同影響,下方的截圖展示了另一個(gè)微笑監(jiān)測(cè)模型的結(jié)果,他在開(kāi)源的CelebA數(shù)據(jù)集上進(jìn)行的訓(xùn)練,該數(shù)據(jù)集含有經(jīng)過(guò)標(biāo)記的名人人臉圖像。在下方的案例中,數(shù)據(jù)集中的人臉根據(jù)頭發(fā)顏色進(jìn)行了分類,每?jī)山M數(shù)都有一個(gè)ROC曲線和針對(duì)預(yù)測(cè)的混淆矩陣,以及設(shè)置了模型判斷人臉在微笑的信心有多少。在這個(gè)案例中,兩組數(shù)據(jù)的置信區(qū)間是用該工具自動(dòng)設(shè)置的,從而保證公平性。
比較兩部分?jǐn)?shù)據(jù)在微笑探測(cè)器上的性能
Demos
為了說(shuō)明What-If工具的能力,我們用預(yù)訓(xùn)練模型展示了一套demo:
檢測(cè)錯(cuò)誤分類:一個(gè)多種類分類模型,它可以從眾多植物中預(yù)測(cè)某株植物的種類。這一工具在展示模型決策邊界、判斷如何造成錯(cuò)誤分類時(shí)是非常有用的。模型是在UCI iris數(shù)據(jù)集上進(jìn)行訓(xùn)練的。
評(píng)估二元分類模型中的公平性:正是上文中我們提到的微笑探測(cè)模型。What-If工具可以幫助我們?cè)诙鄠€(gè)分類中評(píng)估算法公平性。模型在訓(xùn)練時(shí)沒(méi)有提供任何具體任務(wù)的圖片,為的就是證明What-If工具能如何幫助模型解除偏見(jiàn)。評(píng)估公平性需要仔細(xì)考慮所有語(yǔ)境,但這的確是有用的量化起始點(diǎn)。
在不同子集中研究模型性能:例如一個(gè)可以預(yù)測(cè)目標(biāo)對(duì)象年齡的回歸模型,What-If工具就可以展示與模型相關(guān)的其他子集上的性能信息,以及不同的特征是如何影響預(yù)測(cè)結(jié)果的。模型同樣是在UCI人口普查數(shù)據(jù)集上進(jìn)行的訓(xùn)練。
在實(shí)際中應(yīng)用What-If工具
我們?cè)诠雀鑳?nèi)部團(tuán)隊(duì)中對(duì)What-If進(jìn)行了測(cè)試,發(fā)現(xiàn)了它的很多好處。其中一個(gè)團(tuán)隊(duì)很快就發(fā)現(xiàn)了他們的模型忽視了數(shù)據(jù)集中的一個(gè)重要的特征,從而修復(fù)了之前沒(méi)有發(fā)現(xiàn)的代碼bug。另一個(gè)團(tuán)隊(duì)用該工具對(duì)它們的樣本性能進(jìn)行從優(yōu)到劣的可視化排序,讓他們看到了模型樣本的類型構(gòu)成。
不論是谷歌的員工還是其他領(lǐng)域的從業(yè)者,我們都希望這款工具能讓用戶更好地了解機(jī)器學(xué)習(xí)模型,并對(duì)公平性有所了解。另外,此工具的代碼是開(kāi)源的,歡迎大家嘗試并提出意見(jiàn)。
-
谷歌
+關(guān)注
關(guān)注
27文章
6231瀏覽量
108175 -
機(jī)器學(xué)習(xí)
+關(guān)注
關(guān)注
66文章
8503瀏覽量
134646 -
數(shù)據(jù)集
+關(guān)注
關(guān)注
4文章
1224瀏覽量
25457
原文標(biāo)題:有了谷歌這款What-If工具,無(wú)需代碼即可掌握模型的所有資料
文章出處:【微信號(hào):jqr_AI,微信公眾號(hào):論智】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
一款基于ESP8266的開(kāi)源智能硬件平臺(tái)
轉(zhuǎn): 一款基于Arduino開(kāi)發(fā)板的可編程開(kāi)源插座
ASIHTTPRequest是一款極其強(qiáng)勁的HTTP訪問(wèn)開(kāi)源項(xiàng)目
谷歌推出了一款名為“Clips”的新設(shè)備 并開(kāi)始銷售這款產(chǎn)品
Google AI推出“what-if”工具,測(cè)試機(jī)器學(xué)習(xí)模型不用寫代碼!
谷歌新推無(wú)程式碼機(jī)器學(xué)習(xí)模型分析工具
亞馬遜推出了一款名為Inferentia的新型專用機(jī)器學(xué)習(xí)芯片
亞馬遜正在測(cè)試一款名為Scout的送貨機(jī)器人
一款開(kāi)源檢測(cè)入侵用戶的工具
開(kāi)發(fā)一款segmentation標(biāo)記的工具
介紹一款專用的電機(jī)設(shè)計(jì)和分析工具
防范機(jī)器學(xué)習(xí)IP失竊,恩智浦推出一款“防偷”神器!
一款用于Windows的開(kāi)源反rookit (ARK)工具

Meta發(fā)布一款可以使用文本提示生成代碼的大型語(yǔ)言模型Code Llama

評(píng)論