桃花朵朵开在线视频播放,DVD无码激情在线

編者按：如果不用寫(xiě)代碼就能對(duì)機(jī)器學(xué)習(xí)模型進(jìn)行審查，那會(huì)是怎樣的體驗(yàn)？今天，谷歌開(kāi)源了一款工具，名為What-If，具體有以下幾種功能：

對(duì)推斷結(jié)果可視化；

編輯數(shù)據(jù)點(diǎn)，看模型會(huì)有怎樣的反應(yīng)；

研究單一特征對(duì)模型的影響；

研究反事實(shí)樣本；

用相似度安排樣本；

查看混淆矩陣和ROC曲線(xiàn)；

測(cè)試算法公平性。

以下是論智對(duì)這一工具進(jìn)行的詳細(xì)介紹：

打造高效的機(jī)器學(xué)習(xí)系統(tǒng)意味著要問(wèn)很多問(wèn)題，僅僅訓(xùn)練模型是不夠的，優(yōu)秀的機(jī)器學(xué)習(xí)專(zhuān)家會(huì)像偵探一樣，對(duì)模型進(jìn)行詳細(xì)調(diào)查，以更好地理解它們：數(shù)據(jù)點(diǎn)的改變將如何影響模型的預(yù)測(cè)？針對(duì)不同的群體，模型的表現(xiàn)有何不同？我要測(cè)試的數(shù)據(jù)集中包含多少種類(lèi)的數(shù)據(jù)？

想要回答這類(lèi)問(wèn)題可并不容易。研究機(jī)器學(xué)習(xí)模型的使用場(chǎng)景通常要用定制的、一次性的代碼分析。這一過(guò)程不僅低效，而且對(duì)不會(huì)編程的人員也不友好。谷歌AI PAIR計(jì)劃其中一個(gè)努力方向就是讓更多的人能參與到機(jī)器學(xué)習(xí)系統(tǒng)的檢查、評(píng)估和debug中來(lái)。

今天，我們發(fā)布What-If工具，這是一款新的開(kāi)源TensorBoard網(wǎng)頁(yè)應(yīng)用，能讓我們無(wú)需編寫(xiě)代碼就能分析一款機(jī)器學(xué)習(xí)模型。給定一個(gè)TensorFlow模型和數(shù)據(jù)集，What-If工具可以展示出表現(xiàn)模型結(jié)果的交互界面。

What-If工具，展示了250張人臉圖像和模型在其中檢測(cè)微笑的結(jié)果

What-If工具有多種功能，包括用Facets自動(dòng)對(duì)你的數(shù)據(jù)集進(jìn)行可視化、從數(shù)據(jù)集中手動(dòng)編輯樣本的能力以及觀察這些變化帶來(lái)的影響、并且自動(dòng)生成partial dependence plots，展示模型的預(yù)測(cè)是如何隨著單一特征的變化而變化的。接下來(lái)就是對(duì)這兩種特征的詳細(xì)介紹。

在一個(gè)數(shù)據(jù)點(diǎn)上探索what-if場(chǎng)景

反事實(shí)（counterf actuals）

只需要點(diǎn)擊鼠標(biāo)，你就能比較一個(gè)數(shù)據(jù)點(diǎn)和另一個(gè)相似的數(shù)據(jù)點(diǎn)，但模型在后者上預(yù)測(cè)出了不同的結(jié)果。我們將這樣的數(shù)據(jù)點(diǎn)稱(chēng)為“counterfactuals”，它們可以告訴你有關(guān)模型決策邊界的信息。

在下方的截圖中，這款工具就用到了一個(gè)二元分類(lèi)模型上，它是根據(jù)UCI的人口普查數(shù)據(jù)來(lái)判斷某人的收入是否大于5萬(wàn)美元。這是很多機(jī)器學(xué)習(xí)研究者都會(huì)用到的預(yù)測(cè)模型，尤其是分析算法的公平性時(shí)。在這個(gè)案例中，對(duì)于選擇的數(shù)據(jù)點(diǎn)，模型預(yù)測(cè)出的結(jié)果有73%的置信度認(rèn)為該人的收入高于5萬(wàn)美金。該工具自動(dòng)定位了數(shù)據(jù)集中另一位與之相似的對(duì)象，但模型預(yù)測(cè)他的收入小于5萬(wàn)美金，并將這兩個(gè)目標(biāo)進(jìn)行了比對(duì)。在這種情況下，對(duì)年齡和職業(yè)進(jìn)行稍稍改動(dòng)，模型的預(yù)測(cè)就有了變化。

比較counterfactuals

分析模型性能和算法公平性

你還可以探索不同分類(lèi)閾值所帶來(lái)的不同影響，下方的截圖展示了另一個(gè)微笑監(jiān)測(cè)模型的結(jié)果，他在開(kāi)源的CelebA數(shù)據(jù)集上進(jìn)行的訓(xùn)練，該數(shù)據(jù)集含有經(jīng)過(guò)標(biāo)記的名人人臉圖像。在下方的案例中，數(shù)據(jù)集中的人臉根據(jù)頭發(fā)顏色進(jìn)行了分類(lèi)，每?jī)山M數(shù)都有一個(gè)ROC曲線(xiàn)和針對(duì)預(yù)測(cè)的混淆矩陣，以及設(shè)置了模型判斷人臉在微笑的信心有多少。在這個(gè)案例中，兩組數(shù)據(jù)的置信區(qū)間是用該工具自動(dòng)設(shè)置的，從而保證公平性。

比較兩部分?jǐn)?shù)據(jù)在微笑探測(cè)器上的性能

Demos

為了說(shuō)明What-If工具的能力，我們用預(yù)訓(xùn)練模型展示了一套demo：

檢測(cè)錯(cuò)誤分類(lèi)：一個(gè)多種類(lèi)分類(lèi)模型，它可以從眾多植物中預(yù)測(cè)某株植物的種類(lèi)。這一工具在展示模型決策邊界、判斷如何造成錯(cuò)誤分類(lèi)時(shí)是非常有用的。模型是在UCI iris數(shù)據(jù)集上進(jìn)行訓(xùn)練的。

評(píng)估二元分類(lèi)模型中的公平性：正是上文中我們提到的微笑探測(cè)模型。What-If工具可以幫助我們?cè)诙鄠€(gè)分類(lèi)中評(píng)估算法公平性。模型在訓(xùn)練時(shí)沒(méi)有提供任何具體任務(wù)的圖片，為的就是證明What-If工具能如何幫助模型解除偏見(jiàn)。評(píng)估公平性需要仔細(xì)考慮所有語(yǔ)境，但這的確是有用的量化起始點(diǎn)。

在不同子集中研究模型性能：例如一個(gè)可以預(yù)測(cè)目標(biāo)對(duì)象年齡的回歸模型，What-If工具就可以展示與模型相關(guān)的其他子集上的性能信息，以及不同的特征是如何影響預(yù)測(cè)結(jié)果的。模型同樣是在UCI人口普查數(shù)據(jù)集上進(jìn)行的訓(xùn)練。

在實(shí)際中應(yīng)用What-If工具

我們?cè)诠雀鑳?nèi)部團(tuán)隊(duì)中對(duì)What-If進(jìn)行了測(cè)試，發(fā)現(xiàn)了它的很多好處。其中一個(gè)團(tuán)隊(duì)很快就發(fā)現(xiàn)了他們的模型忽視了數(shù)據(jù)集中的一個(gè)重要的特征，從而修復(fù)了之前沒(méi)有發(fā)現(xiàn)的代碼bug。另一個(gè)團(tuán)隊(duì)用該工具對(duì)它們的樣本性能進(jìn)行從優(yōu)到劣的可視化排序，讓他們看到了模型樣本的類(lèi)型構(gòu)成。

不論是谷歌的員工還是其他領(lǐng)域的從業(yè)者，我們都希望這款工具能讓用戶(hù)更好地了解機(jī)器學(xué)習(xí)模型，并對(duì)公平性有所了解。另外，此工具的代碼是開(kāi)源的，歡迎大家嘗試并提出意見(jiàn)。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

谷歌

谷歌

+關(guān)注

關(guān)注
27

文章
6249

瀏覽量
110721
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8546

瀏覽量
136523
數(shù)據(jù)集

數(shù)據(jù)集

+關(guān)注

關(guān)注
4

文章
1235

瀏覽量
26116

原文標(biāo)題：有了谷歌這款What-If工具，無(wú)需代碼即可掌握模型的所有資料

文章出處：【微信號(hào)：jqr_AI，微信公眾號(hào)：論智】歡迎添加關(guān)注！文章轉(zhuǎn)載請(qǐng)注明出處。

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

谷歌開(kāi)源了一款工具名為What-If,無(wú)需編寫(xiě)代碼就能分析一款機(jī)器學(xué)習(xí)模型

評(píng)論