成人3d动漫在线观看无修改,极品美女爆乳喷水网站

作者：努力的孔子

對(duì)模型進(jìn)行評(píng)估時(shí)，可以選擇很多種指標(biāo)，但不同的指標(biāo)可能得到不同的結(jié)果，如何選擇合適的指標(biāo)，需要取決于任務(wù)需求。

正確率與錯(cuò)誤率

正確率：正確分類(lèi)的樣本數(shù)/總樣本數(shù)，accuracy

錯(cuò)誤率：錯(cuò)誤分類(lèi)的樣本數(shù)/總樣本數(shù)，error

正確率+錯(cuò)誤率=1

這兩種指標(biāo)最簡(jiǎn)單，也最常用

缺點(diǎn)

不一定能反應(yīng)模型的泛化能力，如類(lèi)別不均衡問(wèn)題。

不能滿(mǎn)足所有任務(wù)需求

如有一車(chē)西瓜，任務(wù)一：挑出的好瓜中有多少實(shí)際是好瓜，任務(wù)二：所有的好瓜有多少被挑出來(lái)了，顯然正確率和錯(cuò)誤率不能解決這個(gè)問(wèn)題。

查準(zhǔn)率與查全率

先認(rèn)識(shí)幾個(gè)概念

正樣本/正元組：目標(biāo)元組，感興趣的元組

負(fù)樣本/負(fù)元組：其他元組

對(duì)于二分類(lèi)問(wèn)題，模型的預(yù)測(cè)結(jié)果可以劃分為：真正例 TP、假正例 FP、真負(fù)例 TN、假負(fù)例 FN,

真正例就是實(shí)際為正、預(yù)測(cè)為正，其他同理

顯然 TP+FP+TN+FN=總樣本數(shù)

混淆矩陣

把上面四種劃分用混淆矩陣來(lái)表示

從而得出如下概念

查準(zhǔn)率：預(yù)測(cè)為正里多少實(shí)際為正，precision，也叫精度

查全率：實(shí)際為正里多少預(yù)測(cè)為正，recall，也叫召回率

查準(zhǔn)率和查全率是一對(duì)矛盾的度量。通常來(lái)講，查準(zhǔn)率高，查全率就低，反之亦然。

例如還是一車(chē)西瓜，我希望將所有好瓜盡可能選出來(lái)，如果我把所有瓜都選了，那自然所有好瓜都被選了，這就需要所有的瓜被識(shí)別為好瓜，此時(shí)查準(zhǔn)率較低，而召回率是100%，

如果我希望選出的瓜都是好瓜，那就要慎重了，寧可不選，不能錯(cuò)選，這就需要預(yù)測(cè)為正就必須是真正例，此時(shí)查準(zhǔn)率是100%，查全率可能較低。

注意我說(shuō)的是可能較低，通常如果樣本很好分，比如正的全分到正的，負(fù)的全分到負(fù)的，那查準(zhǔn)率、查全率都是100%，不矛盾。

P-R曲線

既然矛盾，那兩者之間的關(guān)系應(yīng)該如下圖

這條曲線叫 P-R曲線，即查準(zhǔn)率-查全率曲線。

這條曲線怎么畫(huà)出來(lái)的呢？可以這么理解，假如我用某種方法得到樣本是正例的概率（如用模型對(duì)所有樣本進(jìn)行預(yù)測(cè)），然后把樣本按概率排序，從高到低

如果模型把第一個(gè)預(yù)測(cè)為正，其余預(yù)測(cè)為負(fù)，此時(shí)查準(zhǔn)率為1，查全率接近于0，

如果模型把前2個(gè)預(yù)測(cè)為正，其余預(yù)測(cè)為負(fù)，此時(shí)查準(zhǔn)率稍微降低，查全率稍微增加，

依次...

如果模型把除最后一個(gè)外的樣本預(yù)測(cè)為正，最后一個(gè)預(yù)測(cè)為負(fù)，那么查準(zhǔn)率很低，查全率很高。

此時(shí)我把數(shù)據(jù)順序打亂，畫(huà)出來(lái)的圖依然一樣，即上圖。

既然查準(zhǔn)率和查全率互相矛盾，那用哪個(gè)作為評(píng)價(jià)指標(biāo)呢？或者說(shuō)同時(shí)用兩個(gè)指標(biāo)怎么評(píng)價(jià)模型呢？

兩種情形

如果學(xué)習(xí)器A的P-R曲線能完全“包住”學(xué)習(xí)器C的P-R曲線，則A的性能優(yōu)于C

如果學(xué)習(xí)器A的P-R曲線與學(xué)習(xí)器B的P-R曲線相交，則難以判斷孰優(yōu)孰劣，此時(shí)通常的作法是，固定查準(zhǔn)率，比較查全率，或者固定查全率，比較查準(zhǔn)率。

通常情況下曲線會(huì)相交，但是人們?nèi)韵Ｍ褍蓚€(gè)學(xué)習(xí)器比出個(gè)高低，一個(gè)合理的方式是比較兩條P-R曲線下的面積。

但是這個(gè)面積不好計(jì)算，于是人們又設(shè)計(jì)了一些其他綜合考慮查準(zhǔn)率查全率的方式，來(lái)替代面積計(jì)算。

平衡點(diǎn)：Break-Event Point，簡(jiǎn)稱(chēng)BEP，就是選擇查準(zhǔn)率=查全率的點(diǎn)，即上圖，y=x直線與P-R曲線的交點(diǎn)

這種方法比較暴力

F1 與 Fβ 度量

更常用的方法是F1度量

即 F1 是 P 和 R 的調(diào)和平均數(shù)。

與算數(shù)平均數(shù) 和幾何平均數(shù)相比，調(diào)和平均數(shù)更重視較小值。

在一些應(yīng)用中，對(duì)查準(zhǔn)率和查全率的重視程度有所不同。

例如商品推薦系統(tǒng)，為了避免騷擾客戶(hù)，希望推薦的內(nèi)容都是客戶(hù)感興趣的，此時(shí)查準(zhǔn)率比較重要，

又如資料查詢(xún)系統(tǒng)，為了不漏掉有用信息，希望把所有資料都取到，此時(shí)查全率比較重要。

此時(shí)需要對(duì)查準(zhǔn)率和查全率進(jìn)行加權(quán)

即 P 和 R 的加權(quán)調(diào)和平均數(shù)。

β>0，β度量了查全率對(duì)查準(zhǔn)率的重要性，β=1時(shí)即為F1

β>1，查全率更重要，β<1，查準(zhǔn)率更重要

多分類(lèi)的F1

多分類(lèi)沒(méi)有正例負(fù)例之說(shuō)，那么可以轉(zhuǎn)化為多個(gè)二分類(lèi)，即多個(gè)混淆矩陣，在這多個(gè)混淆矩陣上綜合考慮查準(zhǔn)率和查全率，即多分類(lèi)的F1

方法1

直接在每個(gè)混淆矩陣上計(jì)算出查準(zhǔn)率和查全率，再求平均，這樣得到“宏查準(zhǔn)率”，“宏查全率”和“宏F1”

方法2

把混淆矩陣中對(duì)應(yīng)元素相加求平均，即 TP 的平均，TN 的平均，等，再計(jì)算查準(zhǔn)率、查全率、F1，這樣得到“微查準(zhǔn)率”，“微查全率”和“微F1”

ROC 與 AUC

很多學(xué)習(xí)器是為樣本生成一個(gè)概率，然后和設(shè)定閾值進(jìn)行比較，大于閾值為正例，小于為負(fù)例，如邏輯回歸。

而模型的優(yōu)劣取決于兩點(diǎn)：

這個(gè)概率的計(jì)算準(zhǔn)確與否

閾值的設(shè)定

我們把計(jì)算出的概率按從大到小排序，然后在某個(gè)點(diǎn)劃分開(kāi)，這個(gè)點(diǎn)就是閾值，可以根據(jù)實(shí)際任務(wù)需求來(lái)確定這個(gè)閾值，比如更重視查準(zhǔn)率，則閾值設(shè)大點(diǎn)，若更重視查全率，則閾值設(shè)小點(diǎn)，

這里體現(xiàn)了同一模型的優(yōu)化，

不同的模型計(jì)算出的概率是不一樣的，也就是說(shuō)樣本按概率排序時(shí)順序不同，那切分時(shí)自然可能分到不同的類(lèi)，

這里體現(xiàn)了不同模型之間的差異，

所以ROC可以用來(lái)模型優(yōu)化和模型選擇，理論上講 P-R曲線也可以。

ROC曲線的繪制方法與P-R曲線類(lèi)似，不再贅述，結(jié)果如下圖

橫坐標(biāo)為假正例率，縱坐標(biāo)為真正例率，曲線下的面積叫 AUC

如何評(píng)價(jià)模型呢？

若學(xué)習(xí)器A的ROC曲線能包住學(xué)習(xí)器B的ROC曲線，則A優(yōu)于B

若學(xué)習(xí)器A的ROC曲線與學(xué)習(xí)器B的ROC曲線相交，則難以比較孰優(yōu)孰劣，此時(shí)可以比較AUC的大小

總結(jié)

模型評(píng)估主要考慮兩種場(chǎng)景：類(lèi)別均衡，類(lèi)別不均衡

模型評(píng)估必須考慮實(shí)際任務(wù)需求

P-R 曲線和 ROC曲線可以用于模型選擇

ROC曲線可以用于模型優(yōu)化

參考資料：

周志華《機(jī)器學(xué)習(xí)》

本文由博客一文多發(fā)平臺(tái) OpenWrite 發(fā)布！

審核編輯黃昊宇

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

模型

模型

+關(guān)注

關(guān)注
1

文章
3694

瀏覽量
51958
機(jī)器學(xué)習(xí)

機(jī)器學(xué)習(xí)

+關(guān)注

關(guān)注
66

文章
8546

瀏覽量
136539
深度學(xué)習(xí)

深度學(xué)習(xí)

+關(guān)注

關(guān)注
73

文章
5594

瀏覽量
124161

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

分類(lèi)模型評(píng)估指標(biāo)匯總

評(píng)論