chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

分類(lèi)模型評(píng)估指標(biāo)匯總

電子設(shè)計(jì) ? 來(lái)源:電子設(shè)計(jì) ? 作者:電子設(shè)計(jì) ? 2020-12-10 21:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:努力的孔子

對(duì)模型進(jìn)行評(píng)估時(shí),可以選擇很多種指標(biāo),但不同的指標(biāo)可能得到不同的結(jié)果,如何選擇合適的指標(biāo),需要取決于任務(wù)需求。

正確率與錯(cuò)誤率

正確率:正確分類(lèi)的樣本數(shù)/總樣本數(shù),accuracy

錯(cuò)誤率:錯(cuò)誤分類(lèi)的樣本數(shù)/總樣本數(shù),error

正確率+錯(cuò)誤率=1

這兩種指標(biāo)最簡(jiǎn)單,也最常用

缺點(diǎn)

不一定能反應(yīng)模型的泛化能力,如類(lèi)別不均衡問(wèn)題。

不能滿(mǎn)足所有任務(wù)需求

如有一車(chē)西瓜,任務(wù)一:挑出的好瓜中有多少實(shí)際是好瓜,任務(wù)二: 所有的好瓜有多少被挑出來(lái)了,顯然正確率和錯(cuò)誤率不能解決這個(gè)問(wèn)題。

查準(zhǔn)率與查全率

先認(rèn)識(shí)幾個(gè)概念

正樣本/正元組:目標(biāo)元組,感興趣的元組

負(fù)樣本/負(fù)元組:其他元組

對(duì)于二分類(lèi)問(wèn)題,模型的預(yù)測(cè)結(jié)果可以劃分為:真正例 TP、假正例 FP、真負(fù)例 TN、 假負(fù)例 FN,

真正例就是實(shí)際為正、預(yù)測(cè)為正,其他同理

顯然 TP+FP+TN+FN=總樣本數(shù)

混淆矩陣

把上面四種劃分用混淆矩陣來(lái)表示

從而得出如下概念

查準(zhǔn)率:預(yù)測(cè)為正里多少實(shí)際為正,precision,也叫精度

查全率:實(shí)際為正里多少預(yù)測(cè)為正,recall,也叫召回率

查準(zhǔn)率和查全率是一對(duì)矛盾的度量。通常來(lái)講,查準(zhǔn)率高,查全率就低,反之亦然。

例如還是一車(chē)西瓜,我希望將所有好瓜盡可能選出來(lái),如果我把所有瓜都選了,那自然所有好瓜都被選了,這就需要所有的瓜被識(shí)別為好瓜,此時(shí)查準(zhǔn)率較低,而召回率是100%,

如果我希望選出的瓜都是好瓜,那就要慎重了,寧可不選,不能錯(cuò)選,這就需要預(yù)測(cè)為正就必須是真正例,此時(shí)查準(zhǔn)率是100%,查全率可能較低。

注意我說(shuō)的是可能較低,通常如果樣本很好分,比如正的全分到正的,負(fù)的全分到負(fù)的,那查準(zhǔn)率、查全率都是100%,不矛盾。

P-R曲線

既然矛盾,那兩者之間的關(guān)系應(yīng)該如下圖

這條曲線叫 P-R曲線,即查準(zhǔn)率-查全率曲線。

這條曲線怎么畫(huà)出來(lái)的呢?可以這么理解,假如我用某種方法得到樣本是正例的概率(如用模型對(duì)所有樣本進(jìn)行預(yù)測(cè)),然后把樣本按概率排序,從高到低

如果模型把第一個(gè)預(yù)測(cè)為正,其余預(yù)測(cè)為負(fù),此時(shí)查準(zhǔn)率為1,查全率接近于0,

如果模型把前2個(gè)預(yù)測(cè)為正,其余預(yù)測(cè)為負(fù),此時(shí)查準(zhǔn)率稍微降低,查全率稍微增加,

依次...

如果模型把除最后一個(gè)外的樣本預(yù)測(cè)為正,最后一個(gè)預(yù)測(cè)為負(fù),那么查準(zhǔn)率很低,查全率很高。

此時(shí)我把數(shù)據(jù)順序打亂,畫(huà)出來(lái)的圖依然一樣,即上圖。

既然查準(zhǔn)率和查全率互相矛盾,那用哪個(gè)作為評(píng)價(jià)指標(biāo)呢?或者說(shuō)同時(shí)用兩個(gè)指標(biāo)怎么評(píng)價(jià)模型呢?

兩種情形

如果學(xué)習(xí)器A的P-R曲線能完全“包住”學(xué)習(xí)器C的P-R曲線,則A的性能優(yōu)于C

如果學(xué)習(xí)器A的P-R曲線與學(xué)習(xí)器B的P-R曲線相交,則難以判斷孰優(yōu)孰劣,此時(shí)通常的作法是,固定查準(zhǔn)率,比較查全率,或者固定查全率,比較查準(zhǔn)率。

通常情況下曲線會(huì)相交,但是人們?nèi)韵M褍蓚€(gè)學(xué)習(xí)器比出個(gè)高低,一個(gè)合理的方式是比較兩條P-R曲線下的面積。

但是這個(gè)面積不好計(jì)算,于是人們又設(shè)計(jì)了一些其他綜合考慮查準(zhǔn)率查全率的方式,來(lái)替代面積計(jì)算。

平衡點(diǎn):Break-Event Point,簡(jiǎn)稱(chēng)BEP,就是選擇 查準(zhǔn)率=查全率 的點(diǎn),即上圖,y=x直線與P-R曲線的交點(diǎn)

這種方法比較暴力

F1 與 Fβ 度量

更常用的方法是F1度量

即 F1 是 P 和 R 的調(diào)和平均數(shù)。

與算數(shù)平均數(shù) 和 幾何平均數(shù)相比,調(diào)和平均數(shù)更重視較小值。

在一些應(yīng)用中,對(duì)查準(zhǔn)率和查全率的重視程度有所不同。

例如商品推薦系統(tǒng),為了避免騷擾客戶(hù),希望推薦的內(nèi)容都是客戶(hù)感興趣的,此時(shí)查準(zhǔn)率比較重要,

又如資料查詢(xún)系統(tǒng),為了不漏掉有用信息,希望把所有資料都取到,此時(shí)查全率比較重要。

此時(shí)需要對(duì)查準(zhǔn)率和查全率進(jìn)行加權(quán)

即 P 和 R 的加權(quán)調(diào)和平均數(shù)。

β>0,β度量了查全率對(duì)查準(zhǔn)率的重要性,β=1時(shí)即為F1

β>1,查全率更重要,β<1,查準(zhǔn)率更重要

多分類(lèi)的F1

多分類(lèi)沒(méi)有正例負(fù)例之說(shuō),那么可以轉(zhuǎn)化為多個(gè)二分類(lèi),即多個(gè)混淆矩陣,在這多個(gè)混淆矩陣上綜合考慮查準(zhǔn)率和查全率,即多分類(lèi)的F1

方法1

直接在每個(gè)混淆矩陣上計(jì)算出查準(zhǔn)率和查全率,再求平均,這樣得到“宏查準(zhǔn)率”,“宏查全率”和“宏F1”

方法2

把混淆矩陣中對(duì)應(yīng)元素相加求平均,即 TP 的平均,TN 的平均,等,再計(jì)算查準(zhǔn)率、查全率、F1,這樣得到“微查準(zhǔn)率”,“微查全率”和“微F1”

ROC 與 AUC

很多學(xué)習(xí)器是為樣本生成一個(gè)概率,然后和設(shè)定閾值進(jìn)行比較,大于閾值為正例,小于為負(fù)例,如邏輯回歸。

而模型的優(yōu)劣取決于兩點(diǎn):

這個(gè)概率的計(jì)算準(zhǔn)確與否

閾值的設(shè)定

我們把計(jì)算出的概率按從大到小排序,然后在某個(gè)點(diǎn)劃分開(kāi),這個(gè)點(diǎn)就是閾值,可以根據(jù)實(shí)際任務(wù)需求來(lái)確定這個(gè)閾值,比如更重視查準(zhǔn)率,則閾值設(shè)大點(diǎn),若更重視查全率,則閾值設(shè)小點(diǎn),

這里體現(xiàn)了同一模型的優(yōu)化,

不同的模型計(jì)算出的概率是不一樣的,也就是說(shuō)樣本按概率排序時(shí)順序不同,那切分時(shí)自然可能分到不同的類(lèi),

這里體現(xiàn)了不同模型之間的差異,

所以ROC可以用來(lái)模型優(yōu)化和模型選擇,理論上講 P-R曲線也可以。

ROC曲線的繪制方法與P-R曲線類(lèi)似,不再贅述,結(jié)果如下圖

橫坐標(biāo)為假正例率,縱坐標(biāo)為真正例率,曲線下的面積叫 AUC

如何評(píng)價(jià)模型呢?

若學(xué)習(xí)器A的ROC曲線能包住學(xué)習(xí)器B的ROC曲線,則A優(yōu)于B

若學(xué)習(xí)器A的ROC曲線與學(xué)習(xí)器B的ROC曲線相交,則難以比較孰優(yōu)孰劣,此時(shí)可以比較AUC的大小

總結(jié)

模型評(píng)估主要考慮兩種場(chǎng)景:類(lèi)別均衡,類(lèi)別不均衡

模型評(píng)估必須考慮實(shí)際任務(wù)需求

P-R 曲線和 ROC曲線可以用于模型選擇

ROC曲線可以用于模型優(yōu)化

參考資料:

周志華《機(jī)器學(xué)習(xí)

本文由博客一文多發(fā)平臺(tái) OpenWrite 發(fā)布!

審核編輯 黃昊宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 模型
    +關(guān)注

    關(guān)注

    1

    文章

    3694

    瀏覽量

    51958
  • 機(jī)器學(xué)習(xí)

    關(guān)注

    66

    文章

    8546

    瀏覽量

    136539
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5594

    瀏覽量

    124161
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    , batch_size=512, epochs=20)總結(jié) 這個(gè)核心算法中的卷積神經(jīng)網(wǎng)絡(luò)結(jié)構(gòu)和訓(xùn)練過(guò)程,是用來(lái)對(duì)MNIST手寫(xiě)數(shù)字圖像進(jìn)行分類(lèi)的。模型將圖像作為輸入,通過(guò)卷積和池化層提取圖像的特征,然后通過(guò)全連接層進(jìn)行分類(lèi)預(yù)
    發(fā)表于 10-22 07:03

    如何評(píng)估諧波治理措施的效果?

    對(duì)新能源設(shè)備的損耗與危害。具體評(píng)估體系可拆解為 核心評(píng)估指標(biāo)、關(guān)鍵評(píng)估方法、標(biāo)準(zhǔn)化評(píng)估流程 三部分,同時(shí)需結(jié)合新能源場(chǎng)景(光伏、風(fēng)電、儲(chǔ)能)
    的頭像 發(fā)表于 10-14 17:04 ?671次閱讀

    迅為iTOP-RK3568人工智能開(kāi)發(fā)板mobilenet圖像分類(lèi)模型推理測(cè)試

    想快速驗(yàn)證MobileNet圖像分類(lèi)模型的實(shí)際運(yùn)行效果?迅為iTOP-RK3568人工智能開(kāi)發(fā)板,讓模型推理測(cè)試高效又省心。
    的頭像 發(fā)表于 08-28 15:53 ?1343次閱讀
    迅為iTOP-RK3568人工智能開(kāi)發(fā)板mobilenet圖像<b class='flag-5'>分類(lèi)</b><b class='flag-5'>模型</b>推理測(cè)試

    詳解SPICE器件模型分類(lèi)

    今天我們來(lái)聊聊工程師在仿真時(shí)比較關(guān)注的問(wèn)題。眾多的器件模型,我在仿真的時(shí)候到底應(yīng)該怎么選擇一個(gè)器件的模型?我使用的這個(gè)器件模型的精確度夠嗎?我自己能否做一個(gè)器件模型來(lái)支持我的電路仿真?
    的頭像 發(fā)表于 08-28 13:42 ?1280次閱讀
    詳解SPICE器件<b class='flag-5'>模型</b>的<b class='flag-5'>分類(lèi)</b>

    小白學(xué)大模型:國(guó)外主流大模型匯總

    )領(lǐng)域。論文的核心是提出了一種名為T(mén)ransformer的全新模型架構(gòu),它完全舍棄了以往序列模型(如循環(huán)神經(jīng)網(wǎng)絡(luò)RNNs和卷積神經(jīng)網(wǎng)絡(luò)CNNs)中常用的循環(huán)和卷積結(jié)構(gòu)
    的頭像 發(fā)表于 08-27 14:06 ?818次閱讀
    小白學(xué)大<b class='flag-5'>模型</b>:國(guó)外主流大<b class='flag-5'>模型</b><b class='flag-5'>匯總</b>

    NanoEdge AI生成的模型庫(kù),在keil里面編譯后運(yùn)行,返回都是0,沒(méi)挑出單分類(lèi),怎么解決?

    我打算識(shí)別具有特定特征的曲線,我按照單分類(lèi)進(jìn)行訓(xùn)練。2維數(shù)據(jù),輸入時(shí)間序列數(shù)據(jù),得分90+分,得到模型后。驗(yàn)證得分90+,我就在keil里面使用驗(yàn)證所用的數(shù)據(jù),挑選了一些無(wú)特征和有特征的數(shù)據(jù),判斷結(jié)果都返回0。 如何解決呢?
    發(fā)表于 08-12 07:52

    如何評(píng)估協(xié)議分析儀的性能指標(biāo)?

    評(píng)估協(xié)議分析儀的性能指標(biāo)需從硬件處理能力、協(xié)議解析精度、實(shí)時(shí)響應(yīng)效率、擴(kuò)展性與兼容性、用戶(hù)體驗(yàn)五大維度綜合考量。以下是具體指標(biāo)評(píng)估方法,結(jié)合實(shí)際場(chǎng)景說(shuō)明其重要性:一、硬件處理能力:決
    發(fā)表于 07-18 14:44

    天線的工作原理、分類(lèi)及性能指標(biāo)

    到神秘的雷達(dá)探測(cè),從家庭電視信號(hào)接收到底層的遙感技術(shù),天線的應(yīng)用無(wú)處不在,其性能優(yōu)劣直接關(guān)系到通信質(zhì)量與信號(hào)覆蓋范圍。本文將深入剖析天線的工作原理、分類(lèi)、性能指標(biāo)以及測(cè)量方法,帶您領(lǐng)略天線的神奇世界。
    的頭像 發(fā)表于 07-07 13:39 ?4891次閱讀
    天線的工作原理、<b class='flag-5'>分類(lèi)</b>及性能<b class='flag-5'>指標(biāo)</b>

    商湯日日新SenseNova融合模態(tài)大模型 國(guó)內(nèi)首家獲得最高評(píng)級(jí)的大模型

    近日,中國(guó)信息通信研究院(以下簡(jiǎn)稱(chēng)“中國(guó)信通院”)完成可信AI多模態(tài)大模型首輪評(píng)估。 商湯日日新SenseNova融合模態(tài)大模型在所有模型中,獲得當(dāng)前最高評(píng)級(jí)——4+級(jí),并成為國(guó)內(nèi)首家
    的頭像 發(fā)表于 06-11 11:57 ?1285次閱讀

    知識(shí)分享 | 評(píng)估模型架構(gòu)——如何實(shí)現(xiàn)?

    確保良好的模型架構(gòu)對(duì)于開(kāi)發(fā)安全和可靠的軟件非常重要。本文為您介紹MES Model Examiner? (MXAM)如何優(yōu)化模型架構(gòu),簡(jiǎn)化復(fù)雜度管理步驟,并最終提升軟件質(zhì)量。
    的頭像 發(fā)表于 06-05 11:46 ?546次閱讀
    知識(shí)分享 | <b class='flag-5'>評(píng)估</b><b class='flag-5'>模型</b>架構(gòu)——如何實(shí)現(xiàn)?

    別踩雷!二手應(yīng)用材料雙通道磁鐵驅(qū)動(dòng)器及通道電源采購(gòu)的關(guān)鍵評(píng)估指標(biāo)

    本文聚焦二手應(yīng)用材料雙通道磁鐵驅(qū)動(dòng)器及通道電源采購(gòu),系統(tǒng)梳理關(guān)鍵評(píng)估指標(biāo),包括核心性能、元件狀態(tài)、功能完整性等方面,為采購(gòu)者提供科學(xué)評(píng)估依據(jù),助力規(guī)避采購(gòu)風(fēng)險(xiǎn),獲取性能可靠的二手設(shè)備。 引言 在
    的頭像 發(fā)表于 06-05 09:43 ?537次閱讀
    別踩雷!二手應(yīng)用材料雙通道磁鐵驅(qū)動(dòng)器及通道電源采購(gòu)的關(guān)鍵<b class='flag-5'>評(píng)估</b><b class='flag-5'>指標(biāo)</b>

    激光器的多樣分類(lèi)與選型關(guān)鍵指標(biāo)全解析

    理解各類(lèi)激光器的特點(diǎn)及其關(guān)鍵指標(biāo),對(duì)于確保應(yīng)用效果至關(guān)重要。本文將對(duì)此進(jìn)行全面解析。 激光器的多樣分類(lèi) 激光器作為現(xiàn)代科技的重要產(chǎn)物,根據(jù)不同的分類(lèi)標(biāo)準(zhǔn),可以劃分為多個(gè)種類(lèi)。以下是從幾個(gè)主要維度對(duì)激光器的分
    的頭像 發(fā)表于 04-23 06:26 ?1491次閱讀
    激光器的多樣<b class='flag-5'>分類(lèi)</b>與選型關(guān)鍵<b class='flag-5'>指標(biāo)</b>全解析

    快速部署!米爾全志T527開(kāi)發(fā)板的OpenCV行人檢測(cè)方案指南

    ,計(jì)算HOG特征。HOG特征是一個(gè)一維向量,其中每個(gè)元素表示圖像中特定位置和方向的梯度強(qiáng)度。 訓(xùn)練SVM分類(lèi)器:使用HOG特征作為輸入,訓(xùn)練SVM分類(lèi)器。SVM分類(lèi)器將學(xué)習(xí)區(qū)分行人和非行人。
    發(fā)表于 04-11 18:14

    模型領(lǐng)域常用名詞解釋?zhuān)ń?00個(gè))

    本文總結(jié)了大模型領(lǐng)域常用的近100個(gè)名詞解釋?zhuān)凑?b class='flag-5'>模型架構(gòu)與基礎(chǔ)概念,訓(xùn)練方法與技術(shù),模型優(yōu)化與壓縮,推理與應(yīng)用,計(jì)算與性能優(yōu)化,數(shù)據(jù)與標(biāo)簽,模型
    的頭像 發(fā)表于 02-19 11:49 ?1446次閱讀
    大<b class='flag-5'>模型</b>領(lǐng)域常用名詞解釋?zhuān)ń?00個(gè))

    ADC的靜態(tài)指標(biāo)有專(zhuān)用的分析工具嗎?

    請(qǐng)問(wèn):ADC的靜態(tài)指標(biāo)有專(zhuān)用的分析工具嗎?該指標(biāo)很少在評(píng)估ADC指標(biāo)時(shí)使用,是否該指標(biāo)不重要,應(yīng)用中什么情況下需要
    發(fā)表于 02-08 08:13