chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于有效樣本的類別不平衡損失

自然語(yǔ)言處理愛(ài)好者 ? 來(lái)源:AI公園 ? 作者:Sik-Ho Tsang ? 2021-08-16 11:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導(dǎo)讀

使用每個(gè)類的有效樣本數(shù)量來(lái)重新為每個(gè)類的Loss分配權(quán)重,效果優(yōu)于RetinaNet中的Focal Loss。

本文綜述了康奈爾大學(xué)、康奈爾科技、谷歌Brain和Alphabet公司的基于有效樣本數(shù)的類平衡損失(CB損失)。在本文中,設(shè)計(jì)了一種重新加權(quán)的方案,利用每個(gè)類的有效樣本數(shù)來(lái)重新平衡損失,稱為類別平衡損失。

1. 類別平衡問(wèn)題

假設(shè)有像上面那樣的不平衡的類。head:對(duì)于索引小的類,這些類有較多的樣本。Tail:對(duì)于大索引的類,這些類的樣本數(shù)量較少。黑色實(shí)線:直接在這些樣本上訓(xùn)練的模型偏向于優(yōu)勢(shì)類。紅色虛線:通過(guò)反向類頻率來(lái)重新加權(quán)損失可能會(huì)在具有高類不平衡的真實(shí)數(shù)據(jù)上產(chǎn)生較差的性能。藍(lán)虛線:設(shè)計(jì)了一個(gè)類平衡項(xiàng),通過(guò)反向有效樣本數(shù)來(lái)重新加權(quán)損失。

2. 有效樣本數(shù)量

2.1. 定義

6f483fc4-fd9a-11eb-9bcf-12bb97331649.png

數(shù)據(jù)間信息重疊,左:特征空間S,中:1個(gè)樣本數(shù)據(jù)的單位體積,右:數(shù)據(jù)間信息重疊

直覺(jué)上,數(shù)據(jù)越多越好。但是,由于數(shù)據(jù)之間存在信息重疊,隨著樣本數(shù)量的增加,模型從數(shù)據(jù)中提取的邊際效益會(huì)減少

左:給定一個(gè)類,將該類的特征空間中所有可能數(shù)據(jù)的集合表示為S。假設(shè)S的體積為N且N≥1。中:S子集中的每個(gè)樣本的單位體積為1,可能與其他樣本重疊。Right:從S中隨機(jī)抽取每個(gè)子集,覆蓋整個(gè)S集合。采樣的數(shù)據(jù)越多,S的覆蓋率就越好。期望的采樣數(shù)據(jù)總量隨著樣本數(shù)量的增加而增加,以N為界。

因此,將有效樣本數(shù)定義為樣本的期望體積。

這個(gè)想法是通過(guò)使用一個(gè)類的更多數(shù)據(jù)點(diǎn)來(lái)捕捉邊際效益的遞減。由于現(xiàn)實(shí)世界數(shù)據(jù)之間的內(nèi)在相似性,隨著樣本數(shù)量的增加,新添加的樣本極有可能是現(xiàn)有樣本的近重復(fù)。另外,cnn是用大量的數(shù)據(jù)增廣來(lái)訓(xùn)練的,所有的增廣實(shí)例也被認(rèn)為與原始實(shí)例相同。對(duì)于一個(gè)類,N可以看作是唯一原型的數(shù)量。

2.2. 數(shù)學(xué)公式

En表示樣本的有效數(shù)量(期望體積)。為了簡(jiǎn)化問(wèn)題,不考慮部分重疊的情況。也就是說(shuō),一個(gè)新采樣的數(shù)據(jù)點(diǎn)只能以兩種方式與之前的采樣數(shù)據(jù)交互:完全在之前的采樣數(shù)據(jù)集中,概率為p,或完全在原來(lái)的數(shù)據(jù)集之外,的概率為1- p。

有效數(shù)字:En = (1?β^n)/(1?β),其中,β = (N? 1)/N,這個(gè)命題可以用數(shù)學(xué)歸納法證明。當(dāng)E1 = 1時(shí),不存在重疊,E1 =(1?β^1)/(1?β) = 1成立。假設(shè)已經(jīng)有n?1個(gè)樣本,并且即將對(duì)第n個(gè)樣本進(jìn)行采樣,現(xiàn)在先前采樣數(shù)據(jù)的期望體積為En ?1,而新采樣的數(shù)據(jù)點(diǎn)與先前采樣點(diǎn)重疊的概率為 p = E(n?1)/N。因此,第n個(gè)實(shí)例采樣后的期望體積為:

6f8b26a4-fd9a-11eb-9bcf-12bb97331649.png

此時(shí):

我們有:

6fc6da32-fd9a-11eb-9bcf-12bb97331649.png

上述命題表明有效樣本數(shù)是n的指數(shù)函數(shù)。超參數(shù)β∈[0,1)控制En隨著n的增長(zhǎng)有多快。

3. 類別平衡 Loss (CB Loss)

類別平衡(CB)loss可以寫(xiě)成:

6fe31a80-fd9a-11eb-9bcf-12bb97331649.png

其中,ny是類別y的ground-truth的數(shù)量。β = 0對(duì)應(yīng)沒(méi)有重新加權(quán), β → 1對(duì)應(yīng)于用反向頻率進(jìn)行加權(quán)。

提出的有效樣本數(shù)的新概念使我們能夠使用一個(gè)超參數(shù)β來(lái)平滑地調(diào)整無(wú)重權(quán)和反向類頻率重權(quán)之間的類平衡項(xiàng)。

所提出的類平衡項(xiàng)是模型不可知的和損失不可知的,因?yàn)樗?dú)立于損失函數(shù)L和預(yù)測(cè)類概率p的選擇。

3.1. 類別平衡的 Softmax 交叉熵?fù)p失

給定一個(gè)標(biāo)號(hào)為y的樣本,該樣本的softmax交叉熵(CE)損失記為:

6ff9c546-fd9a-11eb-9bcf-12bb97331649.png

假設(shè)類y有ny個(gè)訓(xùn)練樣本,類平衡(CB)softmax交叉熵?fù)p失為:

70271b54-fd9a-11eb-9bcf-12bb97331649.png

3.2. 類別平衡的 Sigmoid 交叉熵?fù)p失

當(dāng)對(duì)多類問(wèn)題使用sigmoid函數(shù)時(shí),網(wǎng)絡(luò)的每個(gè)輸出都執(zhí)行一個(gè)one-vs-all分類,以預(yù)測(cè)目標(biāo)類在其他類中的概率。在這種情況下,Sigmoid不假定類之間的互斥性。由于每個(gè)類都被認(rèn)為是獨(dú)立的,并且有自己的預(yù)測(cè)器,所以sigmoid將單標(biāo)簽分類和多標(biāo)簽預(yù)測(cè)統(tǒng)一起來(lái)。這是一個(gè)很好的屬性,因?yàn)楝F(xiàn)實(shí)世界的數(shù)據(jù)通常有多個(gè)語(yǔ)義標(biāo)簽。sigmoid交叉熵(CE)損失可以寫(xiě)成:

7032cd82-fd9a-11eb-9bcf-12bb97331649.png

類平衡(CB) sigmoid交叉熵?fù)p失為:

709d0724-fd9a-11eb-9bcf-12bb97331649.png

3.3. 類別平衡 Focal Loss

Focal loss (FL)是在RetinaNet中提出的,可以減少分類很好的樣本的損失,聚焦于困難的樣本。

類別平衡的 (CB) Focal Loss為:

70d554f8-fd9a-11eb-9bcf-12bb97331649.png

4. 實(shí)驗(yàn)結(jié)果

4.1. 數(shù)據(jù)集

試驗(yàn)了CIFAR-10和CIFAR-100的5個(gè)不平衡系數(shù)分別為10、20、50、100和200的長(zhǎng)尾版本。iNaturalist 和ILSVRC是天然的類別不平衡數(shù)據(jù)集。

上面顯示了每個(gè)類具有不同不平衡因素的圖像數(shù)量。

4.2. CIFAR 數(shù)據(jù)集

loss類型的超參數(shù)搜索空間為{softmax, sigmoid, focal}, [focal loss]的超參數(shù)搜索空間為β∈{0.9,0.99,0.999,0.9999},γ∈{0.5,1.0,2.0}。在CIFAR-10上,最佳的β一致為0.9999。但在CIFAR-100上,不同不平衡因子的數(shù)據(jù)集往往有不同且較小的最優(yōu)β。

718c16f2-fd9a-11eb-9bcf-12bb97331649.png

有和沒(méi)有類平衡項(xiàng)時(shí)的分類錯(cuò)誤率

在CIFAR-10上,根據(jù)β = 0.9999重新加權(quán)后,有效樣本數(shù)與樣本數(shù)接近。這意味著CIFAR-10的最佳重權(quán)策略與逆類頻率重權(quán)類似。在CIFAR-100上,使用較大的β的性能較差,這表明用逆類頻率重新加權(quán)不是一個(gè)明智的選擇,需要一個(gè)更小的β,具有更平滑的跨類權(quán)重。例如,一個(gè)特定鳥(niǎo)類物種的獨(dú)特原型數(shù)量應(yīng)該小于一個(gè)一般鳥(niǎo)類類的獨(dú)特原型數(shù)量。由于CIFAR-100中的類比CIFAR-10更細(xì)粒度,因此CIFAR-100的N比CIFAR-10小。

4.3. 大規(guī)模數(shù)據(jù)集

721263ba-fd9a-11eb-9bcf-12bb97331649.png

在所有數(shù)據(jù)集驗(yàn)證集上,使用不同損失函數(shù)訓(xùn)練的大規(guī)模數(shù)據(jù)集上的Top-1和Top-5分類錯(cuò)誤率

使用了類平衡的Focal Loss,因?yàn)樗哂懈蟮撵`活性,并且發(fā)現(xiàn)β = 0.999和γ = 0.5在所有數(shù)據(jù)集上都獲得了合理的良好的性能。值得注意的是,使用了類別平衡的Focal Loss來(lái)代替Softmax交叉熵,ResNet-50能夠達(dá)到和ResNet-152相應(yīng)的性能。

以上數(shù)字顯示類平衡的Focal Loss損失經(jīng)過(guò)60個(gè)epochs的訓(xùn)練后,開(kāi)始顯示其優(yōu)勢(shì)。

英文原文:https://medium.com/nerd-for-tech/review-cb-loss-class-balanced-loss-based-on-effective-number-of-samples-image-classification-3056a1a1a001

作者:Sik-Ho Tsang

編譯:ronghuaiyang(AI公園)

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6238

    瀏覽量

    109831
  • 數(shù)據(jù)集
    +關(guān)注

    關(guān)注

    4

    文章

    1229

    瀏覽量

    25913
  • cnn
    cnn
    +關(guān)注

    關(guān)注

    3

    文章

    355

    瀏覽量

    23109

原文標(biāo)題:CB Loss:基于有效樣本的類別不平衡損失

文章出處:【微信號(hào):NLP_lover,微信公眾號(hào):自然語(yǔ)言處理愛(ài)好者】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    電能質(zhì)量在線監(jiān)測(cè)裝置三相不平衡度能實(shí)時(shí)算嗎?

    是的,現(xiàn)代電能質(zhì)量在線監(jiān)測(cè)裝置能夠?qū)崟r(shí)計(jì)算三相不平衡度,且精度和響應(yīng)速度已達(dá)到工程實(shí)用水平。以下從技術(shù)實(shí)現(xiàn)、標(biāo)準(zhǔn)規(guī)范、硬件支撐和實(shí)際應(yīng)用四個(gè)維度展開(kāi)分析: 一、核心算法與動(dòng)態(tài)響應(yīng)能力 對(duì)稱分量法
    的頭像 發(fā)表于 10-15 16:22 ?28次閱讀

    三相不平衡度的國(guó)標(biāo)是怎樣規(guī)定電能質(zhì)量在線監(jiān)測(cè)裝置的監(jiān)測(cè)精度的?

    根據(jù)現(xiàn)行國(guó)家標(biāo)準(zhǔn) GB/T 15543-2008《電能質(zhì)量 三相電壓不平衡》 及相關(guān)配套規(guī)范(如 GB/T 19862-2016《電能質(zhì)量監(jiān)測(cè)設(shè)備通用要求》 ),電能質(zhì)量在線監(jiān)測(cè)裝置對(duì)三相不平衡
    的頭像 發(fā)表于 10-11 16:31 ?479次閱讀
    三相<b class='flag-5'>不平衡</b>度的國(guó)標(biāo)是怎樣規(guī)定電能質(zhì)量在線監(jiān)測(cè)裝置的監(jiān)測(cè)精度的?

    變頻器輸出不平衡及對(duì)策

    變頻器輸出不平衡是工業(yè)自動(dòng)化領(lǐng)域中常見(jiàn)的問(wèn)題,它可能導(dǎo)致電機(jī)運(yùn)行異常、設(shè)備損壞甚至生產(chǎn)事故。本文將深入分析變頻器輸出不平衡的原因,并提出相應(yīng)的解決方案,幫助工程師和技術(shù)人員有效應(yīng)對(duì)這一挑戰(zhàn)。 一
    的頭像 發(fā)表于 08-23 17:09 ?970次閱讀
    變頻器輸出<b class='flag-5'>不平衡</b>及對(duì)策

    無(wú)軸承異步電機(jī)的不平衡振動(dòng)補(bǔ)償控制

    異步電機(jī)轉(zhuǎn)子的不平衡振動(dòng)位移幅度,在穩(wěn)態(tài)下能基本消除不平衡振動(dòng)激振力對(duì)軸心軌跡的影響,從而有效提高轉(zhuǎn)子的懸浮運(yùn)行控制精度。所給不平衡振動(dòng)補(bǔ)償控制策略是
    發(fā)表于 07-14 17:37

    ANSNP中線安防保護(hù)器讓諧波和不平衡無(wú)處可逃!

    和裝置的使用以及三相不平衡等問(wèn)題的存在會(huì)導(dǎo)致中性線電流過(guò)大,容易造成中性線絕緣層老化起火從而引發(fā)火災(zāi),存在較大的安全隱患。 1、中性線的危害 在三相四線制或五線制供電系統(tǒng)運(yùn)行過(guò)程中,中性線引發(fā)火災(zāi)事故主要通過(guò)三種途徑
    的頭像 發(fā)表于 06-10 22:42 ?357次閱讀
    ANSNP中線安防保護(hù)器讓諧波和<b class='flag-5'>不平衡</b>無(wú)處可逃!

    輪轂電機(jī)不平衡電磁力對(duì)車(chē)輪定位參數(shù)的影響

    [摘要] 輪轂電機(jī)驅(qū)動(dòng)電動(dòng)汽車(chē)將電機(jī)、減速機(jī)構(gòu)和制動(dòng)器等高度集成于車(chē)輪內(nèi)。不同路面激勵(lì)下的輪胎跳動(dòng)、載荷不均和軸承磨損等造成電機(jī)氣隙沿圓周分布不均,其所產(chǎn)生的不平衡電磁力將會(huì)通過(guò)減速機(jī)構(gòu)或直接傳遞
    發(fā)表于 06-10 13:17

    伺服電機(jī)三相不平衡原因及解決方法

    伺服電機(jī)作為現(xiàn)代工業(yè)自動(dòng)化系統(tǒng)中的核心執(zhí)行元件,其穩(wěn)定運(yùn)行直接關(guān)系到生產(chǎn)效率和設(shè)備壽命。然而在實(shí)際應(yīng)用中,三相電流不平衡問(wèn)題頻發(fā),輕則導(dǎo)致電機(jī)發(fā)熱、效率下降,重則引發(fā)設(shè)備停機(jī)甚至繞組燒毀。本文將
    的頭像 發(fā)表于 05-06 07:40 ?947次閱讀
    伺服電機(jī)三相<b class='flag-5'>不平衡</b>原因及解決方法

    3A325薄型平衡不平衡變壓器Anaren

    3A325薄型平衡不平衡變壓器Anaren 3A325 是一款由 Anaren Microwave 生產(chǎn)的表面貼裝(SMD)巴倫變壓器(Balun Transformer),適用于無(wú)線通信和射頻
    發(fā)表于 03-11 09:31

    Disco主軸動(dòng)平衡的詳細(xì)驗(yàn)收步驟

    ,測(cè)量主軸的關(guān)鍵尺寸,以確保后續(xù)測(cè)試的準(zhǔn)確性?1。 ? 不平衡量測(cè)量階段 ? 利用數(shù)字化顯示儀或其他專業(yè)動(dòng)平衡檢測(cè)設(shè)備,測(cè)量主軸的不平衡量?12。 根據(jù)測(cè)量結(jié)果,判斷主軸的不平衡狀態(tài),
    的頭像 發(fā)表于 02-24 09:12 ?514次閱讀

    伺服電子變壓器輸出電壓不平衡的原因及相應(yīng)的解決方案

    伺服電子變壓器在工業(yè)自動(dòng)化系統(tǒng)中也是至關(guān)重要的,它們負(fù)責(zé)將輸入的交流電壓轉(zhuǎn)換成不同級(jí)別的交流電壓,以精確驅(qū)動(dòng)和控制伺服電機(jī)。然而,在實(shí)際應(yīng)用中,伺服電子變壓器輸出電壓不平衡的問(wèn)題時(shí)有發(fā)生,這不
    的頭像 發(fā)表于 02-23 12:19 ?1058次閱讀
    伺服電子變壓器輸出電壓<b class='flag-5'>不平衡</b>的原因及相應(yīng)的解決方案

    B0430J50100AHF超小型不平衡轉(zhuǎn)平衡變壓器

    B0430J50100AHF超小型不平衡轉(zhuǎn)平衡變壓器B0430J50100AHF是Anaren推出的一款超小型、低成本且低輪廓的不平衡轉(zhuǎn)平衡變壓器,專為滿足新一代A/D和D/A轉(zhuǎn)換器I
    發(fā)表于 02-08 09:26

    平衡電阻器可以改為不平衡

    在電子電路中,平衡電阻器與不平衡電阻器各自扮演著重要的角色。平衡電阻器主要用于實(shí)現(xiàn)電路的平衡和穩(wěn)定性,減少噪音和干擾,提高信號(hào)質(zhì)量。而不平衡
    的頭像 發(fā)表于 01-30 14:31 ?1482次閱讀

    朗凱威探秘磷酸鐵鋰電池組電壓不平衡的“前世今生”

    磷酸鐵鋰電池組133-2632-1310電壓不平衡在實(shí)際使用中有多種具體表現(xiàn)。其中最明顯的是單體電池間電壓差異明顯。在正常工作狀態(tài)下,單體電池間的電壓差應(yīng)不超過(guò) 0.1V。如果超出這個(gè)范圍,就可能出現(xiàn)電壓不平衡的情況。
    的頭像 發(fā)表于 11-29 16:51 ?5636次閱讀
    朗凱威探秘磷酸鐵鋰電池組電壓<b class='flag-5'>不平衡</b>的“前世今生”

    單元不平衡永久故障閾值的單元類型特定設(shè)置

    電子發(fā)燒友網(wǎng)站提供《單元不平衡永久故障閾值的單元類型特定設(shè)置.pdf》資料免費(fèi)下載
    發(fā)表于 10-18 11:21 ?0次下載
    單元<b class='flag-5'>不平衡</b>永久故障閾值的單元類型特定設(shè)置

    動(dòng)平衡校正和振動(dòng)測(cè)量有關(guān)嗎?

    動(dòng)平衡校正和振動(dòng)測(cè)量有關(guān)嗎?動(dòng)平衡和測(cè)量振動(dòng)是相關(guān)但不同的概念。振動(dòng)檢測(cè)是一種通過(guò)監(jiān)測(cè)機(jī)械系統(tǒng)的振動(dòng)來(lái)識(shí)別問(wèn)題的方法。它涉及測(cè)量振動(dòng)的振幅、頻率、相位和譜分析等參數(shù)。動(dòng)平衡是一種專門(mén)針對(duì)不平衡
    的頭像 發(fā)表于 10-18 11:21 ?663次閱讀
    動(dòng)<b class='flag-5'>平衡</b>校正和振動(dòng)測(cè)量有關(guān)嗎?