chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

提供一種logit的調整方法來應對長尾分布的問題

工程師鄧生 ? 來源:GiantPandaCV ? 作者:Garfield ? 2022-09-05 14:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1. 論文信息

2. 介紹

在傳統(tǒng)的分類和識別任務中,訓練數(shù)據(jù)的分布往往都受到了人工的均衡,即不同類別的樣本數(shù)量無明顯差異,如最有影響力的ImageNet,每種類別的樣本數(shù)量就保持在1300張左右。

aece2de2-2cd9-11ed-ba43-dac502259ad0.jpg

在實際的視覺相關任務中,數(shù)據(jù)都存在如上圖所示的長尾分布,少量類別占據(jù)了絕大多少樣本,如圖中Head部分,大量的類別僅有少量的樣本,如圖中Tail部分。解決長尾問題的方案一般分為4種:

重采樣 (Re-sampling):采樣過程中采樣不同的策略,如對tail中的類別樣本進行過采樣,或者對head類別樣本進行欠采樣。

重加權 (Re-weighting):在訓練過程中給與每種樣本不同的權重,對tail類別loss設置更大的權重,這樣有限樣本數(shù)量。

新的學習策略 (Learning strategy):有專門為解決少樣本問題涉及的學習方法可以借鑒,如:meta-learning、transfer learning。另外,還可以調整訓練策略,將訓練過程分為兩步:第一步不區(qū)分head樣本和tail樣本,對模型正常訓練;第二步,設置小的學習率,對第一步的模型使用各種樣本平衡的策略進行finetune。

其實就筆者喜歡的風格而言,我對重加權這一方向的工作更為喜歡,因為通過各種統(tǒng)計學上的結論,來設計很好的loss改進來解決長尾/不均衡分布問題,我喜歡這類研究的原因是,他們(大部分)實現(xiàn)簡單,往往只需幾行代碼修改下loss,就可以取得非常有競爭力的結果,因為簡單所以很容易運用到一些復雜的任務中。

而從“奧卡姆剃刀”來看,我覺得各種遷移模型的理念雖然非常好,從頭部常見類中學習通用知識,然后遷移到尾部少樣本類別中,但是往往會需要設計復雜的模塊,有增加參數(shù)實現(xiàn)過擬合的嫌疑,我認為這其實是把簡單問題復雜化。我覺得從統(tǒng)計方面來設計更加優(yōu)美,因此本文來介紹一篇我非常喜歡的從統(tǒng)計角度出發(fā)的工作。這篇論文來自Google Research,他們提供了一種logit的調整方法來應對長尾分布的問題。由于研究風格更偏向 machine learning, 所以論文風格更偏向統(tǒng)計類。

本文首先總結了對于logit的調整方法:

聚焦于測試階段:對學習完的logit輸出進行處理(post-hoc normalization),根據(jù)一些先驗假設進行調整。

聚焦于訓練階段:在學習中調整loss函數(shù),相對平衡數(shù)據(jù)集來說,調整優(yōu)化的方向。

aeddeafc-2cd9-11ed-ba43-dac502259ad0.png

如上圖,這兩種方法都有許多較為優(yōu)秀的工作,但是文中描述了這兩種方法的幾種限制:

weight normalization非常依賴于weight的模長會因為class的data數(shù)量稀少而變小,然而這種假設非常依賴于優(yōu)化器的選擇

直接修改loss進行重加權,也會影響模型的表征學習,從而導致優(yōu)化過程不穩(wěn)定,同時模型可能對尾部類過擬合,傷害了模型表征學習能力。

論文的motivation就是克服這些缺點,讓不同類(head and tail classed)之間的logit能有一個相對較大的margin,設以一個consistent的loss,來讓模型的性能更好。

3. 問題設定和過往方法回顧

3.1 Problem Settings

論文先從統(tǒng)計學的角度定義了一下這個problem settings,其實就是訓練一個映射,讓這個scorer的誤分類損失最?。?/p>

但是類別不平衡的學習的setting導致P(y)分布是存在高度地skewed,使得許多尾部類別標簽出現(xiàn)的概率很低。在這里,錯誤分類的比例就不是一個合適的metric: 因為模型似乎把所有的尾部類別都分類成頭部類別也更夠取得比較好的效果。所為了解決這個問題,一個自然的選擇是平衡誤差,平均每個類的錯誤率,從而讓測試計算出的metric不是有偏的。

論文總結出了一個比較general的loss形式:

這里 是類別 yy 的權重;是另一個超參, 用來控制 margin 的大小。

3.2 Post-hoc weight normalization

由于頭部類別多,容易過擬合,自然會對頭部類別overconfidence,所以我們需要通過一定的映射來調整logit。具體到調整的策略,自然是讓大類置信度低一點,小類置信度高一點。

for , where and . Intuitively, either choice of upweights the contribution of rare labels through weight normalisation. The choice is motivated by the observations that tends to correlate with . Further to the above, one may enforce during training.

這里引用了一些其他做long-tail learning的論文,可以參考以便更好地對這一塊進行理解。

3.3 Loss modification

至于對于loss的修改,就是很直接了在前面加一個權重,對于的取值,自然就是各個工作重點關注和改進的地方。

af02f478-2cd9-11ed-ba43-dac502259ad0.png

論文給予原有的各種方法各種比較全面的總結。

4. 方法

首先進行Post-hoc logit adjustment:

其實等號左邊就是一個根據(jù)類別的樣本數(shù)進行re-weighting。但是為了在exp的線性變換加上temperature時候不影響排序問題,所以把等號右邊變成上式,通過這種方式放縮不會導致原本的排序出現(xiàn)問題。從而使得重加權仍能夠給尾部類更高的權重。

af2dc766-2cd9-11ed-ba43-dac502259ad0.png


把loss改寫成易于理解的方式就如下:

下面這個更為直接的loss被成為為pairwise margin loss,它可以把 y 與 y' 之間的margin拉大。

然后就是實現(xiàn)結合:

af47e862-2cd9-11ed-ba43-dac502259ad0.png

通過一些特殊的取值和另外的trick,可以實現(xiàn)兩者的結合。

5. 實驗結果

af5f3152-2cd9-11ed-ba43-dac502259ad0.png

這張圖非常有意思,可以看出兩個設計理念非常有效果。

af842f0c-2cd9-11ed-ba43-dac502259ad0.pngafa47d2a-2cd9-11ed-ba43-dac502259ad0.png

可以發(fā)現(xiàn)該方法在頭部類和尾部類的性能都有所提升。

6. 結論

摘要:這篇寫得很好的論文重新審視了logit調整的想法,以解決長尾問題。本文首先建立了一個統(tǒng)計框架,并以此為基礎提出了兩種有效實現(xiàn)對數(shù)平差的方法。他們通過在合成和自然長尾數(shù)據(jù)集上使用幾個相關基線對其進行測試,進一步證明了這種方法的潛力。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 映射
    +關注

    關注

    0

    文章

    48

    瀏覽量

    16429
  • 雙線性變換
    +關注

    關注

    0

    文章

    2

    瀏覽量

    5611

原文標題:Google提出面向長尾分布的logit的調整新方法

文章出處:【微信號:GiantPandaCV,微信公眾號:GiantPandaCV】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    指令集測試的一種糾錯方法

    本文描述在進行指令集測試的一種糾錯方法 1.打開測試指令集對應的dump文件 dump文件是指由匯編文件進行反匯編之后,可以供人閱讀指令的反匯編文件。其包含了每條指令的具體操作的信息。指令集測試
    發(fā)表于 10-24 14:04

    如何分析負載特性調整報警閾值?

    應明確的實操方法,確保閾值調整貼合負載實際需求: 、第步:分類識別負載類型 —— 明確 “敏感指標方向” 不同類型的負載,對電能質量的敏感指標完全不同(如有的怕暫降、有的怕諧波),
    的頭像 發(fā)表于 10-10 17:00 ?501次閱讀
    如何分析負載特性<b class='flag-5'>來</b><b class='flag-5'>調整</b>報警閾值?

    一種抗輻射加固檢錯糾錯電路的設計

    電子發(fā)燒友網站提供一種抗輻射加固檢錯糾錯電路的設計.pdf》資料免費下載
    發(fā)表于 08-11 15:38 ?0次下載

    一種新的無刷直流電機反電動勢檢測方法

    無位置傳感器無刷直流電機的控制算法是近年來研究的熱點之,有霍爾位置信號直流電機根據(jù)霍爾狀態(tài)確定通斷功率器件。利用無刷直流電機的數(shù)學模型,根據(jù)反電動勢檢測原理,提出了一種新的線反電動勢檢測
    發(fā)表于 08-07 14:29

    一種新的無刷直流電機反電動勢檢測方法

    無位置傳感器無刷直流電機的控制算法是近年來研究的熱點之,有霍爾位置信號直流電機根據(jù)霍爾狀態(tài)確定通斷功率器件。利用無刷直流電機的數(shù)學模型,根據(jù)反電動勢檢測原理,提出了一種新的線反電動勢檢測
    發(fā)表于 08-04 14:59

    想在rtsmart中使用uart2,是不是只能通過修改設備樹方法來實現(xiàn)uart2的復用呀?

    我想在rtsmart中使用uart2,是不是只能通過修改設備樹方法來實現(xiàn)uart2的復用呀? 修改設備樹后如何只編譯設備樹文件? 編譯生成的文件可以直接替換到廬山派里嗎,具體替換路徑在哪里呀?
    發(fā)表于 06-24 07:04

    使用ad9467-250采集低頻信號,請問有什么方法來提高sfdr嗎?

    你好,我現(xiàn)在在使用ad9467-250采集低頻信號,在測試3Mhz部分時sfdr只有86,采樣頻率是102.4Mhz,請問有什么方法來提高sfdr嗎
    發(fā)表于 04-24 06:05

    一種分段氣隙的CLLC變換器平面變壓器設計

    ,驗證理論設計的正確性,為變壓器制作提供理論依據(jù)。文中基于圖1電路拓撲研究了平面變壓器的設計與實現(xiàn)方法。 2 一種分段氣隙的CLLC平面變壓器設計圖1中拓撲變壓器副邊三繞組并聯(lián),實際上等效為三個變壓器
    發(fā)表于 03-27 13:57

    一種永磁電機用轉子組件制作方法

    。 本文著重闡述了這種電機轉子使用膠粘劑對磁鋼和芯軸直接粘接的制造方法,不需要進行同軸度機加工,并為這種制造方法提供一種自動調心定位機構;并研究了磁鋼零件的同軸度與產品最終裝配后組件
    發(fā)表于 03-25 15:20

    PTD08A010W想把1.8V的輸出通過軟件編程的方法來改成3.3V的輸出,怎么實現(xiàn)?

    我現(xiàn)在在用VC707FPGA開發(fā)板,上面用到了PTD08A010W這款電源芯片,這里提供的是12V轉1.8V的功能,但現(xiàn)在我想把1.8V的輸出通過軟件編程的方法來改成3.3V的輸出,請問有誰可以提供具體的幫助嗎?下面是實際的
    發(fā)表于 03-03 07:55

    用ADS1258做了塊采集卡,請問有比較簡單的測試方法來測試我的采集卡的性能和精度嗎?

    您好!我現(xiàn)在用ADS1258做了塊采集卡,請問有比較簡單的測試方法來測試我的采集卡的性能和精度嗎。 我現(xiàn)在用普通的信號發(fā)生器產生了個正弦波,1KHz的頻率,用采集卡采集了16*1024個數(shù)
    發(fā)表于 02-10 07:49

    基于ptp的分布式系統(tǒng)設計

    。 PTP概述 PTP是一種網絡時間同步協(xié)議,它允許網絡中的設備同步它們的時鐘。PTP基于IEEE 1588標準,旨在提供亞微秒級別的時間同步精度。PTP通過在網絡中傳播時間信息,并使用這些信息校正本地時鐘,從而實現(xiàn)精確的時間
    的頭像 發(fā)表于 12-29 10:09 ?953次閱讀

    西林瓶密封測試儀:分析不同測試方法的優(yōu)劣

    作為藥品包裝的重要容器,西林瓶的密封性能對于保證藥品質量至關重要。因此,西林瓶密封測試儀應運而生,提供了多種測試方法來評估西林瓶的密封性能。本文將重點分析肉眼檢測、水檢測和氣體檢測三測試方法
    的頭像 發(fā)表于 12-17 11:52 ?820次閱讀
    西林瓶密封測試儀:分析不同測試<b class='flag-5'>方法</b>的優(yōu)劣

    一種降低VIO/VSLAM系統(tǒng)漂移的新方法

    本文提出了一種方法,通過使用點到平面匹配將VIO/VSLAM系統(tǒng)生成的稀疏3D點云與數(shù)字孿生體進行對齊,從而實現(xiàn)精確且全球致的定位,無需視覺數(shù)據(jù)關聯(lián)。所提方法為VIO/VSLAM系
    的頭像 發(fā)表于 12-13 11:18 ?1171次閱讀
    <b class='flag-5'>一種</b>降低VIO/VSLAM系統(tǒng)漂移的新<b class='flag-5'>方法</b>

    一種混合顏料光譜分區(qū)間識別方法

    古代彩繪顏料的分析是科技考古與文物保護研究的重要內容,高光譜是近年來發(fā)展迅速的新興技術,在物質識別上具有廣泛應用,提出一種基于高光譜分區(qū)間的混合顏料識別方法。 一種混合顏料光譜分區(qū)間識別方法
    的頭像 發(fā)表于 12-02 16:22 ?742次閱讀
    <b class='flag-5'>一種</b>混合顏料光譜分區(qū)間識別<b class='flag-5'>方法</b>