chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

一篇解決表示學習坍塌問題的工作報告

深度學習自然語言處理 ? 來源:圓圓的算法筆記 ? 作者:Fareise ? 2022-08-31 11:12 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

1 表示學習中的坍塌問題

在表示學習中,一種很常見的做法是利用孿生網(wǎng)絡的結構,讓同一個樣本的不同數(shù)據(jù)增強后的表示相似。比如對于一張圖像,使用翻轉、裁剪等方法生成另一個增強圖像,兩個圖像分別經(jīng)過兩個共享參數(shù)的編碼器,得到表示,模型的優(yōu)化目標是讓這兩個表示的距離近。

這種方法一個比較大的挑戰(zhàn)在于,模型在訓練過程中容易出現(xiàn)坍塌問題。模型可以把所有樣本的表示都學成完全相同的常數(shù)向量(比如每個樣本模型的輸出都是全0向量),這樣就能滿足上述兩個表示距離近的要求了。

2 解決坍塌問題的方法

業(yè)內有很多解決坍塌問題的方法,主要可以分為4種類型:

對比學習方法:在訓練一對正樣本對時,同時采樣大量的負樣本,讓正樣本之間離得近,負樣本之間離得遠,避免模型偷懶把所有樣本的表示都學成一樣的。

聚類方法:在訓練過程中增加一個聚類過程,將樣本分配給不同的類簇,然后在類簇級別進行對比學習。

基于蒸餾的方法:通過模型結構的角度避免坍塌問題,學習一個student network來預測teacher network的表示,teacher network是student network參數(shù)的滑動平均,teacher network不通過反向傳播更新參數(shù)。

信息最大化方法:讓生成的embedding中每一維的向量相互正交,使其信息量最大化,這樣可以避免各個維度的值信息過于冗余,防止坍塌問題。

目前常用的負樣本采樣方法,一個比較大的問題是計算開銷大,取得好的效果往往需要大量負樣本,因此有了MoCo等對比學習框架。本文提出的方法基于信息最大化的思路,能夠只使用正樣本對實現(xiàn)表示學習的同時,防止坍現(xiàn)象的發(fā)生。關于對比學習的常用經(jīng)典方法,可以參考這篇文章:對比學習中的4種經(jīng)典訓練模式

3 信息最大化方法歷史工作

基于信息最大化的方法典型的工作有兩篇ICLM 2021的文章,分別是Whitening for Self-Supervised Representation Learning(ICML 2021,W-MSE)Barlow twins: Self-supervised learning via redundancy reduction(ICML 2021)。下面介紹一下這兩篇文章的整體思路,F(xiàn)acebook的這篇論文也是基于這個思路設計的。

d3146b2a-284d-11ed-ba43-dac502259ad0.png

W-MSE的整體網(wǎng)絡結構如上圖,模型中輸入一對互為正樣本的樣本對(例如一個圖像的不同增強形式),使用共享參數(shù)Encoder分別編碼后,增加一個whitening模塊,對每個batch內的所有embedding進行白化,讓embedding的各個維度變量線性無關,后面再接norm處理。下圖形式化表明了W-MSE的用途,通過白化+norm讓樣本形成一個球形分布,正樣本之間距離近,每個樣本需要調整自己在圓周上的位置拉進正樣本之間的距離,形成最終的簇。

d33098f4-284d-11ed-ba43-dac502259ad0.png


Barlow twins方法也是同樣的思路,只是做法不同。在得到一對正樣本的兩個embedding后,計算兩個向量各個變量之間的相關性矩陣,優(yōu)化這個矩陣接近對角矩陣,以此實現(xiàn)embedding中各個變量之間線性無關。

d3550ca2-284d-11ed-ba43-dac502259ad0.png

4 VICREG

Facebook團隊提出的VICREG是上述基于信息最大化表示學習方法的一個擴展,損失函數(shù)主要包括variance、invariance、covariance三個部分。模型的主體結構如下,仍然是一個孿生網(wǎng)絡結構,輸入一個樣本的不同view互為正樣本。

d370b272-284d-11ed-ba43-dac502259ad0.png

variance部分主要是讓batch內每個樣本embedding向量的每一維變量之間的方差不小于一個值,這樣可以有效防止每個樣本的向量都對應同一個點的情況,防止坍塌的發(fā)生。

invariance部分即讓正樣本對的表示embedding距離盡可能小,是正常的表示學習loss。

covariance借鑒了Barlow twins中的思路,讓batch內的embedding非對角線元素盡可能為0,即讓表示向量各個維度變量線性無關。

最終的表示學習loss是由上述3個loss的加和:

d3817d8c-284d-11ed-ba43-dac502259ad0.png

5 實驗結果

作者進行了一些實驗驗證VICREG表示學習方法的效果。在ImageNet數(shù)據(jù)集上,使用不同方法預訓練的表示接一個線性層進行分類,或者基于預訓練的表示使用部分數(shù)據(jù)進行finetune,對比圖像分類效果,實驗結果如下:

d38f8f9e-284d-11ed-ba43-dac502259ad0.png

作者也對比了在不同方法上是否采用variance或covariance等loss的效果變化:

d3a9c04e-284d-11ed-ba43-dac502259ad0.png

6 總結

本文介紹了Facebook AI團隊在2022年ICLR的一篇解決表示學習坍塌問題的工作,順帶介紹了基于信息最大化的防坍塌工作,有助于幫助我們更深層次理解表示學習的原理,以及如何解決實際應用表示學習、對比學習時遇到的坍塌問題。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 矩陣
    +關注

    關注

    1

    文章

    450

    瀏覽量

    36275
  • Network
    +關注

    關注

    0

    文章

    64

    瀏覽量

    30596

原文標題:ICLR2022 | Facebook AI提出解決表示學習坍塌問題新方法

文章出處:【微信號:zenRRan,微信公眾號:深度學習自然語言處理】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    四維圖新旗下六分科技助力低空經(jīng)濟高質量發(fā)展

    在日前發(fā)布的2026年《政府工作報告》中,低空經(jīng)濟與集成電路、航空航天、生物醫(yī)藥起被定義為新興支柱產(chǎn)業(yè)。低空經(jīng)濟已經(jīng)連續(xù)三年寫入政府工作報告,產(chǎn)業(yè)定位不斷提格,從技術培育階段進入商業(yè)化系統(tǒng)推進的嶄新征程。
    的頭像 發(fā)表于 03-18 17:21 ?922次閱讀

    天合光能正在積極布局“未來能源”

    2026年全國兩會,“未來能源”寫入政府工作報告,并與“量子科技、具身智能、腦機接口、6G等”共同列入未來產(chǎn)業(yè),成為亮眼的新詞。
    的頭像 發(fā)表于 03-16 11:39 ?444次閱讀

    《具身智能發(fā)展報告(2025年)》

    《具身智能發(fā)展報告(2025年)》由中國信息通信研究院與清華大學電子工程系聯(lián)合發(fā)布,是我國首部系統(tǒng)梳理具身智能產(chǎn)業(yè)發(fā)展現(xiàn)狀與趨勢的權威藍皮書。報告立足2025年《政府工作報告》首次將“具身智能”列入
    的頭像 發(fā)表于 02-03 11:17 ?1323次閱讀
    《具身智能發(fā)展<b class='flag-5'>報告</b>(2025年)》

    聊那些改變低空經(jīng)濟的核心技術

    低空經(jīng)濟(Low-altitude economy)詞火于2024年,當年3月首次被寫入中國的政府工作報告。份中國信息協(xié)會年初的報告顯示,截止2024年我國已有42家eVTOL整機
    的頭像 發(fā)表于 01-28 17:03 ?1303次閱讀

    【社區(qū)之星】宿晶亮——個人的愛好,足以點燃不設限的學習熱情

    本身是個包容性很強的行業(yè),可以要求專業(yè)者不斷地追求極致,也可以給極客、愛好者、學生留有片廣闊的創(chuàng)意和學習空間。 工作經(jīng)歷 20多年的運維工作
    發(fā)表于 12-03 18:11

    施耐德電氣聯(lián)合發(fā)布2025零碳園區(qū)行業(yè)影響力洞察報告

    今年,“零碳園區(qū)”首次被寫入政府工作報告,正式邁入規(guī)?;l(fā)展“元年”,園區(qū)作為產(chǎn)業(yè)發(fā)展的重要載體,其綠色低碳轉型成為了“雙碳”目標實現(xiàn)的強有力抓手。
    的頭像 發(fā)表于 11-26 11:43 ?833次閱讀

    【「高速數(shù)字設計(基礎)」閱讀體驗】 + 書籍評測第一篇

    者系統(tǒng)深刻地學習與理解高速數(shù)字設計有著非常實用的價值! 最后,本人主要是做PCB設計方面的工作,收到本書后,優(yōu)先閱讀了關于高速PCB設計的內容,感到十分興奮!為什么呢,請聽我細細道來。閱讀第八章電源
    發(fā)表于 11-09 10:31

    UN38.3測試報告包含空海運報告

    般來說,UN38.3測試報告本身并不等同于空海運報告,但它是辦理空運、海運危險品運輸鑒定報告(即DGM或MSDS報告)的前提文件之
    的頭像 發(fā)表于 11-06 13:50 ?875次閱讀
    UN38.3測試<b class='flag-5'>報告</b>包含空海運<b class='flag-5'>報告</b>嗎

    學習物聯(lián)網(wǎng)可以做什么工作?

    學習物聯(lián)網(wǎng)專業(yè)后,你可以從事多種與物聯(lián)網(wǎng)相關的工作。物聯(lián)網(wǎng)是個非常新穎和實用的領域,各種應用場景都還在不斷地探索和創(chuàng)新。學習這門專業(yè)可以為人們提供廣闊的就業(yè)機會,特別是在智慧城市、智
    發(fā)表于 10-11 16:40

    廣電計量打造適航取證與試驗驗證新高地

    2025 年政府工作報告明確提出,“開展新技術新產(chǎn)品新場景大規(guī)模應用示范行動,推動商業(yè)航天、低空裝備等新興產(chǎn)業(yè)安全健康發(fā)展”。作為新質生產(chǎn)力的典型代表,低空產(chǎn)業(yè)連續(xù)兩年被寫入政府工作報告,從 “積極打造” 到 “推動應用落地”,低空產(chǎn)業(yè)已進入規(guī)?;l(fā)展的關鍵窗口期。
    的頭像 發(fā)表于 09-01 16:27 ?1843次閱讀
    廣電計量打造適航取證與試驗驗證新高地

    最新人工智能硬件培訓AI 基礎入門學習課程參考2025版(大模型

    教育等領域發(fā)揮著越來越重要的作用。?針對日前前來咨詢的廣大客戶對面向大模型智能硬件的學習需求,我們根據(jù)CSK6大模型語音視覺開發(fā)板已有功能,整理了份適合基于本開發(fā)板進行教學活動的學習課程參考給大家備用,其中基礎概念大家可以通過
    發(fā)表于 07-04 11:10

    章 W55MH32 高性能以太網(wǎng)單片機的學習方法概述

    本章介紹W55MH32的學習方法,建議先了解硬件資源,按基礎、入門循序漸進學習。參考兩份手冊,提供例程資料,還給出官網(wǎng)、github 等學習
    的頭像 發(fā)表于 05-26 09:07 ?1110次閱讀
    第<b class='flag-5'>一</b>章 W55MH32 高性能以太網(wǎng)單片機的<b class='flag-5'>學習</b>方法概述

    從“單腦”到“雙腦”:具身智能機器人邁向L4時代的核心架構革新

    、浙江、安徽等20余省市已將具身智能寫入地方政府工作報告,并出臺行動計劃。這系列政策信號釋放了國家對具身智能產(chǎn)業(yè)發(fā)展的高度重視,為行業(yè)發(fā)展注入了強勁動力。2024年
    的頭像 發(fā)表于 05-22 16:26 ?1554次閱讀
    從“單腦”到“雙腦”:具身智能機器人邁向L4時代的核心架構革新

    1000+例各類獲獎電賽作品資料集(電路、代碼、教程文末免費領?。?/a>

    本資料匯集了歷屆電賽的優(yōu)秀獲獎作品,并對所有作品資料進行仔細分類方便用戶們選擇學習,是套價值極高的參考學習資料,適合每位電子愛好者、電子工程師和對電賽感興趣的學生,相信通過這套資料
    的頭像 發(fā)表于 05-22 11:41 ?956次閱讀
    1000+例各類獲獎電賽作品資料集(電路<b class='flag-5'>篇</b>、代碼<b class='flag-5'>篇</b>、教程<b class='flag-5'>篇</b>文末免費領取)

    180發(fā)燒功放制作學習資料【經(jīng)典】

    一百多經(jīng)典學習資料,部分資料內容截?。? 純分享貼,有需要可以直接下載附件獲取完整資料! (如果內容有幫助可以關注、點贊、評論支持下哦~)
    發(fā)表于 05-19 16:38