chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長尾數(shù)據(jù)

智能感知與物聯(lián)網(wǎng)技術(shù)研究所 ? 來源:未知 ? 2023-06-18 21:30 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

aff2221c-0ddb-11ee-962d-dac502259ad0.png ?背景

機(jī)器學(xué)習(xí)領(lǐng)域中,學(xué)習(xí)不平衡的標(biāo)注數(shù)據(jù)一直是一個(gè)常見而具有挑戰(zhàn)性的任務(wù)。近年來,視覺 Transformer 作為一種強(qiáng)大的模型,在多個(gè)視覺任務(wù)上展現(xiàn)出令人滿意的效果。然而,視覺 Transformer 處理長尾分布數(shù)據(jù)的能力和特性,還有待進(jìn)一步挖掘。

目前,已有的長尾識(shí)別模型很少直接利用長尾數(shù)據(jù)對(duì)視覺 Transformer(ViT)進(jìn)行訓(xùn)練?;诂F(xiàn)成的預(yù)訓(xùn)練權(quán)重進(jìn)行研究可能會(huì)導(dǎo)致不公平的比較結(jié)果,因此有必要對(duì)視覺 Transformer 在長尾數(shù)據(jù)下的表現(xiàn)進(jìn)行系統(tǒng)性的分析和總結(jié)。

b004ada6-0ddb-11ee-962d-dac502259ad0.png

論文鏈接:

https://arxiv.org/abs/2212.02015

代碼鏈接:

https://github.com/XuZhengzhuo/LiVT 本文旨在填補(bǔ)這一研究空白,詳細(xì)探討了視覺 Transformer 在處理長尾數(shù)據(jù)時(shí)的優(yōu)勢和不足之處。本文將重點(diǎn)關(guān)注如何有效利用長尾數(shù)據(jù)來提升視覺 Transformer 的性能,并探索解決數(shù)據(jù)不平衡問題的新方法。通過本文的研究和總結(jié),研究團(tuán)隊(duì)有望為進(jìn)一步改進(jìn)視覺 Transformer 模型在長尾數(shù)據(jù)任務(wù)中的表現(xiàn)提供有益的指導(dǎo)和啟示。這將為解決現(xiàn)實(shí)世界中存在的數(shù)據(jù)不平衡問題提供新的思路和解決方案。 文章通過一系列實(shí)驗(yàn)發(fā)現(xiàn),在有監(jiān)督范式下,視覺 Transformer 在處理不平衡數(shù)據(jù)時(shí)會(huì)出現(xiàn)嚴(yán)重的性能衰退,而使用平衡分布的標(biāo)注數(shù)據(jù)訓(xùn)練出的視覺 Transformer 呈現(xiàn)出明顯的性能優(yōu)勢。相比于卷積網(wǎng)絡(luò),這一特點(diǎn)在視覺 Transformer 上體現(xiàn)的更為明顯。另一方面,無監(jiān)督的預(yù)訓(xùn)練方法無需標(biāo)簽分布,因此在相同的訓(xùn)練數(shù)據(jù)量下,視覺 Transformer 可以展現(xiàn)出類似的特征提取和重建能力。 基于以上觀察和發(fā)現(xiàn),研究提出了一種新的學(xué)習(xí)不平衡數(shù)據(jù)的范式,旨在讓視覺 Transformer 模型更好地適應(yīng)長尾數(shù)據(jù)。通過這種范式的引入,研究團(tuán)隊(duì)希望能夠充分利用長尾數(shù)據(jù)的信息,提高視覺 Transformer 模型在處理不平衡標(biāo)注數(shù)據(jù)時(shí)的性能和泛化能力。 b0232678-0ddb-11ee-962d-dac502259ad0.png ?文章貢獻(xiàn) 本文是第一個(gè)系統(tǒng)性的研究用長尾數(shù)據(jù)訓(xùn)練視覺 Transformer 的工作,在此過程中,做出了以下主要貢獻(xiàn): 首先,本文深入分析了傳統(tǒng)有監(jiān)督訓(xùn)練方式對(duì)視覺 Transformer 學(xué)習(xí)不均衡數(shù)據(jù)的限制因素,并基于此提出了雙階段訓(xùn)練流程,將視覺 Transformer 模型內(nèi)在的歸納偏置和標(biāo)簽分布的統(tǒng)計(jì)偏置分階段學(xué)習(xí),以降低學(xué)習(xí)長尾數(shù)據(jù)的難度。其中第一階段采用了流行的掩碼重建預(yù)訓(xùn)練,第二階段采用了平衡的損失進(jìn)行微調(diào)監(jiān)督。 b035076c-0ddb-11ee-962d-dac502259ad0.png ? ?其次,本文提出了平衡的二進(jìn)制交叉熵?fù)p失函數(shù),并給出了嚴(yán)格的理論推導(dǎo)。平衡的二進(jìn)制交叉熵?fù)p失的形式如下: b0498976-0ddb-11ee-962d-dac502259ad0.png ? ?與之前的平衡交叉熵?fù)p失相比,本文的損失函數(shù)在視覺 Transformer 模型上展現(xiàn)出更好的性能,并且具有更快的收斂速度。研究中的理論推導(dǎo)為損失函數(shù)的合理性提供了嚴(yán)密的解釋,進(jìn)一步加強(qiáng)了我們方法的可靠性和有效性。 b06900a8-0ddb-11ee-962d-dac502259ad0.png▲不同損失函數(shù)的收斂速度的比較 基于以上貢獻(xiàn),文章提出了一個(gè)全新的學(xué)習(xí)范式 LiVT,充分發(fā)揮視覺 Transformer 模型在長尾數(shù)據(jù)上的學(xué)習(xí)能力,顯著提升模型在多個(gè)數(shù)據(jù)集上的性能。該方案在多個(gè)數(shù)據(jù)集上取得了遠(yuǎn)好于視覺 Transformer 基線的性能表現(xiàn)。 b0827376-0ddb-11ee-962d-dac502259ad0.png▲不同參數(shù)量下在ImageNet-LT上的準(zhǔn)確性

b09d72de-0ddb-11ee-962d-dac502259ad0.png▲在ImagNet-LT(左)和iNaturalist18(右)數(shù)據(jù)集上的性能表現(xiàn)

同時(shí),本文還驗(yàn)證了在相同的訓(xùn)練數(shù)據(jù)規(guī)模的情況下,使用ImageNet的長尾分布子集(LT)和平衡分布子集(BAL)訓(xùn)練的 ViT-B 模型展現(xiàn)出相近的重建能力。如 LT-Large-1600 列所示,在 ImageNet-LT 數(shù)據(jù)集中,可以通過更大的模型和 MGP epoch 獲得更好的重建結(jié)果。 wKgZomTYg3CAQbicAARAkEpPjg4567.png ? ?b1201f86-0ddb-11ee-962d-dac502259ad0.png ?

總結(jié)

本文提供了一種新的基于視覺 Transformer 處理不平衡數(shù)據(jù)的方法 LiVT。LiVT 利用掩碼建模和平衡微調(diào)兩個(gè)階段的訓(xùn)練策略,使得視覺 Transformer 能夠更好地適應(yīng)長尾數(shù)據(jù)分布并學(xué)習(xí)到更通用的特征表示。該方法不僅在實(shí)驗(yàn)中取得了顯著的性能提升,而且無需額外的數(shù)據(jù),具有實(shí)際應(yīng)用的可行性。 論文的更多細(xì)節(jié)請(qǐng)參考論文原文和補(bǔ)充材料。


原文標(biāo)題:CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長尾數(shù)據(jù)

文章出處:【微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:CVPR 2023 | 清華大學(xué)提出LiVT,用視覺Transformer學(xué)習(xí)長尾數(shù)據(jù)

文章出處:【微信號(hào):tyutcsplab,微信公眾號(hào):智能感知與物聯(lián)網(wǎng)技術(shù)研究所】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    清華大學(xué)“啟·創(chuàng)”計(jì)劃走進(jìn)拓維信息,校企共探AI時(shí)代產(chǎn)學(xué)研合作新范式

    1月13日,清華大學(xué)“啟·創(chuàng)”計(jì)劃第十三期赴湘社會(huì)實(shí)踐活動(dòng)暨TalkwebHouse創(chuàng)業(yè)私董會(huì)第二期在拓維信息圓滿舉辦。清華大學(xué)創(chuàng)業(yè)團(tuán)隊(duì)20余名師生,與拓維信息團(tuán)隊(duì)深入對(duì)話,圍繞“AI+”產(chǎn)業(yè)融合
    的頭像 發(fā)表于 01-16 14:04 ?316次閱讀
    <b class='flag-5'>清華大學(xué)</b>“啟·創(chuàng)”計(jì)劃走進(jìn)拓維信息,校企共探AI時(shí)代產(chǎn)學(xué)研合作新范式

    沐曦與Arm、熠知一同到訪清華大學(xué)交流座談

    為助力頂尖學(xué)府清華大學(xué)在“AI+教科研”領(lǐng)域取得新突破,培養(yǎng)具備AI創(chuàng)新能力的人才,1月12日,沐曦集成電路(上海)股份有限公司(股票代碼:688802)、半導(dǎo)體頭部企業(yè)Arm控股有限公司(納斯達(dá)克
    的頭像 發(fā)表于 01-14 13:52 ?223次閱讀

    時(shí)識(shí)科技DAVIS346傳感器助力清華大學(xué)突破LIBS技術(shù)瓶頸

    近日,清華大學(xué)深圳國際研究生院王希林教授團(tuán)隊(duì)創(chuàng)新性地引入時(shí)識(shí)科技(SynSense)的類腦動(dòng)態(tài)視覺傳感器DAVIS346,首次將動(dòng)態(tài)視覺傳感器(DVS)技術(shù)應(yīng)用于激光誘導(dǎo)等離子體光學(xué)信號(hào)的捕獲,并以
    的頭像 發(fā)表于 11-30 11:42 ?822次閱讀

    愛芯元智出席第四屆清華大學(xué)汽車芯片設(shè)計(jì)及產(chǎn)業(yè)應(yīng)用研討會(huì)

    近日,第四屆清華大學(xué)汽車芯片設(shè)計(jì)及產(chǎn)業(yè)應(yīng)用研討會(huì)暨校友論壇在蘇州市吳江區(qū)舉行。作為清華大學(xué)自動(dòng)化系校友,愛芯元智創(chuàng)始人兼董事長仇肖莘博士應(yīng)邀發(fā)表主旨演講,深入剖析了高智價(jià)比AI芯片推動(dòng)智能汽車普惠發(fā)展的實(shí)施路徑。
    的頭像 發(fā)表于 11-02 09:18 ?404次閱讀

    地平線H-RDT模型斬獲CVPR 2025大賽冠軍

    近日,在計(jì)算機(jī)視覺與模式識(shí)別領(lǐng)域頂級(jí)會(huì)議CVPR 2025舉辦的RoboTwin雙臂機(jī)器人競賽中,地平線機(jī)器人實(shí)驗(yàn)室與清華大學(xué)計(jì)算機(jī)系朱軍團(tuán)隊(duì)聯(lián)合提出的H-RDT憑強(qiáng)大性能和領(lǐng)先成功率
    的頭像 發(fā)表于 08-21 10:02 ?553次閱讀
    地平線H-RDT模型斬獲<b class='flag-5'>CVPR</b> 2025大賽冠軍

    清華大學(xué)TOP EE+項(xiàng)目參訪美光上海

    此前,2025年6月4日至6日,清華大學(xué)TOP EE+ 項(xiàng)目于美光上海的參訪活動(dòng)圓滿舉行。為期三天的活動(dòng)匯聚了來自清華大學(xué)電子工程系的優(yōu)秀留學(xué)生與美光的多位管理者和工程師,展開了深入的技術(shù)交流與文化互動(dòng)之旅。
    的頭像 發(fā)表于 07-07 18:02 ?1384次閱讀

    清華大學(xué)到鎵未來科技,張大江先生在半導(dǎo)體功率器件十八年的堅(jiān)守!

    清華大學(xué)到鎵未來科技,張大江先生在半導(dǎo)體功率器件十八年的堅(jiān)守!近年來,珠海市鎵未來科技有限公司(以下簡稱“鎵未來”)在第三代半導(dǎo)體行業(yè)異軍突起,憑借領(lǐng)先的氮化鎵(GaN)技術(shù)儲(chǔ)備和不斷推出的新產(chǎn)品
    發(fā)表于 05-19 10:16

    清華大學(xué)攜手華為打造業(yè)內(nèi)首個(gè)園區(qū)網(wǎng)絡(luò)智能體

    清華大學(xué)響應(yīng)國家教育新基建戰(zhàn)略,正在加速推進(jìn)網(wǎng)絡(luò)管理平臺(tái)升級(jí):為滿足在線教育、協(xié)同創(chuàng)新及智慧校園的發(fā)展需求,為清華大學(xué)躋身世界一流大學(xué)創(chuàng)造基礎(chǔ)條件,清華大學(xué)攜手華為打造業(yè)內(nèi)首個(gè)園區(qū)網(wǎng)絡(luò)
    的頭像 發(fā)表于 05-07 09:51 ?760次閱讀

    2025年開放原子校源行清華大學(xué)站成功舉辦

    近日,由開放原子開源基金會(huì)、清華大學(xué)計(jì)算機(jī)科學(xué)與技術(shù)系、清華大學(xué)軟件學(xué)院主辦的開放原子“校源行”(清華站)在清華大學(xué)成功舉辦。
    的頭像 發(fā)表于 04-22 16:46 ?849次閱讀

    奇瑞汽車攜手清華大學(xué)發(fā)布“分體式飛行汽車”專利

    繼2024年10月在奇瑞全球創(chuàng)新大會(huì)上宣布三體復(fù)合翼飛行汽車成功完成首航后,奇瑞再次帶來飛行汽車領(lǐng)域的最新進(jìn)展。日前,由奇瑞汽車股份有限公司與清華大學(xué)智能交通實(shí)驗(yàn)室共同申請(qǐng)的“分體式飛行汽車”專利正式公開,該專利正是基于奇瑞汽車股份公司與清華大學(xué)智能交通實(shí)驗(yàn)室合作的項(xiàng)目。
    的頭像 發(fā)表于 02-20 09:14 ?902次閱讀

    清華大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心專項(xiàng)合作啟動(dòng),引領(lǐng)高??蒲泻腿瞬排囵B(yǎng)新模式

    2月13日,清華大學(xué)與華為技術(shù)有限公司在清華大學(xué)自強(qiáng)科技樓簽署合作協(xié)議,宣布“清華大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心專項(xiàng)合作”(以下簡稱“卓越中心”)正式啟動(dòng)。清華大學(xué)副校長曾嶸,中國工程院
    的頭像 發(fā)表于 02-18 16:46 ?1008次閱讀

    清華大學(xué)與華為啟動(dòng)“卓越中心”專項(xiàng)合作

    近日,清華大學(xué)與華為技術(shù)有限公司在清華大學(xué)自強(qiáng)科技樓正式簽署合作協(xié)議,共同宣布“清華大學(xué)鯤鵬昇騰科教創(chuàng)新卓越中心專項(xiàng)合作”(簡稱“卓越中心”)正式啟動(dòng)。 出席簽約儀式的有清華大學(xué)副校長
    的頭像 發(fā)表于 02-18 14:11 ?1195次閱讀

    清華大學(xué)發(fā)布:DeepSeek從入門到精通

    《DeepSeek:從入門到精通》是由清華大學(xué)新聞與傳播學(xué)院新媒體研究中心元宇宙文化實(shí)驗(yàn)室的余夢瓏博士后團(tuán)隊(duì)精心撰寫的一份專業(yè)文檔。該文檔篇幅長達(dá)104頁,文檔的核心內(nèi)容圍繞DeepSeek的技術(shù)
    的頭像 發(fā)表于 02-14 09:49 ?1.2w次閱讀
    <b class='flag-5'>清華大學(xué)</b>發(fā)布:DeepSeek從入門到精通

    清華大學(xué)自動(dòng)化系學(xué)子走進(jìn)華礪智行研學(xué)交流

    近日,清華大學(xué)自動(dòng)化系的11名學(xué)子走進(jìn)華礪智行研學(xué)交流,開展科技前沿探索的社會(huì)實(shí)踐活動(dòng)。
    的頭像 發(fā)表于 02-13 10:03 ?773次閱讀

    清華大學(xué)DeepSeek指南:從入門到精通

    本資料由清華大學(xué)新聞與傳播學(xué)院新媒體研究中心元宇宙文化實(shí)驗(yàn)室余夢瓏博士后團(tuán)隊(duì)出品,細(xì)致講述了DeepSeek的應(yīng)用技巧。 ? ? ? ? ? ? ? ? ? ?
    的頭像 發(fā)表于 02-11 09:16 ?1.4w次閱讀
    <b class='flag-5'>清華大學(xué)</b>DeepSeek指南:從入門到精通