chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

<pre id="88f2t"><label id="88f2t"><th id="88f2t"></th></label></pre>

<bdo id="88f2t"><span id="88f2t"></span></bdo>

首頁
技術

可編程邏輯

MEMS/傳感技術

嵌入式技術

模擬技術

控制/MCU

處理器/DSP

存儲技術

EMC/EMI設計

電源/新能源

測量儀表

制造/封裝

RF/無線

接口/總線/驅動

EDA/IC設計

光電顯示

連接器

PCB設計

LEDs

汽車電子

醫(yī)療電子

人工智能

可穿戴設備

軍用/航空電子

工業(yè)控制

觸控感測

智能電網(wǎng)

音視頻及家電

通信網(wǎng)絡

機器人

vr|ar|虛擬現(xiàn)實

安全設備/系統(tǒng)

移動通信

便攜設備

物聯(lián)網(wǎng)

區(qū)塊鏈

HarmonyOS

RISC-V MCU

光伏

ChatGPT

IGBT

充電樁

氮化鎵

BLDC

逆變器

5G

電機控制
資源

技術文庫

新品速遞

電路圖

元器件知識

電子百科

最新技術文章

元器件搜索引擎
下載

在線工具

常用軟件

電子書

datasheet
專欄

電子說

專欄
社區(qū)

論壇

問答

小組

技術專欄

社區(qū)之星

試用中心

HarmonyOS技術社區(qū)

2023電子工程師大會
研究院
活動

設計大賽

硬創(chuàng)大賽

社區(qū)活動

線下會議

在線研討會

小測驗
學院

直播

課程
視頻
企業(yè)號
工具

datasheet查詢

免費評測試用

技術子站

搜索歷史

清空

搜索熱詞

0

聊天消息
系統(tǒng)消息
評論與回復

查看更多

查看更多

查看更多

VIP于到期續(xù)費

登錄后你可以

下載海量資料
學習在線課程
觀看技術視頻
寫文章/發(fā)帖/加入社區(qū)

會員中心

創(chuàng)作中心

發(fā)布

創(chuàng)作活動

完善資料讓更多小伙伴認識你，還能領取20積分哦，立即完善>

3天內(nèi)不再提示

新方法：用知識蒸餾給數(shù)據(jù)集瘦身

這兩天，推特上一個任務懸賞火得一塌糊涂。

一家AI公司提供25萬美金（折合人民幣約167萬元），懸賞什么任務能讓模型越大、性能反而越差。

評論區(qū)里已經(jīng)討論得熱火朝天了。

不過這事兒倒也不是單純整活，而是為了進一步探索大模型。

畢竟，這兩年大家越發(fā)意識到，AI模型不能單純比“大”。

一方面，隨著模型的規(guī)模越來越大，訓練付出的成本開始呈現(xiàn)指數(shù)型增長；

另一方面，模型性能的提升也已經(jīng)逐漸到達瓶頸期，哪怕想要讓誤差再下降1%，都需要更多的數(shù)據(jù)集增量和計算增量。

比如對于Transformer而言，交叉熵損失想要從3.4奈特降低到2.8奈特，就需要原本10倍量的訓練數(shù)據(jù)。

針對這些問題，AI學者們已經(jīng)在從各種方向上找解決路子了。

Meta斯坦福的學者們，最近想到了從數(shù)據(jù)集上切入。

他們提出，對數(shù)據(jù)集進行知識蒸餾，使得數(shù)據(jù)集規(guī)模雖小，但還能保持模型性能不下降。

實驗驗證，在剪掉ImageNet 20%的數(shù)據(jù)量后，ResNets表現(xiàn)和使用原本數(shù)據(jù)時的正確率相差不大。

研究人員表示，這也為AGI實現(xiàn)找出了一條新路子。

超大數(shù)據(jù)集的效率并不高

本文提出的辦法，其實就是對原本的數(shù)據(jù)集進行優(yōu)化精簡。

研究人員表示，過去許多方法都表明，許多訓練示例是高度冗余的，理論上可以把數(shù)據(jù)集“剪”得更小。

而且最近也有研究提出了一些指標，可以根據(jù)訓練示例的難度或重要性對它們進行排序，并通過保留其中一些難度高的示例，就能完成數(shù)據(jù)修剪。

基于前人的發(fā)現(xiàn)和研究，此次學者們進一步提出了一些可具體操作的方法。

首先，他們提出了一種數(shù)據(jù)分析方法，可以讓模型只學習部分數(shù)據(jù)，就能實現(xiàn)同等的性能。

通過數(shù)據(jù)分析，研究人員初步得出結論：

一個數(shù)據(jù)集怎樣修剪效果最好？這和它本身的規(guī)模有關。

初始數(shù)據(jù)量越多，越應該保留難度高的示例；

初始數(shù)據(jù)量越少，則應該保留難度低的示例。

而在保留困難示例進行數(shù)據(jù)修剪后，模型和數(shù)據(jù)規(guī)模的對應關系，可以打破冪律分布。

常被提起的二八定律就是基于冪律提出的。

即20%的數(shù)據(jù)會影響80%的結果。

同時在此情況下，還能找到一個處于帕累托最優(yōu)的下的極值。

這里所說的帕累托最優(yōu)是指資源分配的一種理想狀態(tài)。

它假設固定有一群人和可分配的資源，從一種分配狀態(tài)調整到另一種分配狀態(tài)，在沒有使任何一個人變差的前提下，至少使得一個人變得更好。

在本文中，調整分配狀態(tài)即可理解為，修剪多少比例的數(shù)據(jù)集。

然后，研究人員進行了實驗來驗證這一理論。

從實驗結果來看，當數(shù)據(jù)集越大，修剪后的效果就越明顯。

在SVHN、CIFAR-10、ImageNet幾個數(shù)據(jù)集上，ResNet的錯誤率總體和數(shù)據(jù)集修剪規(guī)模呈反比。

在ImageNet上可以看到，數(shù)據(jù)集規(guī)模保留80%的情況下，和原本數(shù)據(jù)集訓練下的錯誤率基本相同。

這一曲線也逼近了帕累托最優(yōu)。

接下來，研究人員聚焦在ImageNet上，對10種不同情況進行了大規(guī)?；鶞蕼y試。

結果表明，隨機修剪以及一些修剪指標，在ImageNet上的表現(xiàn)并不夠好。

所以更進一步，研究人員還提出了一種自監(jiān)督方法來修剪數(shù)據(jù)。

也就是知識蒸餾（教師學生模型），這是模型壓縮的一種常見方法。

結果顯示，在自監(jiān)督方法下，它在找數(shù)據(jù)集中簡單/困難示例上的表現(xiàn)都還不錯。

使用自監(jiān)督方法修剪數(shù)據(jù)后，正確率明顯提高（圖C中淺藍色線）。

還存在一些問題

不過在論文中，研究人員也提到，雖然通過如上方法可以在不犧牲性能的情況下修剪數(shù)據(jù)集，但是有些問題仍舊值得關注。

比如數(shù)據(jù)集縮小后，想要訓練出同等性能的模型，需要的時間可能會更長。

因此，在進行數(shù)據(jù)集修剪時，應該平衡縮減規(guī)模和訓練增長時間兩方面因素。

與此同時，對數(shù)據(jù)集進行修剪，勢必會喪失一些群體的樣本，由此也可能造成模型在某一個方面出現(xiàn)弊端。

在這方面會容易引起道德倫理方面的問題。

研究團隊

本文作者之一Surya Ganguli，是量子神經(jīng)網(wǎng)絡科學家。

論文地址： https://arxiv.org/abs/2206.14486

審核編輯：李倩

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內(nèi)容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

神經(jīng)網(wǎng)絡

神經(jīng)網(wǎng)絡

+關注

關注
42

文章
4838

瀏覽量
107735
AI

AI

+關注

關注
91

文章
39707

瀏覽量
301318
數(shù)據(jù)集

數(shù)據(jù)集

+關注

關注
4

文章
1236

瀏覽量
26187

原文標題：剪掉ImageNet 20%數(shù)據(jù)量，模型性能不下降！Meta斯坦福等提出新方法，用知識蒸餾給數(shù)據(jù)集瘦身

文章出處：【微信號：CVSCHOOL，微信公眾號：OpenCV學堂】歡迎添加關注！文章轉載請注明出處。

評論

電子發(fā)燒友

My ElecFans

APP
網(wǎng)站地圖

設計技術

可編程邏輯

電源/新能源

MEMS/傳感技術

測量儀表

嵌入式技術

制造/封裝

模擬技術

RF/無線

接口/總線/驅動

處理器/DSP

EDA/IC設計

存儲技術

光電顯示

EMC/EMI設計

連接器

行業(yè)應用

LEDs

汽車電子

音視頻及家電

通信網(wǎng)絡

醫(yī)療電子

人工智能

虛擬現(xiàn)實

可穿戴設備

機器人

安全設備/系統(tǒng)

軍用/航空電子

移動通信

工業(yè)控制

便攜設備

觸控感測

物聯(lián)網(wǎng)

智能電網(wǎng)

區(qū)塊鏈

新科技

特色內(nèi)容

專欄推薦

學院

設計資源

設計技術

電子百科

電子視頻

元器件知識

工具箱

VIP會員

最新技術文章

產(chǎn)品地圖

品牌地圖

社區(qū)

小組

論壇

問答

評測試用

企業(yè)服務

產(chǎn)品

資料

文章

方案

企業(yè)

供應鏈服務

硬件開發(fā)

媒體服務

網(wǎng)站廣告

在線研討會

活動策劃

新聞發(fā)布

新品發(fā)布

小測驗

設計大賽

電子發(fā)燒友

關于我們

聯(lián)系我們

舉報投訴

社交網(wǎng)絡

微博

移動端

發(fā)燒友APP

WAP

聯(lián)系我們

廣告合作

王婉珠：wangwanzhu@elecfans.com

內(nèi)容合作

張迎輝：mikezhang@elecfans.com

關注我們的微信

下載發(fā)燒友APP

電子發(fā)燒友觀察

版權所有 ? 長沙勒克斯教育咨詢有限公司

湖南省長沙市開福區(qū)月湖街道匍園路20號聚恒科技園1棟2301-1房
電子發(fā)燒友 （電路圖） 湘公網(wǎng)安備43011202000918 工商網(wǎng)監(jiān) 湘ICP備2023036445號-105-1

感谢您访问我们的网站，您可能还对以下资源感兴趣：
chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费