chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

PEMN:參數(shù)集約型掩碼網(wǎng)絡

CVer ? 來源:CVer ? 作者:CVer ? 2022-12-15 14:09 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

NeurIPS 2022 | Parameter-Efficient Masking Networks,美國東北大學,羅切斯特理工等,提出參數(shù)集約型掩碼網(wǎng)絡,探索有限數(shù)量隨機數(shù)的表征能力并提升神經(jīng)網(wǎng)絡儲存和傳輸效率。

為了處理更復雜的任務,近年來神經(jīng)網(wǎng)絡的規(guī)模也在不斷變大,如何高效的儲存和傳輸神經(jīng)網(wǎng)絡變得十分重要。另一方面,隨著彩票假說(Lottery Ticket Hypothesis (LTH))的提出,隨機稀疏神經(jīng)網(wǎng)絡最近展現(xiàn)出很強的潛力,如何利用這種潛力來提高網(wǎng)絡的存儲和傳輸效率也很值得探索。

來自美國東北大學和羅切斯特理工的研究者提出參數(shù)集約型掩碼網(wǎng)絡(Parameter-Efficient Masking Networks (PEMN))。作者首先探索了有限數(shù)量隨機數(shù)生成的隨機網(wǎng)絡的表征能力。實驗表明,即使網(wǎng)絡由有限數(shù)量的隨機數(shù)生成,通過選擇不同的子網(wǎng)絡結構,其依然具有很好的表征能力。通過這種探索性實驗,作者自然地提出使用一組有限數(shù)量隨機數(shù)作為prototype,結合一組mask來表達一個神經(jīng)網(wǎng)絡。因為有限數(shù)量的隨機數(shù)和二值的mask占用很少的儲存空間,作者以此來提出一種新的思路來進行網(wǎng)絡壓縮。文章已被NeurIPS 2022 接受。代碼已開源。

1a33b5fe-7c3d-11ed-8abf-dac502259ad0.png

Parameter-Efficient Masking Networks

論文地址: https://arxiv.org/abs/2210.06699

論文代碼: https://github.com/yueb17/PEMN

1. 相關研究

MIT研究人員提出彩票假說 Lottery Ticket Hypothesis (ICLR’19):在一個隨機初始化網(wǎng)絡中,存在一個彩票子網(wǎng)絡(winning ticket)在被單獨訓練的情況下達到很好的效果。彩票假說探索了隨機稀疏網(wǎng)絡的可訓練性。Uber研究人員提出Supermask (NeurIPS’19):在一個隨機初始化網(wǎng)絡中,存在一個子網(wǎng)絡,可以直接用來做推斷而不需要訓練。Supermask探索了隨機稀疏網(wǎng)絡的可用性。華盛頓大學研究人員提出Edge-Popup (CVPR’20):通過反向傳播學習子網(wǎng)絡的mask,大幅提升了隨機稀疏網(wǎng)絡的可用性。

2. 研究動機/流程

以上相關研究從不同角度探索了隨機稀疏網(wǎng)絡的潛力,如可訓練性和可用性,其中可用性也可以理解為表征能力。在此工作中,作者感興趣的是由隨機數(shù)生成的神經(jīng)網(wǎng)絡在不訓練權重的情況下有多強的表征能力。隨著對該問題的探索,作者提出了Parameter-Efficient Masking Networks (PEMN)。自然地,作者運用PEMN為網(wǎng)絡壓縮提供了一種新的思路,并作為一個例子對PEMN的潛在應用場景進行探索。

3. 探索隨機數(shù)構成的神經(jīng)網(wǎng)絡的表征能力

給定一個隨機網(wǎng)絡,作者選擇Edge-Popup算法在其中選擇子網(wǎng)絡來探索其表征能力。不同的是,相對于對整個網(wǎng)絡進行隨機初始化,作者提出了三種參數(shù)集約型的網(wǎng)絡生成策略來使用一個prototype構建隨機網(wǎng)絡。

One-layer: 選擇網(wǎng)絡中重復結構的權重作為prototype來填充其他的與之結構相同的網(wǎng)絡層。

Max-layer padding (MP): 選擇參數(shù)量最多的網(wǎng)絡層作為prototype并且截斷相應的參數(shù)量來填充其他網(wǎng)絡層。

Random vector padding (RP): 選擇一定長度的隨機向量作為prototype并對其進行復制來填充整個網(wǎng)絡。

1a5d0a6c-7c3d-11ed-8abf-dac502259ad0.png

三種不同的隨機網(wǎng)絡生成策略把網(wǎng)絡中不重復參數(shù)值(unique values)的數(shù)量逐步變小,我們基于不同策略得到的隨機網(wǎng)絡來選擇子網(wǎng)絡,從而探索了有限數(shù)量隨機數(shù)生成的隨機網(wǎng)絡的表征潛力。

1a86ae1c-7c3d-11ed-8abf-dac502259ad0.png

上圖展示了使用ConvMixer 和 ViT 網(wǎng)絡CIFAR10圖像分類的實驗結果。Y軸為準確率,X軸為使用不同策略得到的隨機網(wǎng)絡。隨之X軸的變大,隨機網(wǎng)絡中不重復隨機數(shù)數(shù)量逐漸變小 (RP后的數(shù)字表示相比較于MP,RP中不重復隨機數(shù)數(shù)量的比例)。根據(jù)實驗結果,我們觀察到即使隨機網(wǎng)絡只有非常有限的不重復隨機數(shù)(比如PR_1e-3),依然可以很好的維持選擇出來的子網(wǎng)絡的表征能力。至此,作者通過不同的隨機網(wǎng)絡生成策略,探索了有限數(shù)量隨機數(shù)構成的神經(jīng)網(wǎng)絡的表征能力并觀察到即使不重復隨機數(shù)非常有限,其對應的隨機網(wǎng)絡依然可以很好地對數(shù)據(jù)進行表征。同時作者基于這些隨機網(wǎng)絡生成策略,結合所得到的子網(wǎng)絡掩碼,提出了Parameter-Efficient Masking Networks(PEMN)這種新的神經(jīng)網(wǎng)絡類型。

4. 一種新的網(wǎng)絡壓縮思路

本文選擇了神經(jīng)網(wǎng)路壓縮為例來拓展PEMN的潛在應用。具體來說,文中所提出的不同隨機網(wǎng)絡生成策略可以高效的使用prototype來代表完整的隨機網(wǎng)絡,尤其是最細粒度的random vector padding (RP)策略。作者使用RP策略中的隨機向量prototype和與之對應的一組子網(wǎng)絡掩碼來表示一個隨機網(wǎng)絡。在其中prototype需要保存浮點數(shù)格式,而掩碼只需要保存成二值格式。因為RP中的prototype長度可以很短(因為有限數(shù)量的不重復隨機數(shù)仍有很強的表征能力),所以表示一個神經(jīng)網(wǎng)絡的開銷會變得很小,即儲存一個長度有限的浮點數(shù)格式的隨機向量和一組二值格式的掩碼。相比較于傳統(tǒng)的稀疏網(wǎng)絡儲存子網(wǎng)絡的浮點值,本文提出了一種新的網(wǎng)絡壓縮思路用來高效的儲存和傳輸神經(jīng)網(wǎng)絡。

1aa0ec96-7c3d-11ed-8abf-dac502259ad0.png

在上圖中,作者使用PEMN對網(wǎng)絡進行壓縮并與傳統(tǒng)的網(wǎng)絡剪枝方法進行對比。實驗使用ResNet網(wǎng)絡在CIFAR數(shù)據(jù)集做圖像分類任務。我們觀察到,新的壓縮方案表現(xiàn)普遍優(yōu)于傳統(tǒng)的網(wǎng)絡剪枝,尤其是在很高的壓縮率下,PEMN仍然可以維持較好的準確率。

5. 結論

本文受近來隨機網(wǎng)絡展現(xiàn)出來的潛力所啟發(fā),提出不同種參數(shù)集約策略來構建隨機神經(jīng)網(wǎng)絡,進而探索了在只有有限的不重復隨機數(shù)的情況下所生成的隨機神經(jīng)網(wǎng)絡的表征潛力,并提出參數(shù)集約型掩碼網(wǎng)絡Parameter-Efficient Masking Networks (PEMN)。作者將PEMN應用到網(wǎng)絡壓縮的場景中探索了其在實際應用方面的潛力并且為網(wǎng)絡壓縮提供了一種新的思路。作者提供了廣泛的實驗,表明了即使隨機網(wǎng)絡中只有非常有限的不重復隨機數(shù),通過子網(wǎng)絡的選擇,其依然有較好的表征能力。此外,相比較于傳統(tǒng)剪枝算法,實驗表明新提出的方法可以取得更好的網(wǎng)絡壓縮效果,驗證了PEMN在該場景下的應用潛力。

審核編輯 :李倩

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4838

    瀏覽量

    107889
  • 算法
    +關注

    關注

    23

    文章

    4785

    瀏覽量

    98128

原文標題:NeurIPS 2022 | PEMN:參數(shù)集約型掩碼網(wǎng)絡

文章出處:【微信號:CVer,微信公眾號:CVer】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    電壓驅動PHY vs. 電流驅動PHY:如何正確連接網(wǎng)絡變壓器?

    的疑問。本文將圍繞電壓驅動PHY和電流驅動PHY,解析其與網(wǎng)絡變壓器的連接差異,幫助大家在設計中避免常見誤區(qū)。
    的頭像 發(fā)表于 01-20 18:15 ?316次閱讀
    電壓驅動<b class='flag-5'>型</b>PHY vs. 電流驅動<b class='flag-5'>型</b>PHY:如何正確連接<b class='flag-5'>網(wǎng)絡</b>變壓器?

    Vlan、三層交換機、網(wǎng)關、DNS、子網(wǎng)掩碼、MAC地址等網(wǎng)絡知識

    我們現(xiàn)在做的弱電工程,經(jīng)常用到網(wǎng)絡知識,比如vlan、三層交換機、網(wǎng)關、DNS、子網(wǎng)掩碼、MAC地址等方面的知識,作為從業(yè)人員,我們對這些知識了解并熟知的。 正文: 一、什么是VLAN VLAN中文
    的頭像 發(fā)表于 12-18 10:16 ?383次閱讀
    Vlan、三層交換機、網(wǎng)關、DNS、子網(wǎng)<b class='flag-5'>掩碼</b>、MAC地址等<b class='flag-5'>網(wǎng)絡</b>知識

    讀懂高效通信的星組網(wǎng)

    一、什么是星組網(wǎng)?一種網(wǎng)絡拓撲,所有設備直接連接至一個中心節(jié)點,形成“中心發(fā)散”的星形結構,實現(xiàn)集中管理、高效通信。二、三大核心特點1.高可靠易維護節(jié)點獨立連接,單點故障不影響全網(wǎng);中心化管理,運
    發(fā)表于 12-09 14:17

    緊湊網(wǎng)絡運動控制卡ECI1808/ECI1A08

    緊湊網(wǎng)絡運動控制卡ECI1808/ECI1A08
    的頭像 發(fā)表于 11-28 11:17 ?775次閱讀
    緊湊<b class='flag-5'>型</b><b class='flag-5'>網(wǎng)絡</b>運動控制卡ECI1808/ECI1A08

    網(wǎng)絡接口:數(shù)字世界的“門鈴”,你了解多少?

    。要把計算機接入互聯(lián)網(wǎng),需要配置四個關鍵要素:IP地址、子網(wǎng)掩碼、網(wǎng)關地址和DNS服務器地址。 IP地址就像是網(wǎng)絡世界的“家庭地址”,能唯一標識網(wǎng)絡中的每臺計算機;網(wǎng)關則是子網(wǎng)與外界通信的“關口”;而
    發(fā)表于 11-26 18:53

    智慧供熱物聯(lián)網(wǎng)數(shù)字化改造方案

    近年來,越來越多企業(yè)加快供熱生產(chǎn)管理信息化、自動化、智慧化步伐,通過提高自動化水平與管理效率,實現(xiàn)了供熱運行管理模式由粗放集約型、智能化、精細化的轉變。 某大型供熱企業(yè)擔負該地集中供熱、供熱設施
    的頭像 發(fā)表于 11-18 13:47 ?462次閱讀
    智慧供熱物聯(lián)網(wǎng)數(shù)字化改造方案

    廣州郵科管理匯聚光纖交換機:企業(yè)網(wǎng)絡升級的“智慧引擎”

    升級戰(zhàn)中, 廣州郵科管理匯聚光纖交換機 憑借其“高帶寬、低延遲、強管理”的特性,成為眾多企業(yè)網(wǎng)絡架構中的“智慧引擎”。 為什么企業(yè)需要管理匯聚交換機? 傳統(tǒng)非管理交換機如同“傻瓜
    的頭像 發(fā)表于 10-20 10:00 ?551次閱讀
    廣州郵科管理<b class='flag-5'>型</b>匯聚光纖交換機:企業(yè)<b class='flag-5'>網(wǎng)絡</b>升級的“智慧引擎”

    飛凌嵌入式ElfBoard-Linux系統(tǒng)基礎入門-網(wǎng)絡相關shell命令之網(wǎng)絡基礎知識

    網(wǎng)絡地址 (二)主機號全為1的IP地址,不分配給任何主機,僅用作廣播地址 (三)IP地址127.0.0.1為回環(huán)結構,用于本地進行軟件測試 4.子網(wǎng)掩碼 子網(wǎng)掩碼是一個32位的二進制地址,用來屏蔽原來
    發(fā)表于 10-09 09:30

    管理 vs 非管理,工業(yè)網(wǎng)絡如何選擇以太網(wǎng)交換機?

    在工業(yè)網(wǎng)絡建設中,很多人會糾結該選管理還是非管理交換機。非管理交換機即插即用、價格實惠,適合小型場景;而管理交換機功能強大,可監(jiān)控、
    的頭像 發(fā)表于 08-25 15:37 ?787次閱讀
    管理<b class='flag-5'>型</b> vs 非管理<b class='flag-5'>型</b>,工業(yè)<b class='flag-5'>網(wǎng)絡</b>如何選擇以太網(wǎng)交換機?

    Linux系統(tǒng)中網(wǎng)絡配置詳解

    網(wǎng)絡配置是Linux系統(tǒng)運維中的核心技能之一。正確理解和配置子網(wǎng)掩碼、網(wǎng)關等網(wǎng)絡參數(shù),直接影響系統(tǒng)的網(wǎng)絡連通性和性能。本文將深入探討Linu
    的頭像 發(fā)表于 07-17 11:01 ?1231次閱讀

    飛凌嵌入式ElfBoard ELF 1板卡-文件系統(tǒng)之配置網(wǎng)絡參數(shù)

    我們可以在系統(tǒng)啟動之后,通過ifconfig命令配置網(wǎng)絡參數(shù)。root@ELF1:~# ifconfig eth0 192.168.0.232root@ELF1:~# ifconfig eth0
    發(fā)表于 07-01 17:49

    ON Semiconductor MC14013BDTR2G 雙D觸發(fā)器參數(shù)特性 EDA模型 數(shù)據(jù)手冊

    ON Semiconductor MC14013BDTR2G 雙D觸發(fā)器參數(shù)特性 EDA模型 數(shù)據(jù)手冊
    的頭像 發(fā)表于 05-29 14:41 ?1487次閱讀
    ON Semiconductor MC14013BDTR2G  雙D<b class='flag-5'>型</b>觸發(fā)器<b class='flag-5'>參數(shù)</b>特性 EDA模型 數(shù)據(jù)手冊

    手把手教你如何調優(yōu)Linux網(wǎng)絡參數(shù)

    在高并發(fā)網(wǎng)絡服務場景中,Linux內核的默認網(wǎng)絡參數(shù)往往無法滿足需求,導致性能瓶頸、連接超時甚至服務崩潰。本文基于真實案例分析,從參數(shù)解讀、問題診斷到優(yōu)化實踐,手把手教你如何調優(yōu)Lin
    的頭像 發(fā)表于 05-29 09:21 ?1013次閱讀

    愛立信如何構建意圖驅動自主網(wǎng)絡

    意圖驅動服務編排與AI相互協(xié)同,正在徹底改變網(wǎng)絡和服務的管理方式。這種協(xié)同究竟會如何革新OSS服務管理方式?又將如何發(fā)掘自動化和可編程網(wǎng)絡的全部潛能?
    的頭像 發(fā)表于 04-12 15:00 ?1.6w次閱讀
    愛立信如何構建意圖驅動<b class='flag-5'>型</b>自主<b class='flag-5'>網(wǎng)絡</b>

    關于三菱PLC的網(wǎng)絡通訊時的‘生存確認’參數(shù)

    最近項目用到三菱PLC的網(wǎng)絡通訊,終于理解了PLC的以太網(wǎng)通訊時,有個網(wǎng)絡端口生存確認,原來是一個非常重要的參數(shù)。 生成確認決定了網(wǎng)絡參數(shù)
    發(fā)表于 03-31 11:26