chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

CNN根本無需理解圖像全局結構,一樣也能SOTA?

OpenCV學堂 ? 來源:量子位 ? 作者:量子位 ? 2022-06-09 10:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

不給全圖,只投喂CNN一些看上去毫無信息量的圖像碎片,就能讓模型學會圖像分類。

更重要的是,性能完全不差,甚至還能反超用完整圖像訓練的模型。

796d0e56-e739-11ec-ba43-dac502259ad0.png

這么一項來自加州大學圣塔芭芭拉分校的新研究,這兩天引發(fā)不少討論。

咋地,這就是說,CNN根本無需理解圖像全局結構,一樣也能SOTA?

79a3bafa-e739-11ec-ba43-dac502259ad0.png

具體是怎么一回事,咱們還是直接上論文。

實驗證據(jù)

研究人員設計了這樣一個實驗:

他們在CIFAR-10、CIFAR-100、STL-10、Tiny-ImageNet-200以及Imagenet-1K等數(shù)據(jù)集上訓練ResNet。

特別的是,用于訓練的圖像是通過隨機裁剪得到的。

這個“隨機裁剪”,可不是往常我們會在數(shù)據(jù)增強方法中見到的那一種,而是完全不做任何填充。

舉個例子,就是對圖片做PyTorch的RandomCrop變換時,padding的參數(shù)填0。

得到的訓練圖像就是下面這個樣式的。即使你是閱圖無數(shù)的老司機,恐怕也分辨不出到底是個啥玩意兒。

79d0c3ce-e739-11ec-ba43-dac502259ad0.png

訓練圖像如此碎片化,模型的識圖能力又能達到幾成?

來看實驗結果:

79edc60e-e739-11ec-ba43-dac502259ad0.png

好家伙,在CIFAR-10上,用16×16的圖像碎片訓練出來的模型,測試準確率能達到91%,而用完整的32×32尺寸圖像訓練出來的模型,測試準確率也不過90%。

這一波,“殘缺版”CNN竟然完全不落下風,甚至還反超了“完整版”CNN。

要知道,被喂了碎片的CNN模型,看到的圖像甚至可能跟標簽顯示的物體毫無關系,只是原圖中背景的部分……

在STL-10、Tiny-Imagenet-200等數(shù)據(jù)集上,研究人員也得到了類似的結果。

不過,在CIFAR-100上,還是完整圖像訓練出來的模型略勝一籌。16×16圖像碎片訓練出的模型測試準確率為61%,而32×32完整圖像訓練出的模型準確率為68%。

所以,CNN為何會有如此表現(xiàn)?莫非它本來就是個“近視眼”?

研究人員推測,CNN能有如此優(yōu)秀的泛化表現(xiàn),是因為在這個實驗中,維度詛咒的影響被削弱了。

所謂維度詛咒(curse of dimensionality),是指當維數(shù)提高時,空間體積提高太快,導致可用數(shù)據(jù)變得稀疏。

而在這項研究中,由于CNN學習到的不是整個圖像的標簽,而是圖像碎片的標簽,這就在兩個方面降低了維度詛咒的影響:

圖像碎片的像素比完整圖像小得多,這減少了輸入維度

訓練期間可用的樣本數(shù)量增加了

生成熱圖

基于以上實驗觀察結果,研究人員還提出以熱圖的形式,來理解CNN的預測行為,由此進一步對模型的錯誤做出“診斷”。

就像這樣:

7a1871ce-e739-11ec-ba43-dac502259ad0.png

這些圖像來自于STL-10數(shù)據(jù)集。熱圖顯示,對于CNN而言,飛機圖像中最能“刺激”到模型的,不是飛機本身,而是天空。

同樣,在汽車圖像中,車輪才是CNN用來識別圖像的主要屬性。

論文地址: https://arxiv.org/abs/2205.10760

審核編輯 :李倩

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像分類
    +關注

    關注

    0

    文章

    96

    瀏覽量

    12487
  • 數(shù)據(jù)集

    關注

    4

    文章

    1236

    瀏覽量

    26187
  • cnn
    cnn
    +關注

    關注

    3

    文章

    355

    瀏覽量

    23416

原文標題:不看全圖看局部,CNN性能竟然更強了

文章出處:【微信號:CVSCHOOL,微信公眾號:OpenCV學堂】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    PCB板上你是普通油墨,我是低損耗油墨,一樣嗎?

    這個困擾,所以和相關的油墨廠商做些合作和溝通,看油墨能不能像PCB板材一樣,研發(fā)出不同損耗級別的油墨出來。你們還別說,還真有,這不
    發(fā)表于 01-23 11:40

    工業(yè)、消費及機器視覺: 貿(mào)澤開售 ams OSRAM Mira050 NIR增強全局快門圖像傳感器

    ) 增強全局快門圖像傳感器。Mira050是款緊湊型0.5MP圖像傳感器,專為2D和3D消費類及工業(yè)機器視覺應用而設計。 ams OSRAM Mira050 NIR增強
    的頭像 發(fā)表于 01-20 15:12 ?369次閱讀
    賦<b class='flag-5'>能</b>工業(yè)、消費及機器視覺: 貿(mào)澤開售 ams OSRAM Mira050 NIR增強<b class='flag-5'>全局</b>快門<b class='flag-5'>圖像</b>傳感器

    結構體聲明與定義

    一樣,去聲明我們的結構體操作,但是C語言中規(guī)定,聲明結構體變量的時候,struct關鍵字是不可少的。 struct 結構體類型名 結構
    發(fā)表于 12-11 07:52

    求助,關于全局中斷使的問題求解

    各位朋友大家好,我最近在使用蜂鳥的板子進行開發(fā)時,遇到了這樣的問題:我的程序每次運行到使全局中斷的時候,就像進入了死循環(huán)一樣,出不去了,如上圖,首先先打印“GI_EN begin!”這里是可以
    發(fā)表于 11-07 06:37

    一樣的展會,不一樣的精彩 2025灣芯展圓滿收官

    10月17日,2025灣區(qū)半導體產(chǎn)業(yè)生態(tài)博覽會(2025灣芯展)在深圳會展中心(福田)圓滿收官。全球600多家展商、超30場論壇,在6萬平方米的展區(qū)內(nèi),打造場“不一樣的展會”,呈現(xiàn)出“不一樣的精彩
    的頭像 發(fā)表于 10-29 16:56 ?1336次閱讀
    不<b class='flag-5'>一樣</b>的展會,不<b class='flag-5'>一樣</b>的精彩 2025灣芯展圓滿收官

    構建CNN網(wǎng)絡模型并優(yōu)化的般化建議

    通過實踐,本文總結了構建CNN網(wǎng)絡模型并優(yōu)化的般化建議,這些建議將會在構建高準確率輕量級CNN神經(jīng)網(wǎng)絡模型方面提供幫助。 1)避免單層神經(jīng)網(wǎng)絡:我們清楚神經(jīng)網(wǎng)絡本身是需要不斷抽象出更高級別的紋理
    發(fā)表于 10-28 08:02

    一樣的展會,不一樣的精彩:2025灣芯展順利收官

    內(nèi),打造場"不一樣的展會",呈現(xiàn)出"不一樣的精彩"。本屆展會人氣火爆,展期三天累計接待總量達到11.23萬人次。參展企業(yè)集中發(fā)布年度新品數(shù)約2500件,新品發(fā)布與商業(yè)合作收獲頗豐。 ? 不
    的頭像 發(fā)表于 10-19 20:27 ?659次閱讀
    不<b class='flag-5'>一樣</b>的展會,不<b class='flag-5'>一樣</b>的精彩:2025灣芯展順利收官

    現(xiàn)場解決EMC電磁輻射干擾:“望聞問切”,像中醫(yī)一樣

    南柯電子|現(xiàn)場解決EMC電磁輻射干擾:“望聞問切”,像中醫(yī)一樣
    的頭像 發(fā)表于 09-04 09:47 ?803次閱讀

    AURIX tc367通過 MCU SOTA 更新邏輯 IC 閃存是否可行?

    你好專家:我的用例是 MCU 通過 SPI 連接到邏輯 IC,邏輯 IC 連接到 8MB 閃存,但 MCU PFLASH 大小為 2MB,通過 MCU SOTA 更新邏輯 IC 閃存是否可行?
    發(fā)表于 08-11 06:36

    求助,關于TC387使能以及配置SOTA些問題求解

    你好, 之前我拿到貴司給個demo,里面有些使能以及配置SWAP的代碼, 這里有些疑問 問題1. 判斷SOTA功能是否生效,demo中使用的是 SCU_STMEM1中的bit位, 代碼如下
    發(fā)表于 08-08 07:31

    【高云GW5AT-LV60 開發(fā)套件試用體驗】基于開發(fā)板進行深度學習實踐,并盡量實現(xiàn)皮膚病理圖片的識別,第三階段

    可以試試: 在哪個階段介入CNN更好地實現(xiàn)圖像處理? 這是個非常關鍵的架構決策問題。根據(jù)處理任務的不同,
    發(fā)表于 07-06 15:18

    圖像采集卡和顯卡是一樣的嗎?從核心差異、工作原理與應用全解析

    不少朋友在做系統(tǒng)集成或設備選型時,經(jīng)常會問個看似簡單但又容易混淆的問題:圖像采集卡和顯卡一樣嗎?個是“采圖”的,個是“顯圖”的,聽起來
    的頭像 發(fā)表于 05-14 09:52 ?1479次閱讀
    <b class='flag-5'>圖像</b>采集卡和顯卡是<b class='flag-5'>一樣</b>的嗎?從核心差異、工作原理與應用全解析

    貼片電容和瓷片電容一樣嗎?

    貼片電容和瓷片電容并不完全一樣,它們在結構、材料、特點和應用等方面存在些差異。以下是對這兩種電容器的詳細比較: 結構差異 貼片電容:
    的頭像 發(fā)表于 04-30 15:05 ?880次閱讀
    貼片電容和瓷片電容<b class='flag-5'>一樣</b>嗎?

    服務器的系統(tǒng)和普通電腦系統(tǒng)一樣嗎?

    一樣。很多人認為服務器與普通電腦只是規(guī)模差異,實則二者系統(tǒng)設計存在本質區(qū)別。服務器作為承載企業(yè)核心數(shù)據(jù)的"數(shù)字心臟",其系統(tǒng)架構需滿足7×24小時高負載運行、數(shù)據(jù)安全防護等特殊需求。本文將深度解析服務器的系統(tǒng)和普通電腦系統(tǒng)一樣嗎,并為大家推薦適配解決方案。
    的頭像 發(fā)表于 03-28 09:48 ?1283次閱讀

    Stm32CubeIDE像Keil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?

    Stm32CubeIDE像Keil一樣指定不同文件下的代碼編譯到不同的FLASH地址嗎?比如部分代碼存放到內(nèi)部FLASH,另部分存放到外部QSPI的FLASH中
    發(fā)表于 03-07 08:09