chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AI圖像識別本質(zhì):人類看的是形狀,算法看的是紋理

新機器視覺 ? 來源:斜杠人脈管理 ? 2023-06-11 10:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

圖片中的動物輪廓是貓,但是貓披著大象皮膚紋理,將圖片交給人識別,人會說是貓,如果給計算機視覺算法處理,它會說是大象。德國研究人員認為:人看的是形狀,計算機看的是紋理。這一發(fā)現(xiàn)相當有趣,但它證明計算機算法離人類視覺還有很遠距離。

e7240cd4-07ee-11ee-962d-dac502259ad0.jpg

當你看著一張貓的照片,輕松就能知道貓有沒有條紋,不管照片是黑白照,有斑點,還是磨損或者褪色了,都能輕松識別。不論寵物蜷縮在枕頭背后;或者跳到工作臺上,拍照時留下一片朦朧,你都能輕松識別。如果用機器視覺系統(tǒng)(用深度神經(jīng)網(wǎng)絡驅(qū)動)識別,準確率甚至比人還要高,但是當圖片稍微新奇一點,或者有噪點、條紋,機器視覺系統(tǒng)就會犯傻了。

為什么會這樣呢?德國研究團隊給出一個原因,這個原因出乎意料:人類會關注圖中對象的形狀,深度學習計算機系統(tǒng)所用的算法不一樣,它會研究對象的紋理。

德國的發(fā)現(xiàn)告訴我們?nèi)祟惻c機器“思考”問題時有著明顯區(qū)別,也許還能揭示人類視覺進化的秘密。

有大象皮膚的貓和時鐘做的飛機

深度學習算法是怎樣“工作”的呢?首先人類向算法展示大量圖片,有的圖片有貓,有的沒有。算法從圖片中找到“特定模式”,然后用模式來做出判斷,看看面對之前從未見過的圖片應該貼怎樣的標簽。

神經(jīng)網(wǎng)絡架構(gòu)是根據(jù)人類視覺系統(tǒng)開發(fā)的,網(wǎng)絡各層連接在一起,從圖片中提取抽象特點。神經(jīng)網(wǎng)絡系統(tǒng)通過一系列聯(lián)系得出正確答案,不過整個處理過程十分神秘,人類往往只能在事實形成之后再解釋這個神秘的過程。

美國俄勒岡州立大學計算機科學家Thomas Dietterich說:“我們正在努力,想搞清到底是什么讓深度學習計算機視覺算法走向成功,又是什么讓它變得脆弱?!?/p>

怎樣做?研究人員修改圖片,欺騙神經(jīng)網(wǎng)絡,看看會發(fā)生什么事。研究人員發(fā)現(xiàn),即使只是小小的修改,系統(tǒng)也會給出完全錯誤的答案,當修改幅度很大時,系統(tǒng)甚至無法給圖片貼標簽。還有一些研究人員追溯網(wǎng)絡,查看單個神經(jīng)元會對圖像做出怎樣的反應,理解系統(tǒng)學到了什么。

德國圖賓根大學(University of Tübingen)科學家Geirhos領導的團隊采用獨特方法進行研究。去年,團隊發(fā)表報告稱,他們用特殊噪點干擾圖像,給圖像降級,然后用圖像訓練神經(jīng)網(wǎng)絡,研究發(fā)現(xiàn),如果將新圖像交給系統(tǒng)處理,這些圖像被人扭曲過(相同的扭曲),在識別扭曲圖像時,系統(tǒng)的表現(xiàn)比人好。不過如果圖像扭曲的方式稍有不同,神經(jīng)網(wǎng)絡就無能為力了,即使在人眼看來圖像的扭曲方式并無不同,算法也會犯錯。

對于這樣的結(jié)果如何解釋?研究人員深入思考:到底是什么發(fā)生了變化,即使只是加入很少的噪點,也會發(fā)生如此大的變化?答案是紋理。當你在很長的時間段內(nèi)添加許多噪點,圖中對象的形狀基本不會受到影響;不過即使只是添加少量噪點,局部位置的架構(gòu)也會快速扭曲。研究人員想出一個妙招,對人類、深度學習系統(tǒng)處理圖片的方式進行測試。

研究人員故意制作存在矛盾的圖片,也就是說將一種動物的形狀與另一種動物的紋理拼在一起,制作成圖片。例如,圖片中的動物輪廓是貓,但是貓披著大象紋理;或者是一頭熊,但它們是由鋁罐組成的;又或者輪廓是飛機,但飛機是由重疊的鐘面組成的。研究人員制作幾百張這樣的拼湊圖片,然后給它們標上標簽,比如貓、熊、飛機。用4種不同的分類算法測試,最終它們給出的答案是大象、鋁罐、鐘,由此看出算法關注的是紋理。

Columbia大學計算機神經(jīng)科學家Nikolaus Kriegeskorte評論說:“這一發(fā)現(xiàn)改變了我們對深度前向神經(jīng)網(wǎng)絡視覺識別技術的認知?!?/p>

乍一看,AI偏愛紋理而非形狀有點奇怪,但細細深思卻是有理的。Kriegeskorte說:“你可以將紋理視為精密的形狀?!睂τ谒惴ㄏ到y(tǒng)來說精密的尺寸更容易把握:包含紋理信息的像素數(shù)量遠遠超過包含對象邊界的像素數(shù)量,網(wǎng)絡的第一步就是檢測局部特征,比如線條,邊緣。多倫多約克大學計算機視覺科學家John Tsotsos指出:“線段組按相同的方式排列,這就是紋理。”

Geirhos的研究證明,憑借局部特征,神經(jīng)網(wǎng)絡足以分辨圖像。

另有科學家開發(fā)一套深度學習系統(tǒng),它的運行很像深度學習出現(xiàn)之前的分類算法——像一個特征包。

“ 算法將圖像分成為小塊,接下來,它不會將信息逐步融合,變成抽象高級特征,而是給每一小塊下一個決定,比如這塊包含自行車、那塊包含鳥。再接下來,算法將決定集合起來,判斷圖中是什么,比如有更多小塊包含自行車線索,所以圖中對象是自行車。算法不會考慮小塊之間的空間關系。結(jié)果證明,在識別對象時系統(tǒng)的精準度很高。 ”

研究人員Wieland Brendel說:“這一發(fā)現(xiàn)挑戰(zhàn)了我們之前的假定,我們之前認為深度學習的行為方式與舊模型完全不同。很明顯,新模型有很大飛躍,但飛躍的幅度沒有大家預料的那么大?!?/p>

約克大學、多倫多大學博士后研究員Amir Rosenfeld認為,網(wǎng)絡應該做什么,它實際做了什么,二者之間仍有很大差異。

Brendel持有相似觀點。他說,我們很容易就會假定神經(jīng)網(wǎng)絡按人類的方式完成任務,忘了還有其它方式。

向人類視覺靠近

目前的深度學習技術可以將局部特征(比如紋理)與整體模式(比如形狀)結(jié)合 在一起。

Columbia大學計算機神經(jīng)科學家Nikolaus Kriegeskorte說:“在這些論文中有一點讓人感到稍稍有些奇怪,架構(gòu)雖然允許這樣做,不過如果你訓練神經(jīng)網(wǎng)絡時只是希望它分辨標準圖像,它不會自動整合,這點在論文中得到明顯證明?!?/p>

如果強迫模型忽視紋理,又會怎樣呢?Geirhos想找到答案。團隊將訓練分類算法的圖片拿出來,用不同的方式給它們“粉刷”,將實用紋理信息剔除,然后再用新圖片重新訓練深度學習模型,系統(tǒng)轉(zhuǎn)而依賴更全局的模式,像人類一樣更加偏愛形狀。

當算法這樣行動時,分辨噪點圖像的能力同樣更強了,雖然在此之前研究人員并沒有專門訓練算法,讓它識別扭曲圖像。

對于人類來說,可能自然而然也存在這樣的“偏愛”,比如偏愛形狀,因為當我們看到一件東西,想確定它是什么時,靠形狀判斷是最有效的方式,即使環(huán)境中有許多干擾,同樣如此。人類生活在3D世界,可以從多個角度觀察,我們還可以借助其它感知(比如觸覺)來識別對象。所以說,人類偏愛形狀勝過紋理完全合理。

德國圖賓根大學研究人員Felix Wichmann認為,這項研究告訴我們數(shù)據(jù)產(chǎn)生的偏見和影響遠比我們認為的大得多。之前研究人員也曾發(fā)現(xiàn)相同的問題,例如,在面部識別程序、自動招聘算法及其它神經(jīng)網(wǎng)絡中,模型過于重視意料之外的特征,因為訓練算法所用的數(shù)據(jù)存在根深蒂固的偏見。想將這種不想要的偏見從算法決策機制中剔除相當困難,盡管如此,Wichmann認為新研究證明剔除還是有可能的。

雖然Geirhos的模型專注于形狀,不過如果圖像中噪點過多,或者特定像素發(fā)生變化,模型仍然會失敗。由此可以證明,計算機算法離人類視覺還有很遠距離。在人類大腦中,可能還有一些重要機制沒有在算法中體現(xiàn)出來。Wichmann認為,在某些情況下,關注數(shù)據(jù)集可能更重要。

多倫多大學計算機科學家Sanja Fidler認同此觀點,她說:“我們要設計更聰明的數(shù)據(jù)和更聰明的任務?!彼屯抡谘芯恳粋€問題:如何給神經(jīng)網(wǎng)絡分派第二任務,通過第二任務讓它在完成主任務時有更好表現(xiàn)。受到Geirhos的啟發(fā),最近他們對圖像分類算法進行訓練,不只讓算法識別對象本身,還讓它識別對象輪廓(或者形狀)中的像素。

結(jié)果證明,執(zhí)行常規(guī)對象識別任務時,神經(jīng)網(wǎng)絡越來越好,自動變得越來越好。Fidler指出:“如果指派單一任務,你會特別關注某些東西,對其它視而不見。如果分派多個任務,也許能感知更多。算法也是一樣的。”當算法執(zhí)行多個任務時,它會關注不同的信息,就像Geirhos所做的“形狀紋理”實驗一樣。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 算法
    +關注

    關注

    23

    文章

    4740

    瀏覽量

    96755
  • 圖像識別
    +關注

    關注

    9

    文章

    529

    瀏覽量

    39682
  • AI
    AI
    +關注

    關注

    88

    文章

    37067

    瀏覽量

    290507

原文標題:AI圖像識別本質(zhì):人類看的是形狀,算法看的是紋理

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    基于米爾MYC-YM90X安路飛龍DR1開發(fā)板儀表圖像識別系統(tǒng)開發(fā)

    資源,具備強大計算能力與靈活定制特性,為構(gòu)建高性能儀表圖像識別系統(tǒng)帶來新機遇。通過合理利用其異構(gòu)架構(gòu),可實現(xiàn)圖像識別算法的高效執(zhí)行,提升系統(tǒng)實時性與準確性。 二、安路飛龍 FPSOC 架構(gòu)分析
    發(fā)表于 08-17 21:29

    國家級認證!拓維海云天“中文手寫體作文圖像識別評分生成算法”通過國家網(wǎng)信辦備案

    近日,國家互聯(lián)網(wǎng)信息辦公室發(fā)布第十二批深度合成服務算法備案公告,拓維海云天自主研發(fā)的核心技術成果——“中文手寫體作文圖像識別評分生成算法”成功通過備案(備案編號:250011號)。這是拓維海云天在
    的頭像 發(fā)表于 08-15 16:42 ?996次閱讀
    國家級認證!拓維海云天“中文手寫體作文<b class='flag-5'>圖像識別</b>評分生成<b class='flag-5'>算法</b>”通過國家網(wǎng)信辦備案

    華怡豐推出ISC-B/C系列圖像識別傳感器

    在工業(yè)自動化領域,精準、高效的視覺檢測是提升生產(chǎn)效率的關鍵。華怡豐全新推出的ISC-B/C系列圖像識別傳感器集高精度定位、測量算法與先進圖像處理技術于一體,為各類工業(yè)場景提供穩(wěn)定、可靠的解決方案!
    的頭像 發(fā)表于 08-15 11:36 ?924次閱讀
    華怡豐推出ISC-B/C系列<b class='flag-5'>圖像識別</b>傳感器

    火車車號圖像識別系統(tǒng)如何應對不同光照條件下的識別問題?

    在鐵路運輸管理中,準確識別火車車號是實現(xiàn)自動化車輛管理的關鍵環(huán)節(jié)。然而,實際應用場景中復雜多變的光照條件給車號識別帶來了巨大挑戰(zhàn)?,F(xiàn)代火車車號圖像識別系統(tǒng)通過多項技術創(chuàng)新,有效解決了這一難題。 多
    的頭像 發(fā)表于 07-15 11:37 ?417次閱讀
    火車車號<b class='flag-5'>圖像識別</b>系統(tǒng)如何應對不同光照條件下的<b class='flag-5'>識別</b>問題?

    AI走向應用還得智能體,阿里、美團、滴滴相繼入局!

    輸入),根據(jù)自身學習到的知識和算法進行判斷和決策,進而執(zhí)行動作以影響環(huán)境或達到預定的目標。 ? AI智能體與傳統(tǒng)AI的區(qū)別在于,傳統(tǒng)AI通常專注于單一任務,如
    的頭像 發(fā)表于 06-15 00:00 ?5921次閱讀

    AI視覺識別收銀稱:水果生鮮店的“智能店員”

    僅耗時費力,還容易出現(xiàn)人為錯誤。而生鮮自動識別稱重收銀一體機、AI視覺識別收銀秤、生鮮稱重收銀秤和AI生鮮識別電子秤等
    的頭像 發(fā)表于 06-07 10:19 ?353次閱讀
    <b class='flag-5'>AI</b>視覺<b class='flag-5'>識別</b>收銀稱:水果生鮮店的“智能店員”

    智能眼鏡AI需求倒逼芯片革命,高通、ST芯片方案如何適配

    但不限于語音識別與控制、實時翻譯、圖像識別與增強現(xiàn)實(AR)等。為了支持上述高級功能,智能眼鏡對其主控芯片提出了更高的要求。 ? ? 智能眼鏡AI 性能需求提升,新一代芯片該如何設計 當前,新一代
    的頭像 發(fā)表于 04-12 00:54 ?3645次閱讀
    智能眼鏡<b class='flag-5'>AI</b>需求倒逼芯片革命,<b class='flag-5'>看</b>高通、ST芯片方案如何適配

    手持終端集裝箱識別系統(tǒng)的圖像識別技術

    行業(yè)提供了更靈活、精準的管理工具。 一、技術核心:OCR+AI深度融合 現(xiàn)代手持終端系統(tǒng)采用多模態(tài)圖像識別技術,結(jié)合深度學習算法,可快速捕捉并解析集裝箱號碼。其技術優(yōu)勢體現(xiàn)在: 1. 復雜環(huán)境適應性:通過動態(tài)曝光補償和
    的頭像 發(fā)表于 04-03 10:49 ?475次閱讀

    岸橋箱號識別系統(tǒng)如何工作?揭秘AI圖像識別技術!

    在港口自動化升級的浪潮中,AI岸橋識別系統(tǒng)憑借前沿的圖像識別技術,成為提升碼頭作業(yè)效率的“智慧之眼”。那么,這套系統(tǒng)如何實現(xiàn)集裝箱信息的精準捕捉?又是如何通過AI技術替代傳統(tǒng)人工理貨?
    的頭像 發(fā)表于 04-02 09:45 ?444次閱讀

    BP神經(jīng)網(wǎng)絡在圖像識別中的應用

    BP神經(jīng)網(wǎng)絡在圖像識別中發(fā)揮著重要作用,其多層結(jié)構(gòu)使得網(wǎng)絡能夠?qū)W習到復雜的特征表達,適用于處理非線性問題。以下是對BP神經(jīng)網(wǎng)絡在圖像識別中應用的分析: 一、BP神經(jīng)網(wǎng)絡基本原理 BP神經(jīng)網(wǎng)絡,即反向
    的頭像 發(fā)表于 02-12 15:12 ?988次閱讀

    AI模型部署邊緣設備的奇妙之旅:目標檢測模型

    1簡介人工智能圖像識別是人工智能領域的一個重要分支,它涉及計算機視覺、深度學習、機器學習等多個領域的知識和技術。圖像識別主要是處理具有一定復雜性的信息。計算機采用與人類類似的圖像識別
    的頭像 發(fā)表于 12-19 14:12 ?1607次閱讀
    <b class='flag-5'>AI</b>模型部署邊緣設備的奇妙之旅:目標檢測模型

    高幀頻圖像識別反無人機 慧視有辦法!

    的基礎上加裝AI高性能圖像處理板,在算法的作用下,就具備無人機識別的功能,為無人機對抗創(chuàng)造條件。由于無人機飛行速度極快,因此針對于這樣環(huán)境下的AI
    的頭像 發(fā)表于 12-04 01:06 ?837次閱讀
    高幀頻<b class='flag-5'>圖像識別</b>反無人機   慧視有辦法!

    AI圖像識別攝像機

    AI圖像識別攝像機是一種集成了先進算法和深度學習模型的智能監(jiān)控設備。這些攝像機不僅能夠捕捉視頻畫面,還能實時分析和處理所拍攝的內(nèi)容,從而實現(xiàn)對特定對象、場景或行
    的頭像 發(fā)表于 11-08 10:38 ?1164次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>圖像識別</b>攝像機

    AI大模型在圖像識別中的優(yōu)勢

    AI大模型在圖像識別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強大的計算能力、深度學習算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI大模型在圖像識別
    的頭像 發(fā)表于 10-23 15:01 ?2957次閱讀