chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AI系統(tǒng)存在巨大缺陷 看圖識物比不上人類幼兒

羅欣 ? 來源:Quanta Magazine ? 作者:佚名 ? 2018-10-11 14:25 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人類,1分;AI,0分。

上個月,來自約克大學和多倫多大學的兩名研究人員合作發(fā)表了一篇論文:The Elephant in the Room,在學界引起巨大反響。通過實驗,他們發(fā)現(xiàn)現(xiàn)有人工智能系統(tǒng)還存在巨大缺陷,它們在“看圖識物”這類視覺任務上的表現(xiàn)甚至還比不上人類幼兒。

看罷這篇論文,加里·馬庫斯表達了對研究人員的贊許:“這是一篇聰明而重要的論文,它提醒我們所謂的‘深度學習’還沒有那么‘深刻’?!彼羌~約大學的認知心理學教授,也是優(yōu)步(Uber)人工智能實驗室的負責人。

這項成果出現(xiàn)在計算機視覺領域,論文設計的任務很常規(guī):訓練一個機器學習系統(tǒng),讓它學會檢測和分類圖像中的對象。隨著自動駕駛汽車離真正落地越來越近,學界對機器的視覺處理技術(shù)一直寄予厚望。為了保障安全,計算機必須能從一幅街景圖中準確分辨哪個是鳥,哪個是自行車,即便達不到超人水平,它們至少也應該和被替代的人眼一樣好用。

但是,這個任務并不簡單,它突出了人類視覺的復雜性——以及構(gòu)建模仿系統(tǒng)的高難度。在這項研究中,研究人員首先展示了一個能檢測、識別客廳場景下物品的計算機視覺系統(tǒng),它的性能很不錯,能發(fā)現(xiàn)客廳里有一把椅子、一個人和書架上的書。之后,他們在同一幅圖中加入了一個異常物體——一只大象,這時系統(tǒng)卻“指鹿為馬”了,它開始把椅子稱為沙發(fā),把大象稱為椅子,還忽視了之前能“看”到的其他物品。

對此,論文作者之一Amir Rosenfeld認為:“這些奇怪現(xiàn)象的出現(xiàn),表明了目前的物體檢測系統(tǒng)是多么脆弱?!彼麄儧]能在論文中解釋為什么會出現(xiàn)這種脆弱,但提出了一個破有見地的猜想:

這和人類具備,而AI沒有的一項能力有關——人類在看圖識物時能理解圖像中是否存在令人困惑的東西,從而讓自己去看第二眼。

房間里的大象

人類視覺和機器視覺很不一樣。

當我們睜開雙眼時,眼球開始收集大量視覺信息,并把它們輸送給大腦快速處理,這時我們知道天是藍的,草是綠的,萬物在不斷生長。

相比之下,機器在生成“視覺”上更費力。它們看待事物的方式類似用盲文閱讀,其中圖像的像素就是“文字”,通過在像素上運行各類算法,機器最終能生成關于目標物體的越來越復雜的表達形式。運行這一復雜過程的系統(tǒng)是神經(jīng)網(wǎng)絡,它由許多“層”構(gòu)成。

輸入一幅圖像后,神經(jīng)網(wǎng)絡會逐層提取圖像中的細節(jié),比如各個像素的顏色和亮度,層數(shù)越深,它提取到的特征就越抽象。在過程結(jié)束時,它會對根據(jù)這些特征對其正在觀察的內(nèi)容輸出最佳預測。

這個過程意味著相比人類,神經(jīng)網(wǎng)絡能把握更多人眼難辨的細節(jié)。事實上,現(xiàn)在基于神經(jīng)網(wǎng)絡的系統(tǒng)已經(jīng)在許多視覺處理任務上超越人類,比如依據(jù)品種對狗進行分類。這些成功應用提高了人們對技術(shù)的期待,研究人員也開始著手研究,看計算機視覺系統(tǒng)是否能幫助汽車快速通過擁擠的街道。

但是,這項技術(shù)的成功也激勵了一批人去探索它的脆弱性,比如近幾年非常流行的“對抗樣本”。通過在原圖上做一些肉眼幾乎看不到的擾動,新圖像就能欺騙人工智能系統(tǒng),讓它把“虎斑貓”分類成“鱷梨醬”,把3D打印的“烏龜”分類為“步槍”。這些研究不是杞人憂天,試想一下,如果有人惡意在道路標志上添加了這種擾動,致使自動駕駛汽車誤讀、漏讀路標,那車上乘客的生命安全該如何保障?

論文中的研究具有相同的精神。研究人員向機器展示了一個普通的客廳生活場景:一名男子正坐在破舊椅子邊緣,前傾身體,聚精會神地玩著游戲。如下圖所示,在“思考”片刻后,神經(jīng)網(wǎng)絡正確檢測到了一系列物體:椅子、手提包、杯子、筆記本電腦、人、書籍、電視機、瓶子、時鐘。

但是,當他們在場景中引入了一些不協(xié)調(diào)的東西——一只大象后,神經(jīng)網(wǎng)絡就被新加入的像素迷惑了。如下圖所示,在幾次試驗中,神經(jīng)網(wǎng)絡開始把大象識別為椅子,把椅子識別為沙發(fā),它也忽略了靠近大象一側(cè)的一排書。即便是離大象較遠的物體,系統(tǒng)也存在錯漏情況。

這個發(fā)現(xiàn)之所以令學界震驚,是因為實驗展示的是現(xiàn)在最基礎、最通行的物體檢測技術(shù),雖然客廳內(nèi)突然出現(xiàn)一頭大象并不現(xiàn)實,但公路上出現(xiàn)一只火雞確實可能的?,F(xiàn)實道路上會發(fā)生很多意料之外的事,根據(jù)論文結(jié)果,我們有理由懷疑,自動駕駛汽車會因為路邊突然出現(xiàn)的一只火雞,而無法檢測到車前的行人。

正如羅恩菲爾德說的:“如果房間里真的有一頭大象,那你肯定會注意到它,但這個系統(tǒng)卻甚至沒能檢測到它的存在?!?/p>

萬事皆有因果

當人類看到意想不到的東西時,我們會先愣一下,然后才恍然大悟。這是一個具有真實認知意義的常見現(xiàn)象——它恰好揭示了為什么神經(jīng)網(wǎng)絡無法處理“怪異”場景。

現(xiàn)如今,最先進的物體檢測神經(jīng)網(wǎng)絡還是以“前饋”的方式工作,這意味著信息流經(jīng)神經(jīng)網(wǎng)絡時是單向的,從輸入細粒度像素開始,到檢測曲線、檢測形狀、檢測場景,再到最后輸出最佳預測。為了確保預測的準確性,它必須在整個過程中不斷收集“有用”信息,但這種單向性也意味著如果早期信息存在某種錯誤,那這些錯誤就會污染預測結(jié)果。

論文作者之一Tsotsos表示:“從神經(jīng)網(wǎng)絡頂部開始,我們確實可以探索和結(jié)果相關的一切內(nèi)容,但我們也有可能讓每個位置的每個特征都對每一個可能的輸出作出干擾。”

舉一個大家都理解的例子。假設圖中有一個圓和一個正方形,它們顏色各異,一個是紅的,一個是藍的。現(xiàn)在要求你在短時間內(nèi)觀察圖片,并迅速答出正方形是什么顏色的。如果注意力夠集中,我們可能一瞥就能給出答案;如果有些頭昏腦脹,我們可能看了一眼后還會有點迷惑,然后自然而然地會去重新看一遍。而且當我們看第二遍時,注意力是高度集中在觀察正方形顏色上的。

簡而言之,人類的視覺系統(tǒng)如果沒有獲得想要的答案,它會回頭看看自己在哪里犯了錯。而這個過程可以用1990年《Behavioral and Brain Sciences》一篇論文中提到的概念——選擇性調(diào)整模型(ST)來解釋。如上圖所示,那篇論文假設視覺處理架構(gòu)在結(jié)構(gòu)上是金字塔形的,該網(wǎng)絡內(nèi)的節(jié)點接收前饋和反饋連接。當刺激輸入視覺系統(tǒng)時,首先它會以前饋的方式激活與其連接的金字塔內(nèi)的所有節(jié)點;之后,輸出的結(jié)果再以反饋的方式重新回到之前的節(jié)點中,激活倒置子金字塔。

這個模型的優(yōu)勢在于人類能依靠前饋和反饋,選擇感興趣的時空區(qū)域,選擇與當前任務相關的事物并選擇最佳視點,同時,我們也能通過修剪不相關的內(nèi)容來限制任務相關的搜索空間,只考慮之前有過提示信息的位置,用位置/特征信息抑制感受野中的干擾,更簡單、高效的獲取最佳結(jié)果。

而大多數(shù)神經(jīng)網(wǎng)絡缺乏這種反饋能力,這也是科研人員一直無法有所突破的研究難點?,F(xiàn)在使用前饋網(wǎng)絡的一個優(yōu)點是容易訓練——只需讓輸入通過一個6層神經(jīng)網(wǎng)絡,但是,如果我們希望未來機器也能“先愣一下,然后才恍然大悟”,它們就必須理解什么時候該回頭看看,什么時候該簡單前饋。

人腦可以在這些過程之間無縫切換,但神經(jīng)網(wǎng)絡還需要一個新的理論框架才能做同樣的事情。

就在本月,谷歌上線了一個對抗樣本挑戰(zhàn)Unrestricted Adversarial Examples Challenge,他們向社區(qū)征集參賽鳥/自行車分類器,要求參賽的“對抗者”可以在輸入有擾動的圖像后,依然準確分類鳥和自行車;而“攻擊者”的目標是生成一張包含鳥的圖像,讓“對抗者”分類器把它分類成自行車。這離構(gòu)建選擇性調(diào)整模型還有不小距離,但這是通向解決問題的第一步——也是不可或缺的一步。

本文來源:Quanta Magazine

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4842

    瀏覽量

    108180
  • AI
    AI
    +關注

    關注

    91

    文章

    41143

    瀏覽量

    302609
  • 機器學習
    +關注

    關注

    67

    文章

    8565

    瀏覽量

    137226
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    論馬斯克的預言:AI使人類邊緣化

    工作領域的邊緣化。 局限性 AI能力限制方面:盡管AI發(fā)展迅速,但目前仍存在諸多局限性,如在常識推理、跨領域遷移學習等方面存在本質(zhì)缺陷,在數(shù)
    發(fā)表于 03-14 05:27

    邊緣AI算力臨界點:深度解析176TOPS香橙派AI Station的產(chǎn)業(yè)價值

    調(diào)度與操作系統(tǒng)運行。 2、 10個AI Core (達芬奇架構(gòu),1.08GHz):專為高密度的矩陣運算設計,承擔神經(jīng)網(wǎng)絡推理。 3、 8個Vector Core (1GHz):輔助進行數(shù)據(jù)預處理和向量
    發(fā)表于 03-10 14:19

    嵌入式軟件單元測試中AI自動化與人工檢查的協(xié)同機制研究:基于專業(yè)工具的實證分析

    ? ?摘要****? 本文系統(tǒng)探討嵌入式軟件相較于通用軟件在單元測試層面的特殊性,分析其對高覆蓋率、可追溯性與實時性驗證的嚴苛需求,并以專業(yè)工具winAMS為技術(shù)載體,深入研究AI驅(qū)動的自動化測試在
    發(fā)表于 12-31 11:22

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時代

    技術(shù),更關乎人類如何連接、如何生活、如何創(chuàng)造更美好的未來。 在這個萬互聯(lián)的時代,AI正在讓我們的\"天網(wǎng)\"更加智能、更加可靠、更加人性化。當我們在高速公路上暢享高清視頻,或在偏遠
    發(fā)表于 10-11 16:01

    硅片濕法清洗工藝存在哪些缺陷

    硅片濕法清洗工藝雖然在半導體制造中廣泛應用,但其存在一些固有缺陷和局限性,具體如下:顆粒殘留與再沉積風險來源復雜多樣:清洗液本身可能含有雜質(zhì)或微生物污染;過濾系統(tǒng)的濾芯失效導致大顆粒物質(zhì)未被有效攔截
    的頭像 發(fā)表于 09-22 11:09 ?1005次閱讀
    硅片濕法清洗工藝<b class='flag-5'>存在</b>哪些<b class='flag-5'>缺陷</b>

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    、分布式群體智能 1)聯(lián)網(wǎng)AGI系統(tǒng) 優(yōu)勢: 組成部分: 2)分布式AI訓練 7、發(fā)展重點:基于強化學習的后訓練與推理 8、超越大模型:神經(jīng)符號計算 三、AGI芯片的實現(xiàn) 1、技術(shù)需求 AI
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+具身智能芯片

    控制器等。 具身智能常見的感知模塊往往被稱為智能傳感器,就是在原有的傳感器上加入一定的AI功能,從而可以模擬人類的5種基本感覺:視覺、聽覺、觸覺、嗅覺和味覺。 1、輸入端的數(shù)據(jù)壓縮 輸入端常用的數(shù)據(jù)壓縮
    發(fā)表于 09-18 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    配備科學發(fā)現(xiàn)仍需人類的直覺和靈感 ④正價可解釋性和透明性 ⑤解決倫理和道德問題六、AI芯片用于“AI科學家”系統(tǒng) AI芯片的作用:七、用量子
    發(fā)表于 09-17 11:45

    AI課程走進校園:我們?nèi)绾巫尯⒆訌摹皶谩钡健皶?chuàng)造”?

    DFRobot AI 新品發(fā)布會 9月17日19:30 重磅直播! 2025年5月,教育部印發(fā)了《中小學人工智能通教育指南》,9月的新學期,北京、上海、杭州等多地陸續(xù)開展了“人工智能通課”。這
    的頭像 發(fā)表于 09-16 14:22 ?783次閱讀

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+化學或生物方法實現(xiàn)AI

    的憶阻器、MAC計算單元及存儲器 可以利用液體的流體力學特征做一個納米級微流體系統(tǒng),用水柱來實現(xiàn)邏輯門。 ①用有機聚合溶液實現(xiàn)互連、憶阻器和神經(jīng)網(wǎng)絡 有機聚合計算通常被歸類為化學計算。 有一種有機
    發(fā)表于 09-15 17:29

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+可期之變:從AI硬件到AI濕件

    ,又分為真菌計算和基于DNA的計算。 圖4 基本的真菌計算機結(jié)構(gòu) 在用化學和生物方法實現(xiàn)AI功能的過程中,要經(jīng)歷5個階段,見圖5所示。 圖5 以化學和生物方法實現(xiàn)AI功能各階段 期待從AI硬件到
    發(fā)表于 09-06 19:12

    AI 邊緣計算網(wǎng)關:開啟智能新時代的鑰匙?—龍興聯(lián)

    智能化決策的關鍵。卷積神經(jīng)網(wǎng)絡在圖像識別方面表現(xiàn)卓越,在智能工廠產(chǎn)品質(zhì)量檢測中,能快速準確識別產(chǎn)品缺陷;循環(huán)神經(jīng)網(wǎng)絡擅長處理時間序列數(shù)據(jù),可對設備故障進行精準預測。 在通信技術(shù)與協(xié)議支持上,AI 邊緣
    發(fā)表于 08-09 16:40

    【書籍評測活動NO.64】AI芯片,從過去走向未來:《AI芯片:科技探索與AGI愿景》

    發(fā)現(xiàn)從 “偶然突破” 走向 “可控產(chǎn)出”。 系統(tǒng)創(chuàng)新 這部分介紹了云端神經(jīng)形態(tài)計算架構(gòu)、超導與非超導低溫類腦芯片、自旋波類腦芯片。這些技術(shù)讓芯片運行模式更接近人類大腦,為低功耗、高智能AI奠定
    發(fā)表于 07-28 13:54

    電子元器件知識大全:看圖元件

    ,比如元器件的正確選用等,筆者在此就不逐一列舉了,下面筆者就來說一些非常實用的電子知識,希望大家都能向高手之路再邁上一步。注:下文內(nèi)容最好結(jié)合圖一和后續(xù)圖片進行閱讀。 看圖元件"
    發(fā)表于 06-09 16:55

    AI時代:不可替代的“人類+”職業(yè)技能

    當生成式人工智能能夠撰寫報告、編寫代碼甚至設計產(chǎn)品時,一個根本性的焦慮開始蔓延:人類工作者是否正在被算法取代?這個問題的答案或許比簡單的“是”或“否”更為復雜——AI確實在重塑職業(yè)版圖,但真正的挑戰(zhàn)
    的頭像 發(fā)表于 05-20 16:13 ?874次閱讀