chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

?人工智能技術解密——機器視覺技術及應用

jf_pJlTbmA9 ? 來源:jf_pJlTbmA9 ? 作者:jf_pJlTbmA9 ? 2023-07-07 14:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

視覺是人類最敏感、最直接的感知方式,在不進行實際接觸的情況下,視覺感知可以使得我們獲取周圍環(huán)境的諸多信息。由于生物視覺系統(tǒng)非常復雜,目前還不能使得某一機器系統(tǒng)完全具備這一強大的視覺感知能力。當下,機器視覺的目標即,構建一個在可控環(huán)境中處理特定任務的機器視覺系統(tǒng)。由于工業(yè)中的視覺環(huán)境可控,并且處理任務特定,所以現(xiàn)如今大部分的機器視覺被應用在工業(yè)當中。

人類視覺感知是通過眼睛視網(wǎng)膜的椎體和桿狀細胞對光源進行捕捉,而后由神經(jīng)纖維將信號傳遞至大腦視覺皮層,形成我們所看到的圖像,而機器視覺卻不然。機器視覺系統(tǒng)的輸入是圖像,輸出是對這些圖像的感知描述。這組描述與這些圖像中的物體或場景息息相關,并且這些描述可以幫助機器來完成特定的后續(xù)任務,指導機器人系統(tǒng)與周圍的環(huán)境進行交互。

1678171542755663.png

那么,迄今為止,主流的機器視覺技術又有哪些呢?

1. 中流砥柱——卷積神經(jīng)網(wǎng)絡

卷積神經(jīng)網(wǎng)絡是目前計算機視覺中使用最普遍的模型結(jié)構。引入卷積神經(jīng)網(wǎng)絡進行特征提取,既能提取到相鄰像素點之間的特征模式,又能保證參數(shù)的個數(shù)不隨圖片尺寸變化。上圖是一個典型的卷積神經(jīng)網(wǎng)絡結(jié)構,多層卷積和池化層組合作用在輸入圖片上,在網(wǎng)絡的最后通常會加入一系列全連接層,ReLU激活函數(shù)一般加在卷積或者全連接層的輸出上,網(wǎng)絡中通常還會加入Dropout來防止過擬合。

自2012年AlexNet在ImageNet比賽上獲得冠軍,卷積神經(jīng)網(wǎng)絡逐漸取代傳統(tǒng)算法成為了處理計算機視覺任務的核心。

在這幾年,研究人員從提升特征提取能力,改進回傳梯度更新效果,縮短訓練時間,可視化內(nèi)部結(jié)構,減少網(wǎng)絡參數(shù)量,模型輕量化,自動設計網(wǎng)絡結(jié)構等這些方面,對卷積神經(jīng)網(wǎng)絡的結(jié)構有了較大的改進,逐漸研究出了AlexNet、ZFNet、VGG、NIN、GoogLeNet和Inception系列、ResNet、WRN和DenseNet等一系列經(jīng)典模型,MobileNet系列、ShuffleNet系列、SqueezeNet和Xception等輕量化模型。

1678171559800986.png

卷積網(wǎng)絡示意圖

經(jīng)典模型,AlexNet:

AlexNet是第一個深度神經(jīng)網(wǎng)絡,其主要特點包括:

1.使用ReLU作為激活函數(shù)。

2.提出在全連接層使用Dropout避免過擬合。注:當BN提出后,Dropout就被BN替代了。

3.由于GPU顯存太小,使用了兩個GPU,做法是在通道上分組。

4.使用局部響應歸一化(Local Response Normalization --LRN),在生物中存在側(cè)抑制現(xiàn)象,即被激活的神經(jīng)元會抑制周圍的神經(jīng)元。在這里的目的是讓局部響應值大的變得相對更大,并抑制其它響應值相對比較小的卷積核。例如,某特征在這一個卷積核中響應值比較大,則在其它相鄰卷積核中響應值會被抑制,這樣一來卷積核之間的相關性會變小。LRN結(jié)合ReLU,使得模型提高了一點多個百分點。

5.使用重疊池化。作者認為使用重疊池化會提升特征的豐富性,且相對來說會更難過擬合。

1678171573521143.png

集大成之作,ResNet:

一般而言,網(wǎng)絡越深越寬會有更好的特征提取能力,但當網(wǎng)絡達到一定層數(shù)后,隨著層數(shù)的增加反而導致準確率下降,網(wǎng)絡收斂速度更慢。

傳統(tǒng)的卷積網(wǎng)絡在一個前向過程中每層只有一個連接,ResNet增加了殘差連接從而增加了信息從一層到下一層的流動。FractalNets重復組合幾個有不同卷積塊數(shù)量的并行層序列,增加名義上的深度,卻保持著網(wǎng)絡前向傳播短的路徑。相類似的操作還有Stochastic depth和Highway Networks等。這些模型都顯示一個共有的特征,縮短前面層與后面層的路徑,其主要的目的都是為了增加不同層之間的信息流動。

2. 后起之秀——Transformers

1678171612587712.png

Transformer是一種self-attention(自注意力)模型架構,2017年之后在NLP領域取得了很大的成功,尤其是序列到序列(seq2seq)任務,如機器翻譯和文本生成。2020年,谷歌提出pure transformer結(jié)構ViT,在ImageNet分類任務上取得了和CNN可比的性能。之后大量ViT衍生的Transformer架構在ImageNet上都取得了成功。

Transformer與CNN相比優(yōu)點是具有較少的歸納性與先驗性,因此可以被認為是不同學習任務的通用計算原語,參數(shù)效率與性能增益與CNN相當。不過缺點是在預訓練期間,對大數(shù)據(jù)機制的依賴性更強,因為Transformer沒有像CNN那樣定義明確的歸納先驗。因此當下出現(xiàn)了一個新趨勢:當self-attention與CNN結(jié)合時,它們會建立強大的基線( BoTNet )。

Vision Transformer(ViT)將純Transformer架構直接應用到一系列圖像塊上進行分類任務,可以取得優(yōu)異的結(jié)果。它在許多圖像分類任務上也優(yōu)于最先進的卷積網(wǎng)絡,同時所需的預訓練計算資源大大減少。

1678171626601834.png

DETR是第一個成功地將Transformer作為pipeline中的主要構建塊的目標檢測框架。它與以前的SOTA方法(高度優(yōu)化的Faster R-CNN)的性能匹配,具有更簡單和更靈活的pipeline。

Transformer的變體模型是目前的研究熱點,主要分為以下幾個類型:1)模型輕量化;2)加強跨模塊連接;3)自適應的計算時間;4)引入分而治之的策略;4)循環(huán)Transformers;5)等級化的Transformer。

3. 欺騙機器的眼睛——對抗性示例

最近引起研究界注意的一個問題是這些系統(tǒng)對對抗樣本的敏感性。一個對抗性的例子是一個嘈雜的圖像,旨在欺騙系統(tǒng)做出錯誤的預測。為了在現(xiàn)實世界中部署這些系統(tǒng),它們必須能夠檢測到這些示例。為此,最近的工作探索了通過在訓練過程中包含對抗性示例來使這些系統(tǒng)更強大對抗對抗性攻擊的可能性。

現(xiàn)階段對模型攻擊的分類主要分為兩大類,即攻擊訓練階段和推理階段。

訓練階段的攻擊(Training in Adversarial Settings),主要的方法就是針對模型的參數(shù)進行微小的擾動,從讓而達到讓模型的性能和預期產(chǎn)生偏差的目的。例如直接通過對于訓練數(shù)據(jù)的標簽進行替換,讓數(shù)據(jù)樣本和標簽不對應,從而最后訓練的結(jié)果也一定與預期的產(chǎn)生差異,或者通過在線的方式獲得訓練數(shù)據(jù)的輸入權,操縱惡意數(shù)據(jù)來對在線訓練過程進行擾動,最后的結(jié)果就是產(chǎn)出脫離預期。

推理階段的攻擊(Inference in Adversarial Settings),是當一個模型被訓練完成后,可以將該模型主觀的看作是一個盒子,如果該盒子對我們來說是透明的則可以將其看成“白盒”模型,若非如此則看成“黑盒”模型。所謂的“白盒攻擊”,就是我們需要知道里面所有的模型參數(shù),但這在實際操作中并不現(xiàn)實,卻有實現(xiàn)的可能,因此我們需要有這種前提假設。黑盒攻擊就比較符合現(xiàn)實生活中的場景:通過輸入和輸出猜測模型的內(nèi)部結(jié)構;加入稍大的擾動來對模型進行攻擊;構建影子模型來進行關系人攻擊;抽取模型訓練的敏感數(shù)據(jù);模型逆向參數(shù)等等。

對抗攻擊的防御機制。抵御對抗樣本攻擊主要是基于附加信息引入輔助塊模型(AuxBlocks)進行額外輸出來作為一種自集成的防御機制,尤其在針對攻擊者的黑盒攻擊和白盒攻擊時,該機制效果良好。除此之外防御性蒸餾也可以起到一定的防御能力,防御性蒸餾是一種將訓練好的模型遷移到結(jié)構更為簡單的網(wǎng)絡中,從而達到防御對抗攻擊的效果。

對抗學習的應用舉例,1)自動駕駛;2)金融欺詐。

自動駕駛是未來智能交通的發(fā)展方向,但在其安全性獲得完全檢驗之前,人們還難以信任這種復雜的技術。雖然許多車企、科技公司已經(jīng)在這一領域進行了許多實驗,但對抗樣本技術對于自動駕駛?cè)匀皇且粋€巨大的挑戰(zhàn)。幾個攻擊實例:對抗攻擊下的圖片中的行人在模型的面前隱身,對抗樣本使得模型“無視”路障;利用AI對抗樣本生成特定圖像并進行干擾時,特斯拉的Autopilot系統(tǒng)輸出了「錯誤」的識別結(jié)果,導致車輛雨刷啟動;在道路的特定位置貼上若干個對抗樣本貼紙,可以讓處在自動駕駛模式的汽車并入反向車道;在Autopilot系統(tǒng)中,通過游戲手柄對車輛行駛方向進行控制;對抗樣本使得行人對于機器學習模型“隱身”。

4. 自學也能成才——自監(jiān)督學習

深度學習需要干凈的標記數(shù)據(jù),這對于許多應用程序來說很難獲得。注釋大量數(shù)據(jù)需要大量的人力勞動,這是耗時且昂貴的。此外,數(shù)據(jù)分布在現(xiàn)實世界中一直在變化,這意味著模型必須不斷地根據(jù)不斷變化的數(shù)據(jù)進行訓練。自監(jiān)督方法通過使用大量原始未標記數(shù)據(jù)來訓練模型來解決其中的一些挑戰(zhàn)。在這種情況下,監(jiān)督是由數(shù)據(jù)本身(不是人工注釋)提供的,目標是完成一個間接任務。間接任務通常是啟發(fā)式的(例如,旋轉(zhuǎn)預測),其中輸入和輸出都來自未標記的數(shù)據(jù)。定義間接任務的目標是使模型能夠?qū)W習相關特征,這些特征稍后可用于下游任務(通常有一些注釋可用)。

自監(jiān)督學習是一種數(shù)據(jù)高效的學習范式。監(jiān)督學習方法教會模型擅長特定任務。另一方面,自監(jiān)督學習允許學習不專門用于解決特定任務的一般表示,而是為各種下游任務封裝更豐富的統(tǒng)計數(shù)據(jù)。在所有自監(jiān)督方法中,使用對比學習進一步提高了提取特征的質(zhì)量。自監(jiān)督學習的數(shù)據(jù)效率特性使其有利于遷移學習應用。

目前的自監(jiān)督學習領域可大致分為兩個分支。一個是用于解決特定任務的自監(jiān)督學習,例如上次討論的場景去遮擋,以及自監(jiān)督的深度估計、光流估計、圖像關聯(lián)點匹配等。另一個分支則用于表征學習。有監(jiān)督的表征學習,一個典型的例子是ImageNet分類。而無監(jiān)督的表征學習中,最主要的方法則是自監(jiān)督學習。

自監(jiān)督學習方法依賴于數(shù)據(jù)的空間和語義結(jié)構,對于圖像,空間結(jié)構學習是極其重要的,因此在計算機視覺領域中的應用廣泛。一種是將旋轉(zhuǎn)、拼接和著色在內(nèi)的不同技術被用作從圖像中學習表征的前置任務。對于著色,將灰度照片作為輸入并生成照片的彩色版本。另一種廣泛用于計算機視覺自監(jiān)督學習的方法是放置圖像塊。一個例子包括Doersch等人的論文。在這項工作中,提供了一個大型未標記的圖像數(shù)據(jù)集,并從中提取了隨機的圖像塊對。在初始步驟之后,卷積神經(jīng)網(wǎng)絡預測第二個圖像塊相對于第一個圖像塊的位置。還有其他不同的方法用于自監(jiān)督學習,包括修復和判斷分類錯誤的圖像。

結(jié)語:

自2012年AlexNet問世這十年來,機器視覺領域的技術可以說是日新月異。機器視覺在諸多領域也逐漸接近甚至超越了我們?nèi)祟惖难劬?。隨著技術的不斷進步,機器視覺技術也一定會變得更加的強大,無論是安全防護、自動駕駛、缺陷檢測還是目標識別等領域,相信機器視覺會帶給我們更多的驚喜。

審核編輯:湯梓紅

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器人
    +關注

    關注

    213

    文章

    29748

    瀏覽量

    212932
  • 機器視覺
    +關注

    關注

    163

    文章

    4597

    瀏覽量

    122914
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    人工智能是什么?

    ` 人工智能是什么?什么是人工智能?人工智能是未來發(fā)展的必然趨勢嗎?以后人工智能技術真的能達到電影里機器人的
    發(fā)表于 09-16 15:40

    人工智能技術—AI

      人工智能技術的概念從出來到現(xiàn)在已經(jīng)有很多年的歷史了,其實所謂的人工智能技術本身就是一種模擬人類大腦的思考方式的一種技術,它的英文簡稱是AI技術,在西方國家,
    發(fā)表于 10-21 12:03

    機器視覺技術——人工智能的下一個前沿

    `國外科技網(wǎng)站Venturebeat發(fā)布文章稱,人工智能在過去一年里有著強勁的發(fā)展,給人們帶來越來越多的益處。而未來,機器視覺將會是人工智能的下一個前沿領域。隨著該類
    發(fā)表于 12-17 17:14

    電銷機器人成為2018人工智能最熱產(chǎn)業(yè)之一

    、自然語言處理、語音識別、機器學習應用、計算機視覺與圖像、技術平臺、智能無人機、智能機器人、無人
    發(fā)表于 05-21 15:54

    初學AI人工智能需要哪些技術?這幾本書為你解答

    新的能以人類智能相似的方式做出反應的智能機器,該領域的研究包括機器人、語言識別、圖像識別、自然語言處理和專家系統(tǒng)等。人工智能從誕生以來,理論
    發(fā)表于 01-21 14:26

    人工智能技術及算法設計指南

    手把手教你設計人工智能芯片及系統(tǒng)(全階設計教程+AI芯片F(xiàn)PGA實現(xiàn)+開發(fā)板)詳情鏈接:http://url.elecfans.com/u/c422a4bd15人工智能各種技術與算法
    發(fā)表于 02-12 14:07

    2019年人工智能技術峰會落幕,大咖演講PPT火熱出爐!

    `2019年6月28日,由<電子發(fā)燒友>主辦,深圳市機器人協(xié)會、深圳市人工智能行業(yè)協(xié)會和華強智慧網(wǎng)聯(lián)合主辦的“2019年人工智能技術峰會”在深圳成功舉行。本次峰會以“加速
    發(fā)表于 07-02 16:36

    路徑規(guī)劃用到的人工智能技術

    路徑規(guī)劃用到的人工智能技術人工智能編程語言/數(shù)據(jù)結(jié)構與算法三 人工智能基礎原理四 智能信息獲?。ê喎Q爬蟲) 與數(shù)據(jù)分析1、發(fā)起請求3、解析內(nèi)容4、保存數(shù)據(jù)二、Requests庫介紹
    發(fā)表于 07-20 06:53

    嵌入式人工智能技術是什么?

    嵌入式人工智能技術是什么?
    發(fā)表于 12-27 07:03

    【開源硬件系列04期】AI人工智能技術帶給EDA的機遇和挑戰(zhàn)(文中含回放+課件)

    識別、自動駕駛、金融等領域獲得了成功應用。如何將人工智能技術應用在芯片設計自動化(EDA)領域是近年來的熱門話題。本次直播將從數(shù)據(jù)、算法、應用場景等方面討論人工智能技術為EDA帶來的新機遇,包括AI
    發(fā)表于 01-17 16:56

    《移動終端人工智能技術與應用開發(fā)》人工智能的發(fā)展與AI技術的進步

    人工智能打發(fā)展是算法優(yōu)先于實際應用。近幾年隨著人工智能的不斷普及,許多深度學習算法涌現(xiàn),從最初的卷積神經(jīng)網(wǎng)絡(CNN)到機器學習算法的時代。由于應用環(huán)境的差別衍生出不同的學習算法:線性回歸,分類與回歸樹
    發(fā)表于 02-17 11:00

    《移動終端人工智能技術與應用開發(fā)》+快速入門AI的捷徑+書中案例實操

    人工智能技術與應用開發(fā)》正好和我的工作內(nèi)容非常貼合。一、內(nèi)容概覽機械工業(yè)出版社的計算機圖書歷來有很好的口碑。此書由泰爾終端實驗室專家撰寫,匯聚華為、曠視、vivo、百度、高通等主流廠商的AI技術,闡述了移動終端
    發(fā)表于 02-19 20:24

    《移動終端人工智能技術與應用開發(fā)》+理論學習

    收到《移動終端人工智能技術與應用開發(fā)》有一段時間了,由于時間有限,加上工作原因,目前只看到第3章,前幾章主要介紹人工智能機器學習的基礎知識,發(fā)展歷程,分類等,重點說明了,在移動終端上如何實現(xiàn)
    發(fā)表于 02-27 23:28

    人工智能技術是什么

    人工智能技術是什么 人工智能技術是一種模擬人類智能技術,其中包含了許多不同的領域和應用,如機器學習、自然語言處理、計算機
    的頭像 發(fā)表于 08-12 16:48 ?3973次閱讀

    人工智能技術及應用學什么

    、視覺感知、決策制定等能力,使機器能夠以類似于人類的方式處理信息。在未來,人工智能有望在醫(yī)療、交通、金融等眾多領域中發(fā)揮重大作用,這也使得人工智能技術及應用成為當今學習的熱門課題。 一
    的頭像 發(fā)表于 08-15 16:07 ?3537次閱讀