chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于深度學(xué)習(xí)網(wǎng)絡(luò)識別的詳細介紹

MATLAB ? 來源:djl ? 2019-09-11 17:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

你有沒有想過,你經(jīng)常使用的深度學(xué)習(xí)網(wǎng)絡(luò)在看圖像的什么部分進行分類?

例如下圖:

如果深度學(xué)習(xí)網(wǎng)絡(luò)將此圖像分類為“圓號”,你認為圖片的哪個部分對分類最重要?

MathWorks Computer Vision System Toolbox 開發(fā)工程師Birju Patel專注于深度學(xué)習(xí),設(shè)計了如下案例進行解答這一問題:

我們使用預(yù)訓(xùn)練好的 ResNet-50 網(wǎng)絡(luò)進行此實驗。

* He, Kaiming, Zhang, Xiangyu, Ren, Shaoqing, Sun, Jian. "Deep Residual Learning for Image Recognition." In Proceedings of the IEEE conference on computer vision and pattern recognition, pp. 770-778. 2016.

獲取 MATLAB 中 ResNet-50 網(wǎng)絡(luò)的方法是啟動 Add-On Explorer(MATLAB 的 HOME 選項卡)并搜索 resnet。

net = resnet50;

我們需要注意 ResNet-50 需要輸入特定尺寸的圖像。網(wǎng)絡(luò)的初始層提供了這一信息:

sz = net.Layers(1).InputSize(1:2)sz = 224 224

所需的圖像尺寸可以直接傳遞給 imresize 函數(shù)。)

在網(wǎng)絡(luò)中調(diào)用 classify ,查看圖片可能的分類:

classify(net,rgb)ans = categorical French horn

ResNet-50 認為這是圓號。

Birju 在一篇關(guān)于卷積神經(jīng)網(wǎng)絡(luò)可視化技術(shù)的論文中,了解到遮擋敏感性的概念。如果阻擋或遮擋圖像的一部分,將如何影響網(wǎng)絡(luò)的預(yù)測得分?遮擋不同的部分又將如何影響結(jié)果?

Birju 做了如下嘗試:

rgb2 = rgb; rgb2((1:71)+77,(1:71)+108,:) = 128; imshow(rgb2)

classify(net,rgb2)ans = categorical notebook

Hmm...估計網(wǎng)絡(luò)“認為”灰色方塊看起來像筆記本。被遮擋的區(qū)域?qū)τ趫D像分類來說應(yīng)該很重要。再試試不同的遮擋位置:

rgb3 = rgb;rgb3((1:71)+15,(1:71)+80,:) = 128;imshow(rgb3)

classify(net,rgb3)ans = categorical French horn

好吧,腦袋并不重要。

Birju 編寫了一些 MATLAB 代碼來系統(tǒng)地量化不同圖像區(qū)域?qū)Ψ诸惤Y(jié)果的相對重要性。他使用 MATLAB 構(gòu)建了大量圖像,并對遮擋不同區(qū)域的圖像進行批處理。對于遮擋的不同位置,記錄預(yù)期類(本例為“法國號”)的概率得分。

我們制作一批帶有 71x71 遮擋區(qū)域的圖像。首先計算所有遮擋模塊的頂點,用 (X1,Y1) 和 (X2,Y2) 表示。

mask_size = [71 71]; [H,W,~] = size(rgb); X = 1:W; Y = 1:H; [X1, Y1] = meshgrid(X, Y); X1 = X1(:) - (mask_size(2)-1)/2; Y1 = Y1(:) - (mask_size(1)-1)/2; X2 = X1 + mask_size(2) - 1; Y2 = Y1 + mask_size(1) - 1;

注意不要讓遮擋區(qū)域的頂點偏離圖像邊界。

X1 = max(1, X1); Y1 = max(1, Y1); X2 = min(W, X2); Y2 = min(H, Y2);

批處理:

batch = repmat(rgb,[1 1 1 size(X1,1)]); for i = 1:size(X1,1) c = X1(i):X2(i); r = Y1(i):Y2(i); batch(r,c,:,i) = 128; % gray mask. end

注意:這一批包含 50,000 多張圖像。你需要大量的 RAM 才能同時創(chuàng)建和處理如此大量的圖像。

這里有一些遮擋的圖像:

現(xiàn)在,我們將使用 predict(而不是 classify)來獲取每個圖像在每個類別中的預(yù)測分數(shù)。MiniBatchSize 參數(shù)是用來限制 GPU 內(nèi)存的使用,意味著 predict 函數(shù)將一次發(fā)送 64 個圖像到 GPU 進行處理。

s = predict(net, batch, 'MiniBatchSize',64);size(s)ans = 50176 1000

我們獲得了很多的概率得分!其中 51,529 個圖像,共有 1,000 個類別。矩陣 s 具有每個類別和每個圖像的預(yù)測分數(shù)。

我們重點關(guān)注預(yù)測原始圖像類別的預(yù)測分數(shù):

scores = predict(net,rgb); [~,horn_idx] = max(scores);

這里是每一個圓號類別中的圖像預(yù)測分數(shù):

s_horn = s(:,horn_idx);

將圓號類別的分數(shù)轉(zhuǎn)換為圖像顯示:

S_horn = reshape(s_horn,H,W); imshow(-S_horn,[]) colormap(gca,'parula')

最亮的區(qū)域表示遮擋對概率得分影響最大的遮擋區(qū)間。

下面我們找到了最影響圓號概率得分的遮擋位置:

[min_score,min_idx] = min(s_horn); rgb_min_score = batch(:,:,:,min_idx); imshow(rgb_min_score)

結(jié)果可見,識別圓號的關(guān)鍵在于螺旋形管身和閥鍵,而不是號嘴。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    4948

    瀏覽量

    131265
  • 圖像分類
    +關(guān)注

    關(guān)注

    0

    文章

    96

    瀏覽量

    12172
  • 深度學(xué)習(xí)
    +關(guān)注

    關(guān)注

    73

    文章

    5561

    瀏覽量

    122805
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    深度學(xué)習(xí)賦能:正面吊車載箱號識別系統(tǒng)的核心技術(shù)

    支撐。 深度學(xué)習(xí)驅(qū)動的智能識別 傳統(tǒng)OCR技術(shù)易受光線、污損或箱體圖案干擾,而新一代識別系統(tǒng)通過深度卷積神經(jīng)網(wǎng)絡(luò)(CNN)和注意力機制,實現(xiàn)
    的頭像 發(fā)表于 05-07 10:10 ?205次閱讀

    軍事應(yīng)用中深度學(xué)習(xí)的挑戰(zhàn)與機遇

    ,并廣泛介紹深度學(xué)習(xí)在兩個主要軍事應(yīng)用領(lǐng)域的應(yīng)用:情報行動和自主平臺。最后,討論了相關(guān)的威脅、機遇、技術(shù)和實際困難。主要發(fā)現(xiàn)是,人工智能技術(shù)并非無所不能,需要謹慎應(yīng)用,同時考慮到其局限性、網(wǎng)
    的頭像 發(fā)表于 02-14 11:15 ?540次閱讀

    BP神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)的關(guān)系

    BP神經(jīng)網(wǎng)絡(luò)深度學(xué)習(xí)之間存在著密切的關(guān)系,以下是對它們之間關(guān)系的介紹: 一、BP神經(jīng)網(wǎng)絡(luò)的基本概念 BP神經(jīng)
    的頭像 發(fā)表于 02-12 15:15 ?863次閱讀

    ASR與傳統(tǒng)語音識別的區(qū)別

    ASR(Automatic Speech Recognition,自動語音識別)與傳統(tǒng)語音識別在多個方面存在顯著的區(qū)別。以下是對這兩者的對比: 一、技術(shù)基礎(chǔ) ASR : 基于深度學(xué)習(xí)
    的頭像 發(fā)表于 11-18 15:22 ?1355次閱讀

    深度學(xué)習(xí)中的卷積神經(jīng)網(wǎng)絡(luò)模型

    深度學(xué)習(xí)近年來在多個領(lǐng)域取得了顯著的進展,尤其是在圖像識別、語音識別和自然語言處理等方面。卷積神經(jīng)網(wǎng)絡(luò)作為
    的頭像 發(fā)表于 11-15 14:52 ?847次閱讀

    NPU在深度學(xué)習(xí)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度學(xué)習(xí)作為其核心驅(qū)動力之一,已經(jīng)在眾多領(lǐng)域展現(xiàn)出了巨大的潛力和價值。NPU(Neural Processing Unit,神經(jīng)網(wǎng)絡(luò)處理單元)是專門為深度
    的頭像 發(fā)表于 11-14 15:17 ?1922次閱讀

    LSTM神經(jīng)網(wǎng)絡(luò)在語音識別中的應(yīng)用實例

    語音識別技術(shù)是人工智能領(lǐng)域的一個重要分支,它使計算機能夠理解和處理人類語言。隨著深度學(xué)習(xí)技術(shù)的發(fā)展,特別是長短期記憶(LSTM)神經(jīng)網(wǎng)絡(luò)的引入,語音
    的頭像 發(fā)表于 11-13 10:03 ?1855次閱讀

    GPU深度學(xué)習(xí)應(yīng)用案例

    GPU在深度學(xué)習(xí)中的應(yīng)用廣泛且重要,以下是一些GPU深度學(xué)習(xí)應(yīng)用案例: 一、圖像識別 圖像識別
    的頭像 發(fā)表于 10-27 11:13 ?1384次閱讀

    激光雷達技術(shù)的基于深度學(xué)習(xí)的進步

    信息。這使得激光雷達在自動駕駛、無人機、機器人等領(lǐng)域具有廣泛的應(yīng)用前景。 二、深度學(xué)習(xí)技術(shù)的發(fā)展 深度學(xué)習(xí)是機器學(xué)習(xí)的一個分支,它通過模擬人
    的頭像 發(fā)表于 10-27 10:57 ?1072次閱讀

    AI大模型與深度學(xué)習(xí)的關(guān)系

    AI大模型與深度學(xué)習(xí)之間存在著密不可分的關(guān)系,它們互為促進,相輔相成。以下是對兩者關(guān)系的介紹: 一、深度學(xué)習(xí)是AI大模型的基礎(chǔ) 技術(shù)支撐 :
    的頭像 發(fā)表于 10-23 15:25 ?2900次閱讀

    AI大模型在圖像識別中的優(yōu)勢

    AI大模型在圖像識別中展現(xiàn)出了顯著的優(yōu)勢,這些優(yōu)勢主要源于其強大的計算能力、深度學(xué)習(xí)算法以及大規(guī)模的數(shù)據(jù)處理能力。以下是對AI大模型在圖像識別中優(yōu)勢的
    的頭像 發(fā)表于 10-23 15:01 ?2445次閱讀

    深度識別算法包括哪些內(nèi)容

    深度識別算法是深度學(xué)習(xí)領(lǐng)域的一個重要組成部分,它利用深度神經(jīng)網(wǎng)絡(luò)模型對輸入數(shù)據(jù)進行高層次的理解和
    的頭像 發(fā)表于 09-10 15:28 ?844次閱讀

    深度識別人臉識別有什么重要作用嗎

    深度學(xué)習(xí)人臉識別技術(shù)是人工智能領(lǐng)域的一個重要分支,它利用深度學(xué)習(xí)算法來識別和驗證個人身份。這項技
    的頭像 發(fā)表于 09-10 14:55 ?1143次閱讀

    深度識別人臉識別在任務(wù)中為什么有很強大的建模能力

    深度學(xué)習(xí)人臉識別技術(shù)是人工智能領(lǐng)域中的一個重要分支,它利用深度學(xué)習(xí)算法來識別和驗證人臉。這項技術(shù)
    的頭像 發(fā)表于 09-10 14:53 ?842次閱讀

    FPGA在深度神經(jīng)網(wǎng)絡(luò)中的應(yīng)用

    隨著人工智能技術(shù)的飛速發(fā)展,深度神經(jīng)網(wǎng)絡(luò)(Deep Neural Network, DNN)作為其核心算法之一,在圖像識別、語音識別、自然語言處理等領(lǐng)域取得了顯著成果。然而,傳統(tǒng)的
    的頭像 發(fā)表于 07-24 10:42 ?1209次閱讀