chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

現(xiàn)代計算機視覺技術(shù)在過去10年里取得了顯著進(jìn)展

新機器視覺 ? 來源:新機器視覺 ? 作者:missinglink.ai ? 2020-12-31 09:45 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

介紹使圖像分割的方法,包括傳統(tǒng)方法和深度學(xué)習(xí)方法,以及應(yīng)用場景。

基于人工智能和深度學(xué)習(xí)方法的現(xiàn)代計算機視覺技術(shù)在過去10年里取得了顯著進(jìn)展。如今,它被用于圖像分類、人臉識別、圖像中物體的識別、視頻分析和分類以及機器人自動駕駛車輛的圖像處理等應(yīng)用上。

許多計算機視覺任務(wù)需要對圖像進(jìn)行智能分割,以理解圖像中的內(nèi)容,并使每個部分的分析更加容易。今天的圖像分割技術(shù)使用計算機視覺深度學(xué)習(xí)模型來理解圖像的每個像素所代表的真實物體,這在十年前是無法想象的。

深度學(xué)習(xí)可以學(xué)習(xí)視覺輸入的模式,以預(yù)測組成圖像的對象類。用于圖像處理的主要深度學(xué)習(xí)架構(gòu)是卷積神經(jīng)網(wǎng)絡(luò)(CNN),或者是特定的CNN框架,如AlexNet、VGG、Inception和ResNet。計算機視覺的深度學(xué)習(xí)模型通常在專門的圖形處理單元(GPU)上訓(xùn)練和執(zhí)行,以減少計算時間。

什么是圖像分割?

圖像分割是計算機視覺中的一個關(guān)鍵過程。它包括將視覺輸入分割成片段以簡化圖像分析。片段表示目標(biāo)或目標(biāo)的一部分,并由像素集或“超像素”組成。圖像分割將像素組織成更大的部分,消除了將單個像素作為觀察單位的需要。圖像分析有三個層次:

分類- 將整幅圖片分成“人”、“動物”、“戶外”等類別

目標(biāo)檢測- 檢測圖像中的目標(biāo)并在其周圍畫一個矩形,例如一個人或一只羊。

分割- 識別圖像的部分,并理解它們屬于什么對象。分割是進(jìn)行目標(biāo)檢測和分類的基礎(chǔ)。

語義分割 vs. 實例分割

在分割過程本身,有兩個粒度級別:

語義分割- 將圖像中的所有像素劃分為有意義的對象類。這些類是“語義上可解釋的”,并對應(yīng)于現(xiàn)實世界的類別。例如,你可以將與貓相關(guān)的所有像素分離出來,并將它們涂成綠色。這也被稱為dense預(yù)測,因為它預(yù)測了每個像素的含義。

實例分割- 標(biāo)識圖像中每個對象的每個實例。它與語義分割的不同之處在于它不是對每個像素進(jìn)行分類。如果一幅圖像中有三輛車,語義分割將所有的車分類為一個實例,而實例分割則識別每一輛車。

傳統(tǒng)的圖像分割方法

還有一些過去常用的圖像分割技術(shù),但效率不如深度學(xué)習(xí)技術(shù),因為它們使用嚴(yán)格的算法,需要人工干預(yù)和專業(yè)知識。這些包括:

閾值- 將圖像分割為前景和背景。指定的閾值將像素分為兩個級別之一,以隔離對象。閾值化將灰度圖像轉(zhuǎn)換為二值圖像或?qū)⒉噬珗D像的較亮和較暗像素進(jìn)行區(qū)分。

K-means聚類- 算法識別數(shù)據(jù)中的組,變量K表示組的數(shù)量。該算法根據(jù)特征相似性將每個數(shù)據(jù)點(或像素)分配到其中一組。聚類不是分析預(yù)定義的組,而是迭代地工作,從而有機地形成組。

基于直方圖的圖像分割- 使用直方圖根據(jù)“灰度”對像素進(jìn)行分組。簡單的圖像由一個對象和一個背景組成。背景通常是一個灰度級,是較大的實體。因此,一個較大的峰值代表了直方圖中的背景灰度。一個較小的峰值代表這個物體,這是另一個灰色級別。

邊緣檢測- 識別亮度的急劇變化或不連續(xù)的地方。邊緣檢測通常包括將不連續(xù)點排列成曲線線段或邊緣。例如,一塊紅色和一塊藍(lán)色之間的邊界。

深度學(xué)習(xí)如何助力圖像分割方法

現(xiàn)代圖像分割技術(shù)以深度學(xué)習(xí)技術(shù)為動力。下面是幾種用于分割的深度學(xué)習(xí)架構(gòu):

使用CNN進(jìn)行圖像分割,是將圖像的patch作為輸入輸入給卷積神經(jīng)網(wǎng)絡(luò),卷積神經(jīng)網(wǎng)絡(luò)對像素進(jìn)行標(biāo)記。CNN不能一次處理整個圖像。它掃描圖像,每次看一個由幾個像素組成的小“濾鏡”,直到它映射出整個圖像。

傳統(tǒng)的cnn網(wǎng)絡(luò)具有全連接的層,不能處理不同的輸入大小。FCNs使用卷積層來處理不同大小的輸入,可以工作得更快。最終的輸出層具有較大的感受野,對應(yīng)于圖像的高度和寬度,而通道的數(shù)量對應(yīng)于類的數(shù)量。卷積層對每個像素進(jìn)行分類,以確定圖像的上下文,包括目標(biāo)的位置。

集成學(xué)習(xí)將兩個或兩個以上相關(guān)分析模型的結(jié)果合成為單個。集成學(xué)習(xí)可以提高預(yù)測精度,減少泛化誤差。這樣就可以對圖像進(jìn)行精確的分類和分割。通過集成學(xué)習(xí)嘗試生成一組弱的基礎(chǔ)學(xué)習(xí)器,對圖像的部分進(jìn)行分類,并組合它們的輸出,而不是試圖創(chuàng)建一個單一的最優(yōu)學(xué)習(xí)者。

DeepLab使用DeepLab的一個主要動機是在幫助控制信號抽取的同時執(zhí)行圖像分割 —— 減少樣本的數(shù)量和網(wǎng)絡(luò)必須處理的數(shù)據(jù)量。另一個動機是啟用多尺度上下文特征學(xué)習(xí) —— 從不同尺度的圖像中聚合特征。DeepLab使用ImageNet預(yù)訓(xùn)練的ResNet進(jìn)行特征提取。DeepLab使用空洞卷積而不是規(guī)則的卷積。每個卷積的不同擴張率使ResNet塊能夠捕獲多尺度的上下文信息。DeepLab由三個部分組成:

Atrous convolutions— 使用一個因子,可以擴展或收縮卷積濾波器的視場。

ResNet— 微軟的深度卷積網(wǎng)絡(luò)(DCNN)。它提供了一個框架,可以在保持性能的同時訓(xùn)練數(shù)千個層。ResNet強大的表征能力促進(jìn)了計算機視覺應(yīng)用的發(fā)展,如物體檢測和人臉識別。

Atrous spatial pyramid pooling (ASPP)— 提供多尺度信息。它使用一組具有不同擴展率的復(fù)雜函數(shù)來捕獲大范圍的上下文。ASPP還使用全局平均池(GAP)來合并圖像級特征并添加全局上下文信息。

SegNet neural network一種基于深度編碼器和解碼器的架構(gòu),也稱為語義像素分割。它包括對輸入圖像進(jìn)行低維編碼,然后在解碼器中利用方向不變性能力恢復(fù)圖像。然后在解碼器端生成一個分割圖像。

圖像分割的應(yīng)用

圖像分割有助于確定目標(biāo)之間的關(guān)系,以及目標(biāo)在圖像中的上下文。應(yīng)用包括人臉識別、車牌識別和衛(wèi)星圖像分析。例如,零售和時尚等行業(yè)在基于圖像的搜索中使用了圖像分割。自動駕駛汽車用它來了解周圍的環(huán)境。

目標(biāo)檢測和人臉檢測

這些應(yīng)用包括識別數(shù)字圖像中特定類的目標(biāo)實例。語義對象可以分類成類,如人臉、汽車、建筑物或貓。

人臉檢測- 一種用于許多應(yīng)用的目標(biāo)檢測,包括數(shù)字相機的生物識別和自動對焦功能。算法檢測和驗證面部特征的存在。例如,眼睛在灰度圖像中顯示為谷地。

醫(yī)學(xué)影像- 從醫(yī)學(xué)影像中提取臨床相關(guān)信息。例如,放射學(xué)家可以使用機器學(xué)習(xí)來增強分析,通過將圖像分割成不同的器官、組織類型或疾病癥狀。這可以減少運行診斷測試所需的時間。

機器視覺- 捕捉和處理圖像,為設(shè)備提供操作指導(dǎo)的應(yīng)用。這包括工業(yè)和非工業(yè)的應(yīng)用。機器視覺系統(tǒng)使用專用攝像機中的數(shù)字傳感器,使計算機硬件和軟件能夠測量、處理和分析圖像。例如,檢測系統(tǒng)為汽水瓶拍照,然后根據(jù)合格 - 不合格標(biāo)準(zhǔn)分析圖像,以確定瓶子是否被正確地填充。

視頻監(jiān)控 — 視頻跟蹤和運動目標(biāo)跟蹤

這涉及到在視頻中定位移動物體。其用途包括安全和監(jiān)視、交通控制、人機交互和視頻編輯。

自動駕駛自動駕駛汽車必須能夠感知和理解他們的環(huán)境,以便安全駕駛。相關(guān)類別的對象包括其他車輛、建筑物和行人。語義分割使自動駕駛汽車能夠識別圖像中的哪些區(qū)域可以安全駕駛。

虹膜識別一種能識別復(fù)雜虹膜圖案的生物特征識別技術(shù)。它使用自動模式識別來分析人眼的視頻圖像。

人臉識別從視頻中識別個體。這項技術(shù)將從輸入圖像中選擇的面部特征與數(shù)據(jù)庫中的人臉進(jìn)行比較。

零售圖像識別

這個應(yīng)用讓零售商了解貨架上商品的布局。算法實時處理產(chǎn)品數(shù)據(jù),檢測貨架上是否有商品。如果有產(chǎn)品缺貨,他們可以找出原因,通知跟單員,并為供應(yīng)鏈的相應(yīng)部分推薦解決方案。

原文標(biāo)題:深度學(xué)習(xí)中的圖像分割:方法和應(yīng)用

文章出處:【微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

責(zé)任編輯:haq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 機器視覺
    +關(guān)注

    關(guān)注

    165

    文章

    4799

    瀏覽量

    126099
  • 機器學(xué)習(xí)
    +關(guān)注

    關(guān)注

    66

    文章

    8554

    瀏覽量

    136981

原文標(biāo)題:深度學(xué)習(xí)中的圖像分割:方法和應(yīng)用

文章出處:【微信號:vision263com,微信公眾號:新機器視覺】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    2025無線技術(shù)重要進(jìn)展回顧

    過去年里,無線創(chuàng)新領(lǐng)域雖未出現(xiàn)重大頭條新聞,但一系列穩(wěn)步推進(jìn)的進(jìn)步卻標(biāo)志著多項技術(shù)及其終端應(yīng)用迎來了轉(zhuǎn)折點。
    的頭像 發(fā)表于 01-19 10:34 ?2976次閱讀
    2025<b class='flag-5'>年</b>無線<b class='flag-5'>技術(shù)</b>重要<b class='flag-5'>進(jìn)展</b>回顧

    上海計算機視覺企業(yè)行學(xué)術(shù)沙龍走進(jìn)西井科技

    12月5日,由中國圖象圖形學(xué)學(xué)會青年工作委員會(下簡稱“青工委”)、上海市計算機學(xué)會計算機視覺專委會(下簡稱“專委會”)聯(lián)合主辦,上海西井科技股份有限公司、江蘇路街道商會承辦的“上海計算機
    的頭像 發(fā)表于 12-16 15:39 ?594次閱讀

    NVIDIA加速計算技術(shù)如何重塑科學(xué)系統(tǒng)

    過去計算能力從龐大的超級計算機逐漸延伸到我們口袋的芯片。
    的頭像 發(fā)表于 12-01 09:41 ?749次閱讀
    NVIDIA加速<b class='flag-5'>計算技術(shù)</b>如何重塑科學(xué)系統(tǒng)

    使用NVIDIA技術(shù)驅(qū)動的超級計算機助力開放科學(xué)研究

    五個備受矚目的 HPC 獎決賽入圍項目憑借 Alps、JUPITER 和 Perlmutter 超級計算機的支持在氣候建模、流體模擬等領(lǐng)域取得了重大突破。
    的頭像 發(fā)表于 11-25 11:17 ?832次閱讀

    量子競賽進(jìn)入深水區(qū):IBM加速2029容錯量子計算機目標(biāo)實現(xiàn)

    程碑式進(jìn)展不僅彰顯了IBM在量子計算領(lǐng)域的技術(shù)實力,更為全球量子計算產(chǎn)業(yè)注入了強勁動力。 QBI計劃:打造工業(yè)級容錯量子計算機的“驗證引擎”
    的頭像 發(fā)表于 11-16 00:28 ?7340次閱讀

    2025中國計算機大會DPU技術(shù)論壇成功舉辦

    近日,備受矚目的第22屆中國計算機大會(CNCC2025)在哈爾濱開幕。本屆大會注冊人數(shù)突破1.2萬人,匯聚了來自全球計算機領(lǐng)域的頂尖學(xué)者、產(chǎn)業(yè)領(lǐng)袖、青年學(xué)子及國際組織代表。大會以“數(shù)智賦能、無限可能”為主題,旨在深度探討數(shù)字智能技術(shù)
    的頭像 發(fā)表于 11-02 09:29 ?722次閱讀

    摩爾線程亮相2025中國計算機大會

    10月23日至25日,第二十二屆中國計算機大會(CNCC2025)在哈爾濱成功舉辦。大會以“數(shù)智賦能,無限可能”為主題,匯聚了來自全球計算機領(lǐng)域的頂尖學(xué)者、產(chǎn)業(yè)領(lǐng)袖、青年學(xué)子及國際組織代表,共同探討
    的頭像 發(fā)表于 10-27 17:46 ?1012次閱讀

    STM32計算機視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術(shù)解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強大的硬件集,可處理多種計算機視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?1304次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊<b class='flag-5'>技術(shù)</b>解析

    實現(xiàn)環(huán)境計算真正的瓶頸究竟在哪里

    20世紀(jì)90代初,計算機科學(xué)家Mark Weiser提出了“泛在計算”的理念,其核心思想是讓技術(shù)融入日常生活環(huán)境中[1]。盡管智能家居組件、傳感器網(wǎng)絡(luò)和智能設(shè)備
    的頭像 發(fā)表于 09-10 16:21 ?826次閱讀

    易控智駕榮獲計算機視覺頂會CVPR 2025認(rèn)可

    近日,2025國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?1224次閱讀

    自動化計算機經(jīng)過加固后有什么好處?

    -40℃的寒冷環(huán)境中運行?C和溫度達(dá)到85℃的灼熱環(huán)境,這要歸功于此類系統(tǒng)中使用的寬溫度組件和被動冷卻技術(shù)。2.抗沖擊和振動自動化計算機是工業(yè)級計算機,其設(shè)計和制造可
    的頭像 發(fā)表于 07-21 16:44 ?628次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機是一種專為工廠和工業(yè)環(huán)境設(shè)計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對惡劣環(huán)境下的自動化、制造和機器人操作。其特點包括無風(fēng)扇散熱技術(shù)、無電纜連接和防塵防水設(shè)計,使其在各種工業(yè)自動化場景中
    的頭像 發(fā)表于 07-10 16:36 ?757次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    NVIDIA驅(qū)動的現(xiàn)代超級計算機如何突破速度極限并推動科學(xué)發(fā)展

    現(xiàn)代高性能計算不僅使得更快的計算成為可能,它正驅(qū)動著 AI 系統(tǒng)解鎖更多領(lǐng)域的科學(xué)突破。 高性能計算經(jīng)歷了多次迭代,每一次都源于對技術(shù)的創(chuàng)造
    的頭像 發(fā)表于 06-26 19:39 ?1270次閱讀
    NVIDIA驅(qū)動的<b class='flag-5'>現(xiàn)代</b>超級<b class='flag-5'>計算機</b>如何突破速度極限并推動科學(xué)發(fā)展

    利用邊緣計算和工業(yè)計算機實現(xiàn)智能視頻分析

    IVA的好處、實際部署應(yīng)用程序以及工業(yè)計算機如何實現(xiàn)這些解決方案。一、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復(fù)雜的計算機視覺,通常與卷積神經(jīng)網(wǎng)
    的頭像 發(fā)表于 05-16 14:37 ?847次閱讀
    利用邊緣<b class='flag-5'>計算</b>和工業(yè)<b class='flag-5'>計算機</b>實現(xiàn)智能視頻分析

    一文帶你了解工業(yè)計算機尺寸

    工業(yè)計算機現(xiàn)代自動化、人工智能(AI)和邊緣計算的支柱。這些堅固耐用的系統(tǒng)旨在承受惡劣的環(huán)境,同時為關(guān)鍵應(yīng)用提供可靠的性能。然而,由于有這么多可用的外形尺寸,為您的工業(yè)計算機選擇合適
    的頭像 發(fā)表于 04-24 13:35 ?1054次閱讀
    一文帶你了解工業(yè)<b class='flag-5'>計算機</b>尺寸