chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

圖像標注在計算機視覺中起著至關重要的作用

Dbwd_Imgtec ? 來源:AI公園 ? 作者:AI公園 ? 2021-01-08 14:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

導讀

給大家介紹圖像標注的種類,應用場景,以及各種標注的優(yōu)缺點。

介紹

“如果沒有數(shù)據(jù)分析,公司就會變得既盲又聾,就像高速公路上的鹿一樣在網(wǎng)絡上游蕩。”

— Geoffrey Moore

每個數(shù)據(jù)科學任務都需要數(shù)據(jù)。具體地說,是輸入系統(tǒng)的干凈易懂的數(shù)據(jù)。說到圖像,計算機需要看到人類眼睛看到的東西。

例如,人類有識別和分類物體的能力。同樣,我們可以使用計算機視覺來解釋它接收到的視覺數(shù)據(jù)。這就是圖像標注的作用。

圖像標注在計算機視覺中起著至關重要的作用。圖像標注的目標是為和任務相關的、特定于任務的標簽。這可能包括基于文本的標簽(類),繪制在圖像上的標簽(即邊框),甚至是像素級的標簽。我們將在下面探討這一系列不同的標注技術。

人工智能需要的人工干預比我們想象的要多。為了準備高精度的訓練數(shù)據(jù),我們必須對圖像進行標注以得到正確的結果。數(shù)據(jù)注釋通常需要較高水平的領域知識,只有來自特定領域的專家才能提供這些知識。

需要標注的計算機視覺任務:

物體檢測

線/邊緣檢測

分割

姿態(tài)預測/關鍵點識別

圖像分類

目標檢測

進行目標檢測的技術主要有兩種,即2D和3D包圍框。 對于多邊形物體,可以使用多邊形方法。讓我們詳細討論一下。

2D 包圍框

在這種方法中,只需要在被檢測的物體周圍繪制矩形框。它們用于定義對象在圖像中的位置。邊框可以由矩形左上角的x、y軸坐標和右下角的x、y軸坐標來確定。

優(yōu)點和缺點:

標注起來快速和容易。

不能提供重要的信息,如物體的方向,這對許多應用來說是至關重要的。

包括不屬于物體一部分的背景像素。這可能會影響訓練。

3D 包圍框或者立方體

類似于2D邊框,除了它們還可以顯示目標的深度。這種標注是通過將二維圖像平面上的邊界框向后投影到三維長方體來實現(xiàn)的。它允許系統(tǒng)區(qū)分三維空間中的體積和位置等特征。

優(yōu)點和缺點:

解決了物體方向的問題。

當物體被遮擋,這種標注可以想象包圍框的維度,這可能會影響訓練。

這種標注也會包括背景像素,可能會影響訓練。

多邊形

有時,必須標記形狀不規(guī)則的物體。在這種情況下,使用多邊形。注釋時只需標記物體的邊緣,我們就能得到要檢測的物體的完美輪廓。

優(yōu)點和缺點:

多邊形標記的主要優(yōu)點是它消除了背景像素,并捕獲了物體的精確尺寸。

非常耗時,如果物體的形狀是復雜的,很難標注。

注:多邊形方法也用于物體形狀的分割。我們將在下面討論分割。

數(shù)據(jù)采集是ML冷啟動的問題。但是,即使你有了一個可行的數(shù)據(jù)集,構建和測試模型也是需要技巧的。

線/邊緣檢測(線和樣條)

在劃分邊界時,線和樣條是有用的。將區(qū)分一個區(qū)域和另一個區(qū)域的像素進行標注。

優(yōu)點和缺點:

這種方法的優(yōu)點是,連線上的像素不需要都是連續(xù)的。這樣在檢測有中斷的線或部分遮擋的物體是非常有用的。

手動標注圖像中的線是非常累人和費時的,特別是圖像中有很多的線的時候。

當物體碰巧是對齊的時候,可能會給出誤導的結果。

姿態(tài)預測 / 關鍵點識別

在許多計算機視覺應用中,神經(jīng)網(wǎng)絡常常需要識別輸入圖像中重要的感興趣的點。我們把這些點稱為地標或關鍵點。在這種應用中,我們希望神經(jīng)網(wǎng)絡輸出關鍵點的坐標(x, y)。

分割

圖像分割是將一幅圖像分割為多個部分的過程。圖像分割通常用于在像素級定位圖像中的物體和邊界。圖像分割方法有很多種。

語義分割:語義分割是一項機器學習任務,它需要像素級標注,其中圖像中的每個像素都被分配給一個類。每個像素都帶有語義意義。這主要用于環(huán)境背景非常重要的情況。

實例分割:實例分割是圖像分割的一種子類型,它在像素級別上標識圖像中每個物體的每個實例。實例分割和語義分割是圖像分割的兩種粒度級別之一。

全景分割:全景分割結合了語義分割和實例分割,所有像素都被分配一個類標簽,所有目標實例都被唯一地分割。

圖像分類

圖像分類不同于目標檢測。目標檢測的目的是識別和定位目標,而圖像分類的目的是識別和識別特定的目標類。這個用例的一個常見示例是對貓和狗的圖片進行分類。標注者必須為一只狗的圖像分配一個類標簽“dog”,對貓的圖像分配類標簽“cat”。

圖像標注的用例

在本節(jié)中,我們將討論如何使用圖像標注來幫助機器模型執(zhí)行特定行業(yè)的任務:

零售:

2D邊框可以用于標注產品的圖像,然后機器學習算法可以使用這些圖像來預測成本和其他屬性。圖像分類在這方面也有幫助。

醫(yī)學:

多邊形可用于在醫(yī)用x射線中標記器官,以便將它們輸入深度學習模型,以訓練x射線中的畸形或缺陷。這是圖像標注最重要的應用之一,需要醫(yī)學專家具有較高的領域知識。

自動駕駛汽車:

這是另一個重要的領域,圖像標注可以應用。利用語義分割對圖像中的每個像素進行標記,使車輛能夠感知到道路上的障礙物。這一領域的研究仍在進行中。

情緒檢測:

這是里程碑,可以用來檢測一個人的情緒(高興,悲傷,或自然)。這可以應用于評估受試者對特定內容的情緒反應。

制造行業(yè):

線和樣條可用于標注工廠的圖像線跟隨機器人工作。這可以幫助自動化生產過程,人力勞動可以最小化。

圖像標注的一些挑戰(zhàn)

時間復雜度

手工標注圖像需要很多時間,機器學習需要大量的數(shù)據(jù)集,需要大量的時間來有效地標注這些基于圖像的數(shù)據(jù)集。

計算復雜度

機器學習需要精確標注的數(shù)據(jù)來運行模型。如果標注者在給圖像做標注的時候,注入任何一種錯誤,都可能會影響到訓練,所有的努力都可能付諸東流。

領域知識

如前所述,圖像標注通常需要特定領域的高級領域知識。因此,我們需要知道該標注什么的注解者,以及該領域的專家。

責任編輯:lq

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 圖像
    +關注

    關注

    2

    文章

    1094

    瀏覽量

    41276
  • 計算機視覺
    +關注

    關注

    9

    文章

    1709

    瀏覽量

    46782
  • 圖像標注
    +關注

    關注

    0

    文章

    10

    瀏覽量

    2668

原文標題:圖像標注的基礎內容介紹

文章出處:【微信號:Imgtec,微信公眾號:Imagination Tech】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    虛擬內存對計算機性能的影響

    現(xiàn)代計算機系統(tǒng),內存管理是確保系統(tǒng)高效運行的關鍵因素之一。虛擬內存技術作為內存管理的核心組成部分,對于提升計算機性能和用戶體驗起著
    的頭像 發(fā)表于 12-04 09:17 ?3490次閱讀

    DAC和ADC對量子計算機升級的重要性解析?

    起著至關重要作用。因此,隨著量子計算機復雜性的提高,這些模擬元件將變得越來越重要。 DAC
    的頭像 發(fā)表于 11-14 09:20 ?798次閱讀
    DAC和ADC對量子<b class='flag-5'>計算機</b>升級的<b class='flag-5'>重要</b>性解析?

    計算機接口位于什么之間

    計算機接口是計算機硬件和軟件之間、計算機與外部設備之間以及計算機各部件之間傳輸數(shù)據(jù)、控制信息和狀態(tài)信息的硬件設備和軟件程序。它在計算機系統(tǒng)
    的頭像 發(fā)表于 10-14 14:02 ?1322次閱讀

    信號繼電器計算機系統(tǒng)的應用

    信號繼電器計算機系統(tǒng)的應用是一個重要且復雜的領域,它作為電氣控制的關鍵元件,計算機系統(tǒng)中發(fā)
    的頭像 發(fā)表于 09-27 16:29 ?942次閱讀

    計算機存儲系統(tǒng)的工作原理和功能

    計算機存儲系統(tǒng)作為計算機系統(tǒng)至關重要的組成部分,其原理和功能對于理解計算機的運行機制具有關鍵意義。以下將詳細闡述
    的頭像 發(fā)表于 09-26 16:42 ?2965次閱讀

    計算機的內存容量有什么作用

    計算機的內存容量,作為一個核心概念,計算機科學、信息技術以及日常使用扮演著至關重要的角色。它不僅直接關系到
    的頭像 發(fā)表于 09-10 14:47 ?2531次閱讀

    簡述計算機總線的分類

    計算機總線作為計算機系統(tǒng)連接各個功能部件的公共通信干線,其結構和分類對于理解計算機硬件系統(tǒng)的工作原理至關重要。以下是對
    的頭像 發(fā)表于 08-26 16:23 ?5186次閱讀

    存儲器微型計算機系統(tǒng)作用

    存儲器微型計算機系統(tǒng)扮演著至關重要的角色,它是計算機存儲和處理數(shù)據(jù)的核心部件。以下將詳細介紹存儲器
    的頭像 發(fā)表于 08-22 14:25 ?4210次閱讀

    計算機視覺有哪些優(yōu)缺點

    計算機視覺作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像和視頻的信息
    的頭像 發(fā)表于 08-14 09:49 ?2053次閱讀

    圖像處理器與計算機視覺有什么關系和區(qū)別

    圖像處理器與計算機視覺是兩個圖像處理領域緊密相連但又有所區(qū)別的概念。它們之間的關系和區(qū)別可以從多個維度進行探討。
    的頭像 發(fā)表于 08-14 09:36 ?1048次閱讀

    邊沿觸發(fā)器計算機中的應用

    邊沿觸發(fā)器計算機中的應用極為廣泛,它們作為數(shù)字電路的基本單元,對于實現(xiàn)計算機內部的時序控制、數(shù)據(jù)存儲與傳輸、以及復雜邏輯功能等方面起著
    的頭像 發(fā)表于 08-12 14:20 ?1295次閱讀

    三態(tài)緩沖器計算機中的應用

    三態(tài)緩沖器(Tri-state Buffer)計算機系統(tǒng)扮演著至關重要的角色,其應用廣泛且深入。三態(tài)緩沖器不僅具備基本的信號放大、去噪和波形整形功能,還能通過特定控制信號實現(xiàn)開關效
    的頭像 發(fā)表于 08-02 17:48 ?1871次閱讀

    計算機視覺圖像融合

    許多計算機視覺應用(例如機器人運動和醫(yī)學成像),需要將多個圖像的相關信息整合到單一圖像
    的頭像 發(fā)表于 08-01 08:28 ?1143次閱讀
    <b class='flag-5'>計算機</b><b class='flag-5'>視覺</b><b class='flag-5'>中</b>的<b class='flag-5'>圖像</b>融合

    DRAM計算機中的應用

    DRAM(Dynamic Random Access Memory,動態(tài)隨機存取存儲器)計算機系統(tǒng)扮演著至關重要的角色。它是一種半導體存儲器,用于存儲和快速訪問數(shù)據(jù),是
    的頭像 發(fā)表于 07-24 17:04 ?3018次閱讀

    計算機視覺技術的AI算法模型

    計算機視覺技術作為人工智能領域的一個重要分支,旨在使計算機能夠像人類一樣理解和解釋圖像及視頻
    的頭像 發(fā)表于 07-24 12:46 ?1817次閱讀