chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

簡單闡述一下計算機視覺的幾大任務!

電子工程師 ? 來源:CSDN - ViatorSun ? 作者:CSDN - ViatorSun ? 2021-03-24 15:16 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

計算機視覺的幾大任務:

目標跟蹤、圖像和視頻的生成

這里有一些比較常見的計算機視覺的應用,平時我們也會用到,包括多重的人臉識別,現(xiàn)在有些比較流行的照片應用,不知道大家平時會不會用到,包括比如像 Google photos,基本上傳一張照片上去,它就會對同樣的照片同樣的人物進行歸類,這個也是目前非常常見的一個應用。

中間那個叫 OCR,就是對文本進行掃描和識別,這個技術目前已經(jīng)比較成熟了。照片上這張是比較老的技術,當時我記得有公司做這個應用,有個掃描筆,掃描一下就變成文字,現(xiàn)在的話,基本上已經(jīng)不需要這么近的去掃描了,大家只要拍一張照片,如果這張照片是比較清晰的,經(jīng)過一兩秒鐘,一般我們現(xiàn)在算法就可以直接把它轉(zhuǎn)換成文字,而且準確率相當高,所以圖片上的這種 OCR 是一個過時的技術。

右下角是車牌檢測,開車的時候不小心壓到線了,闖紅燈了,收到一張罰單,這個怎么做到呢?也是計算機視覺的功勞,它們可以很容易的就去識別這個照片里的車牌,甚至車牌有一定的污損,經(jīng)過計算機視覺的增強都是可以把它給可以優(yōu)化回來的,所以這個技術也是比較實用的。

01. 圖像識別

車牌識別、人臉識別

02. 目標檢測

行人檢測、車輛檢測

03. 圖像分割

圖像語義分割、個體分割=檢測+分割

視頻分割:

04. 目標跟蹤

下面聊幾個比較有挑戰(zhàn)性的計算機視覺的任務。首先是目標跟蹤,目標跟蹤就是我們在連續(xù)的圖片或者視頻流里面,想要去追蹤某一個指定的對象,這個聽起來對人來說是一個非常容易的任務,大家只要目不轉(zhuǎn)睛盯著一個東西,沒有人能逃脫我們的視野。

實際上對機器來說,這是一個很有挑戰(zhàn)性的任務,為什么呢?因為機器在追蹤對象的時候,大部分會使用最原始的一些方法,采取一些對目標圖片進行形變的匹配,就是比較早期的計算機識別的方法,而這個方法在實際應用中間是非常難以實現(xiàn)的,為什么?因為需要跟蹤的對象,它由于角度、光照、遮擋的原因包括運動的時候,它會變得模糊,還有相似背景的干擾,所以我們很難利用模板匹配這種方法去追蹤這個對象。

一個人他面對你、背對你、側(cè)對你,可能景象完全不一樣,這種情況下,同樣一個模板是無法匹配的,所以說,很有潛力但也很有挑戰(zhàn)性,因為目前對象追蹤的算法完全沒有達到人臉識別的準確率,還有很多的人在不斷的努力去尋找新的方法去提升。

右邊也是一個例子,就是簡單的一個對我們頭部的追蹤,也是非常有挑戰(zhàn)性的,因為我們頭可以旋轉(zhuǎn),尺度也可能發(fā)生變化,用手去遮擋,這都給匹配造成很大的難度。

05. 多模態(tài)問題

后面還有一些比較有挑戰(zhàn)性的計算機視覺任務,我們歸類把它們叫做多模態(tài)問題,其中包括 VQA,這是什么意思?這個就是說給定一張圖片,我們可以任意的去問它一些問題,一般是比較直接的一些問題,Who、Where、How,類似這些問題,或者這個多模態(tài)的模型,要能夠根據(jù)圖片的真實信息去回答我們的問題。

舉個例子,比如底下圖片中間有兩張是小朋友的,計算機視覺看到這張圖片的時候它要把其中所有的對象全部分割出來,要了解每個對象是什么,知道它們其中的聯(lián)系。比如左邊的小朋友在喝奶,如果把他的奶瓶分出來以后,它必須要知道這個小朋友在喝奶,這個關系也是很重要的。

屏幕上的問題是“Where is the child sitting?”,這個問題的復雜度就比單純的只是解析圖像要復雜的多。他需要把里面所有信息的全部解析出來,并且能準確的去關聯(lián)他們的關系,同時這個模型還要能夠理解我們問這個問題到底是個什么用意,他要知道問的是位置,而且這個對象是這個小孩,所以這個是包含著計算機視覺加上自然語言識別,兩種這種技術的相結(jié)合,所以才叫多模態(tài)問題,模態(tài)指的是像語音,文字,圖像,語音,這種幾種模態(tài)放在一起就叫多模態(tài)問題。

右邊一個例子是 Caption Generation,現(xiàn)在非常流行的研究的領域,給定一張圖片,然后對圖片里面的東西進行描述。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人臉識別
    +關注

    關注

    77

    文章

    4118

    瀏覽量

    87807
  • OCR
    OCR
    +關注

    關注

    0

    文章

    171

    瀏覽量

    17054
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Amphenol Rugged SOM:超緊湊型嵌入式計算機模塊的卓越之選

    了解一下這款為惡劣環(huán)境量身打造的超緊湊型嵌入式計算機模塊。 文件下載: Amphenol Aerospace 堅固型片上模塊(SOM).pdf 產(chǎn)品概述 Amphenol Rugged SOM 專為
    的頭像 發(fā)表于 12-10 14:15 ?103次閱讀

    使用代理式AI激活傳統(tǒng)計算機視覺系統(tǒng)的三種方法

    當前的計算機視覺系統(tǒng)擅長于識別物理空間與流程中的事件,卻難以詮釋場景細節(jié)及其意義,也無法推理后續(xù)可能發(fā)生的情況。
    的頭像 發(fā)表于 12-01 09:44 ?364次閱讀

    STM32計算機視覺開發(fā)套件:B-CAMS-IMX攝像頭模塊技術解析

    STMicroelectronics用于 STM32開發(fā)板的B-CAMS-IMX攝像頭模塊提供強大的硬件集,可處理多種計算機視覺場景和用例。該模塊具有高分辨率500萬像素IMX335LQN
    的頭像 發(fā)表于 10-20 09:46 ?767次閱讀
    STM32<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>開發(fā)套件:B-CAMS-IMX攝像頭模塊技術解析

    【作品合集】賽昉科技VisionFive 2單板計算機開發(fā)板測評

    +點燈 作者:jf_43382582【VisionFive 2單板計算機試用體驗】coremark跑分測試【VisionFive 2單板計算機試用體驗】VisionFive 2個霸氣的游戲機
    發(fā)表于 09-04 09:08

    易控智駕榮獲計算機視覺頂會CVPR 2025認可

    近日,2025年國際計算機視覺與模式識別頂級會議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什維爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?997次閱讀

    自動化計算機經(jīng)過加固后有什么好處?

    讓我們討論一下部署堅固的自動化計算機些好處。1.溫度范圍寬自動化計算機經(jīng)過工程設計,配備了支持寬溫度范圍的組件,使自動化計算解決方案能夠
    的頭像 發(fā)表于 07-21 16:44 ?433次閱讀
    自動化<b class='flag-5'>計算機</b>經(jīng)過加固后有什么好處?

    自動化計算機的功能與用途

    工業(yè)自動化是指利用自動化計算機來控制工業(yè)環(huán)境中的流程、機器人和機械,以制造產(chǎn)品或其部件。工業(yè)自動化的目的是提高生產(chǎn)率、增加靈活性,并提升制造過程的質(zhì)量。工業(yè)自動化在汽車制造中體現(xiàn)得最為明顯,其中許多任務
    的頭像 發(fā)表于 07-15 16:32 ?539次閱讀
    自動化<b class='flag-5'>計算機</b>的功能與用途

    工業(yè)計算機與商用計算機的區(qū)別有哪些

    工業(yè)計算機種專為工廠和工業(yè)環(huán)境設計的計算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應對惡劣環(huán)境的自動化、制造和機器人操作。其特點包括無風扇散熱技術、無電纜連接和防塵防水設計,使其在各種工業(yè)
    的頭像 發(fā)表于 07-10 16:36 ?529次閱讀
    工業(yè)<b class='flag-5'>計算機</b>與商用<b class='flag-5'>計算機</b>的區(qū)別有哪些

    工業(yè)計算機如何設計用于沖擊和振動

    工業(yè)計算機是為挑戰(zhàn)消費級系統(tǒng)耐用性的環(huán)境而構(gòu)建的。在制造業(yè)、運輸業(yè)、國防和采礦業(yè)等領域,計算機面臨著持續(xù)的沖擊、振動和其他物理壓力。設計這些系統(tǒng)以在這種條件保持可靠需要卓越的工程和創(chuàng)新技術。本文
    的頭像 發(fā)表于 05-19 15:27 ?367次閱讀
    工業(yè)<b class='flag-5'>計算機</b>如何設計用于沖擊和振動

    利用邊緣計算和工業(yè)計算機實現(xiàn)智能視頻分析

    IVA的好處、實際部署應用程序以及工業(yè)計算機如何實現(xiàn)這些解決方案。、什么是智能視頻分析(IVA)?智能視頻分析(IVA)集成了復雜的計算機視覺,通常與卷積神經(jīng)網(wǎng)
    的頭像 發(fā)表于 05-16 14:37 ?647次閱讀
    利用邊緣<b class='flag-5'>計算</b>和工業(yè)<b class='flag-5'>計算機</b>實現(xiàn)智能視頻分析

    文帶你了解工業(yè)計算機尺寸

    項艱巨的任務。本博客將指導您了解關鍵的工業(yè)計算機尺寸、使用案例。關鍵工業(yè)計算機外形要素及其使用案例、工業(yè)微型PC尺寸范圍:寬度:100毫
    的頭像 發(fā)表于 04-24 13:35 ?801次閱讀
    <b class='flag-5'>一</b>文帶你了解工業(yè)<b class='flag-5'>計算機</b>尺寸

    計算機網(wǎng)絡入門指南

    計算機網(wǎng)絡是指將地理位置不同且具有獨立功能的多臺計算機及其外部設備,通過通信線路連接起來,在網(wǎng)絡操作系統(tǒng)、網(wǎng)絡管理軟件及網(wǎng)絡通信協(xié)議的管理和協(xié)調(diào)下,實現(xiàn)資源共享和信息傳遞的計算機系統(tǒng)。
    的頭像 發(fā)表于 04-22 14:29 ?1869次閱讀
    <b class='flag-5'>計算機</b>網(wǎng)絡入門指南

    Arm KleidiCV與OpenCV集成助力移動端計算機視覺性能優(yōu)化

    生成式及多模態(tài)人工智能 (AI) 工作負載的廣泛增長,推動了對計算機視覺 (CV) 技術日益高漲的需求。此類技術能夠解釋并分析源自現(xiàn)實世界的視覺信息,并可應用于人臉識別、照片分類、濾鏡處理及增強現(xiàn)實
    的頭像 發(fā)表于 02-24 10:15 ?892次閱讀

    AR和VR中的計算機視覺

    ):計算機視覺引領混合現(xiàn)實體驗增強現(xiàn)實(AR)和虛擬現(xiàn)實(VR)正在徹底改變我們與外部世界的互動方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?2171次閱讀
    AR和VR中的<b class='flag-5'>計算機</b><b class='flag-5'>視覺</b>

    云端超級計算機使用教程

    云端超級計算機種基于云計算的高性能計算服務,它將大量計算資源和存儲資源集中在起,通過網(wǎng)絡向
    的頭像 發(fā)表于 12-17 10:19 ?984次閱讀