chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

為什么說三維重建才是計(jì)算機(jī)視覺的靈魂?

WpOh_rgznai100 ? 來源:YXQ ? 2019-07-02 14:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

編者按:在“全民計(jì)算機(jī)視覺”的今天,其發(fā)展歷程卻鮮少有人追溯。梳理研究的過去將能讓我們更好地探索未來。權(quán)龍教授為我們介紹了三維重建的歷史發(fā)展與應(yīng)用前景,也為大家在研究學(xué)習(xí)、職業(yè)選擇等方面給出了一些實(shí)用建議。

王井東:您的主要研究方向是三維重建,它的發(fā)展現(xiàn)狀和應(yīng)用前景如何,您為什么看好它?

權(quán)龍:說三維重建首先要從計(jì)算機(jī)視覺講起。計(jì)算機(jī)視覺包含兩個(gè)基本方向,物體識(shí)別和三維重建。圖像識(shí)別的突破性進(jìn)展源自于2012年卷積神經(jīng)網(wǎng)絡(luò)(CNN)的興起。在此之前,計(jì)算機(jī)視覺的核心研究方向是三維重建。因?yàn)樵诋?dāng)時(shí),對(duì)于圖像的特征提取主要是通過三維重建的方法來定義和實(shí)現(xiàn)的。自2012年以來,圖像的特征便逐漸由神經(jīng)網(wǎng)絡(luò)來自動(dòng)學(xué)習(xí)。

三維重建的應(yīng)用是很廣泛的,對(duì)于自動(dòng)駕駛、VR、AR等應(yīng)用領(lǐng)域應(yīng)用來講,三維重建是核心技術(shù),并且實(shí)時(shí)三維重建是必然趨勢(shì),因?yàn)槲覀兩钤谌S空間里,必須將虛擬世界恢復(fù)到三維,我們才可以和環(huán)境進(jìn)行交互。所以僅僅研究識(shí)別肯定是不夠的,計(jì)算機(jī)視覺下一步必須走向三維重建,并且把三維重建和識(shí)別融為一體。

古建筑修復(fù)與重建是三維重建的一個(gè)具有代表性的應(yīng)用,比如近期被燒毀的巴黎圣母院,如果通過三維模型(https://www.altizure.cn/project-model?pid=57f8d9bbe73f6760f10e916a)進(jìn)行數(shù)字重建,應(yīng)該能夠達(dá)到原汁原味還原其真實(shí)面貌的目的。目前在我們的三維重建項(xiàng)目中,名勝古跡的三維電子存檔是很重要的一部分。從表面上看,三維重建似乎沒有自動(dòng)駕駛那么復(fù)雜,其實(shí)它比自動(dòng)駕駛更難,因?yàn)樽詣?dòng)駕駛的三維感知是給車識(shí)別,而VR、AR中的三維重建場(chǎng)景是提供給人類感知的,所以對(duì)三維重建的結(jié)果要求非常高??傮w來講,三維重建是計(jì)算機(jī)視覺的靈魂。

權(quán)龍教授(左)和王井東博士(右)合影

王井東:三維重建在計(jì)算機(jī)視覺中確實(shí)非常重要,您可以帶大家回顧一下計(jì)算機(jī)視覺和三維重建的發(fā)展歷程嗎?

權(quán)龍:1987年在倫敦舉辦的第一屆國際計(jì)算機(jī)視覺大會(huì)ICCV可以作為現(xiàn)代計(jì)算機(jī)視覺研究的一個(gè)開端。之前很多人認(rèn)為做圖像處理就是計(jì)算機(jī)視覺,其實(shí)是二者是有區(qū)別的。

計(jì)算機(jī)視覺的目標(biāo)是對(duì)圖像進(jìn)行理解。準(zhǔn)確來講,計(jì)算機(jī)無法做到“理解”,只能做到“認(rèn)知”。我們的研究目的是從圖像中獲取視覺特征,有了視覺特征才能開展一系列的工作。因此回顧計(jì)算機(jī)視覺的發(fā)展歷程,根據(jù)算力條件的不同,我們可以看到一個(gè)特征提取的演化過程。

80年代,人人都在做以edge為主的邊緣提取,有了edge之后,再把它高層化后的線段元做簡(jiǎn)單的統(tǒng)計(jì)分類或者三維重建。Edge在數(shù)學(xué)上很容易定義,在定義了很多優(yōu)化準(zhǔn)則后,到1986年John Canny提出了Canny edge detection之后,這個(gè)研究方向就到頭了。

90年代,人們對(duì)三維重建愈加重視,當(dāng)時(shí)歐洲比美國要領(lǐng)先。幾何也追求特征提取,但一維的edge不適合幾何計(jì)算,幾何最本質(zhì)的元素是點(diǎn),所以很多工作開始圍繞點(diǎn)的特征去展開,對(duì)點(diǎn)的特征進(jìn)行描述,然后就可以把很多東西變成矢量的無序集合,再做統(tǒng)計(jì)。三維重建的終極目標(biāo)是用非標(biāo)定相機(jī)(uncalibrated camera)進(jìn)行重建。

1992年,Oliver Faugeras和Richard Hartley各自獨(dú)立地解決了非標(biāo)定相機(jī)兩張圖像下的三維重建問題,引入了基于七點(diǎn)算法的基礎(chǔ)矩陣(Fundamental Matrix)概念,這標(biāo)志著三維視覺的崛起。

1994年,我提出了六點(diǎn)算法(Invariants of six points and projective reconstruction from three uncalibrated images),解決了非標(biāo)定相機(jī)三張圖像下的三維重建,進(jìn)而在理論上徹底解決了多視重建的幾何問題(multi-view geometry)。這兩項(xiàng)工作共同奠定了三維重建的理論基礎(chǔ),對(duì)計(jì)算機(jī)視覺的發(fā)展起到了決定性的作用。

到了2012年,卷積神經(jīng)網(wǎng)絡(luò)(CNN)的出現(xiàn)對(duì)于特征提取和圖像識(shí)別都是一個(gè)顛覆性的飛躍,從而觸發(fā)了新一波人工智能高速發(fā)展的浪潮。事實(shí)上,卷積神經(jīng)網(wǎng)絡(luò)在1989年就應(yīng)用于圖像識(shí)別問題,它是今天所有卷積神經(jīng)網(wǎng)絡(luò)的鼻祖模型。

從誕生到2012年的十幾年之間,發(fā)生變化的并非卷積神經(jīng)網(wǎng)絡(luò)的架構(gòu),而是:(一)GPU的出現(xiàn)提升了計(jì)算力;(二)斯坦福大學(xué)教授李飛飛創(chuàng)建的ImageNet,她把上百萬張照片發(fā)到網(wǎng)絡(luò)上進(jìn)行標(biāo)注。這兩件事促成了卷積神經(jīng)網(wǎng)絡(luò)在2012年的復(fù)活。CNN的本質(zhì)其實(shí)是兩點(diǎn),第一點(diǎn)是提取特征,第二點(diǎn)是標(biāo)準(zhǔn)分類器。所以本質(zhì)上還是提取特征,只不過特征的表達(dá)能力比之前的手工定義要高得多。

所以從特征提取這條線索上看,雖然目前計(jì)算機(jī)視覺看似處于一輪新的熱潮,但事實(shí)上一直以來大家都在做同樣的事情,只不過在不同的階段,提取的特征和采用的方式有所不同。

王井東:現(xiàn)在主流的計(jì)算機(jī)視覺研究主要集中在歐洲、美國和中國。您認(rèn)為這三者的發(fā)展現(xiàn)狀和未來將如何?

權(quán)龍:確實(shí)是三足鼎立。上個(gè)世紀(jì)八九十年代,歐洲的計(jì)算機(jī)視覺發(fā)展迅速,研究人員在一定意義上把計(jì)算機(jī)視覺當(dāng)作一個(gè)應(yīng)用數(shù)學(xué)的問題。三維重建需要大量傳統(tǒng)數(shù)學(xué)知識(shí),這批研究人員都有非常好的應(yīng)用數(shù)學(xué)基礎(chǔ),那就用數(shù)學(xué)工具去解決這些視覺問題。

同期,美國計(jì)算機(jī)視覺的研究人員也非?;钴S,但主要集中在應(yīng)用領(lǐng)域,研究方向并不是非常清晰。隨著2012年這一波由卷積神經(jīng)網(wǎng)絡(luò)引發(fā)的人工智能的再次崛起,美國在應(yīng)用方面突飛猛進(jìn),歐洲依然保持扎實(shí)的基礎(chǔ)研究的風(fēng)格。后起之秀就是中國了,飛速發(fā)展的經(jīng)濟(jì)和創(chuàng)新氣氛使得計(jì)算機(jī)視覺的研究和商業(yè)應(yīng)用在極短的時(shí)間內(nèi)快速發(fā)展起來了。

王井東:您不僅在計(jì)算機(jī)視覺的研究上一如既往,也創(chuàng)立了專注三維重建的公司Altizure,那么關(guān)于學(xué)術(shù)和產(chǎn)業(yè)的選擇,您能為同學(xué)們分享一些經(jīng)驗(yàn)和建議嗎?

權(quán)龍:每個(gè)人都有不同的理想和發(fā)展方向,有的人可能更適合做應(yīng)用,有的人更適合做學(xué)術(shù)研究,這是因人而異的。沒必要每個(gè)人都要去做科研當(dāng)教授,也沒必要每個(gè)人都去創(chuàng)業(yè),只要能發(fā)揮自己的特長(zhǎng),選擇哪一條路都是非常好的。在這個(gè)多元化的社會(huì),大家都在從不同的角度推進(jìn)科技的進(jìn)步。

王井東:當(dāng)時(shí)是什么促使您從學(xué)術(shù)界“跨界”進(jìn)入產(chǎn)業(yè)界?

權(quán)龍:很簡(jiǎn)單,我一直在研究計(jì)算機(jī)視覺三維重建,以前的結(jié)果還不成熟,而到了某一個(gè)時(shí)機(jī)它終于能投入應(yīng)用了,那我們當(dāng)然要做應(yīng)用,這是研究的最高境界。研究就是這樣,可能在很長(zhǎng)時(shí)間里效果都不夠理想,那我們就要繼續(xù)研究,但當(dāng)它有了用武之地時(shí),我覺得投入實(shí)踐是順理成章的。

王井東:您認(rèn)為一個(gè)計(jì)算機(jī)視覺方向的學(xué)生應(yīng)該學(xué)好哪些知識(shí),才能做更好的研究?

權(quán)龍:我對(duì)所有的人的建議是,打好應(yīng)用數(shù)學(xué)和計(jì)算機(jī)的功底。應(yīng)用數(shù)學(xué)是理論基礎(chǔ),計(jì)算機(jī)是實(shí)現(xiàn)手段,兩方面的能力缺一不可。我不太贊同大學(xué)開設(shè)人工智能專業(yè)的做法,其實(shí)人工智能在一定意義上就是應(yīng)用數(shù)學(xué),尤其是卷積神經(jīng)網(wǎng)絡(luò),本質(zhì)上是數(shù)學(xué)優(yōu)化和統(tǒng)計(jì),你要有很好的應(yīng)用數(shù)學(xué)功底。

王井東:很多人說深度學(xué)習(xí)和計(jì)算機(jī)視覺到了瓶頸期,您認(rèn)為目前最大的問題是什么?您最期待的突破又在哪里?

權(quán)龍:“瓶頸期”不是一個(gè)合適的詞匯。因?yàn)樗举|(zhì)上是一個(gè)應(yīng)用科學(xué),現(xiàn)在有了卷積神經(jīng)網(wǎng)絡(luò)這樣強(qiáng)大的工具,所有的應(yīng)用方向都可以重新去摸索。剛才講到特征提取,提取完特征后去做具體的應(yīng)用,很多東西是可以繼續(xù)改進(jìn)的,差別在于進(jìn)步有多大。

卷積神經(jīng)網(wǎng)絡(luò)的特征提取已經(jīng)是一個(gè)很大的突破了,在這個(gè)基礎(chǔ)之上,我想會(huì)有一系列新的應(yīng)用出現(xiàn)。如果實(shí)在要說突破,那就是硬件和算力的突破。目前大熱的自動(dòng)駕駛領(lǐng)域?qū)⒑艽罅Χ鹊赝七M(jìn)算力的發(fā)展,VR、AR也是同樣。有朝一日,如果算力能夠有一個(gè)顯著的突破性進(jìn)展,很多無法想象的事情將會(huì)發(fā)生。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:港科大教授權(quán)龍:為什么三維重建才是計(jì)算機(jī)視覺的靈魂?| 對(duì)話

文章出處:【微信號(hào):rgznai100,微信公眾號(hào):rgznai100】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    一種基于多次觀測(cè)融合的可交互三維高斯場(chǎng)景重建框架

    計(jì)算機(jī)視覺和機(jī)器人領(lǐng)域,如何完整、真實(shí)地重建一個(gè)可交互的三維場(chǎng)景,一直是一個(gè)難題。傳統(tǒng)方法往往依賴復(fù)雜的多階段流程,比如先做分割,再進(jìn)行背景補(bǔ)全或修復(fù),或者需要對(duì)每個(gè)物體進(jìn)行密集掃描
    的頭像 發(fā)表于 09-29 11:12 ?230次閱讀
    一種基于多次觀測(cè)融合的可交互<b class='flag-5'>三維</b>高斯場(chǎng)景<b class='flag-5'>重建</b>框架

    導(dǎo)遠(yuǎn)科技收獲三維視覺技術(shù)客戶批量訂單

    導(dǎo)遠(yuǎn)科技近期成功獲得國內(nèi)知名三維視覺技術(shù)客戶的批量訂單。該客戶旗下三維掃描儀產(chǎn)品已在三維設(shè)計(jì)、工業(yè)檢測(cè)、文物保護(hù)、醫(yī)療健康等全球市場(chǎng)擁有卓越口碑。
    的頭像 發(fā)表于 09-03 17:16 ?529次閱讀

    易控智駕榮獲計(jì)算機(jī)視覺頂會(huì)CVPR 2025認(rèn)可

    近日,2025年國際計(jì)算機(jī)視覺與模式識(shí)別頂級(jí)會(huì)議(IEEE/CVF Conference on Computer Vision and Pattern Recognition,CVPR 2025)在美國田納西州納什爾召開。
    的頭像 發(fā)表于 07-29 16:54 ?839次閱讀

    航天宏圖全棧式3DGS實(shí)景三維重建系統(tǒng)解決方案

    表達(dá)的核心技術(shù),通過相機(jī)、傳感器等設(shè)備獲取物理空間數(shù)據(jù),并結(jié)合計(jì)算機(jī)視覺與圖形學(xué)算法,將二圖像轉(zhuǎn)換為三維模型。目前,主流的三維重建方法包括
    的頭像 發(fā)表于 06-27 09:28 ?836次閱讀
    航天宏圖全棧式3DGS實(shí)景<b class='flag-5'>三維重建</b>系統(tǒng)解決方案

    激光三維掃描技術(shù):無噴粉條件下高反光表面三維重建的光學(xué)原理與應(yīng)用

    高反光表面的三維重建是工業(yè)檢測(cè)、文化遺產(chǎn)保護(hù)等領(lǐng)域的關(guān)鍵技術(shù)瓶頸。傳統(tǒng)激光掃描依賴噴粉增強(qiáng)漫反射,但會(huì)對(duì)精密器件或文物造成不可逆損傷。本文通過融合結(jié)構(gòu)光調(diào)制、偏振分析及多視角協(xié)同技術(shù),構(gòu)建無噴粉測(cè)量
    的頭像 發(fā)表于 06-25 10:19 ?396次閱讀

    奧比中光亮相第四屆中國三維視覺大會(huì)

    近日,奧比中光攜最新技術(shù)成果亮相第四屆中國三維視覺大會(huì)(China3DV 2025)。作為國內(nèi)三維視覺領(lǐng)域最高規(guī)格的學(xué)術(shù)研討盛會(huì),本屆中國三維
    的頭像 發(fā)表于 04-15 09:18 ?749次閱讀

    使用DLP LightCrafter4500投影結(jié)構(gòu)光進(jìn)行三維重建遇到的疑問求解

    使用DLP LightCrafter4500 投影結(jié)構(gòu)光進(jìn)行三維重建,遇到以下問題: (1)投影自己的圖片,如何使投影出的圖片和原圖片的亮度一致。它是可以設(shè)定LED的亮度,我投影出來的圖片亮度很
    發(fā)表于 03-03 06:29

    三維測(cè)量在醫(yī)療領(lǐng)域的應(yīng)用

    技術(shù)可以對(duì)CT(計(jì)算機(jī)斷層掃描)、MRI(磁共振成像)等醫(yī)學(xué)影像進(jìn)行三維重建,生成病灶或器官的三維模型。 這些模型為醫(yī)生提供了更為直觀、立體的視覺信息,有助于醫(yī)生更準(zhǔn)確地了解患者的解剖
    的頭像 發(fā)表于 12-30 15:21 ?959次閱讀

    三維掃描在醫(yī)療領(lǐng)域的應(yīng)用

    形態(tài)等。 這些數(shù)據(jù)有助于醫(yī)生制定更精確的手術(shù)方案,預(yù)測(cè)手術(shù)風(fēng)險(xiǎn),從而提高手術(shù)成功率。 手術(shù)模擬 : 利用三維掃描技術(shù),醫(yī)生可以在計(jì)算機(jī)上進(jìn)行手術(shù)模擬,提前規(guī)劃手術(shù)步驟。 這有助于醫(yī)生更好地了解手術(shù)過程,預(yù)測(cè)可能出現(xiàn)的問
    的頭像 發(fā)表于 12-19 14:58 ?1930次閱讀

    三維掃描與建模的區(qū)別 三維掃描在工業(yè)中的應(yīng)用

    三維掃描與建模的區(qū)別 三維掃描與建模是兩種不同的技術(shù),它們?cè)诓僮鬟^程、輸出結(jié)果及應(yīng)用領(lǐng)域上存在顯著的區(qū)別。 操作過程 : 三維掃描 :主要通過激光或光學(xué)掃描設(shè)備,獲取實(shí)物表面的形狀、紋理信息等
    的頭像 發(fā)表于 12-19 14:55 ?1362次閱讀

    商湯科技運(yùn)用AI大模型實(shí)現(xiàn)實(shí)景三維重建

    近日,在北京建筑大學(xué)舉行的2024第八屆北京國際城市設(shè)計(jì)大會(huì)上,商湯科技把這些“活過來”的文物實(shí)景三維也帶到了現(xiàn)場(chǎng)。
    的頭像 發(fā)表于 11-25 16:49 ?1374次閱讀

    CASAIM與東北大學(xué)達(dá)成合作,三維掃描技術(shù)助力異形建材模型重建及尺寸精準(zhǔn)分析

    近期,CASAIM與東北大學(xué)攜手合作,以三維掃描技術(shù)為核心,為異形建材模型重建及尺寸精準(zhǔn)分析提供有力支持,共同推進(jìn)異形建材領(lǐng)域的應(yīng)用與發(fā)展。
    的頭像 發(fā)表于 11-13 15:11 ?589次閱讀
    CASAIM與東北大學(xué)達(dá)成合作,<b class='flag-5'>三維</b>掃描技術(shù)助力異形建材模型<b class='flag-5'>重建</b>及尺寸精準(zhǔn)分析

    CASAIM與邁普醫(yī)學(xué)達(dá)成合作,三維掃描技術(shù)助力醫(yī)療輔具實(shí)現(xiàn)高精度三維建模和偏差比對(duì)

    近期,CASAIM與廣州邁普再生醫(yī)學(xué)科技股份有限公司(簡(jiǎn)稱:邁普醫(yī)學(xué))合作,基于CT數(shù)據(jù)三維重建和設(shè)計(jì),在醫(yī)療輔具研究開發(fā)中實(shí)現(xiàn)高精度三維建模和偏差比對(duì),實(shí)現(xiàn)與缺損區(qū)域的精確匹配。
    的頭像 發(fā)表于 11-12 14:48 ?681次閱讀

    建筑物邊緣感知和邊緣融合的多視圖立體三維重建方法

    航空建筑深度估計(jì)是三維數(shù)字城市重建中的一項(xiàng)重要任務(wù),基于深度學(xué)習(xí)的多視圖立體(MVS)方法在該領(lǐng)域取得了較好的成果。目前的主要方法通過修改MVS 框架實(shí)現(xiàn)建筑物的深度估計(jì),缺乏對(duì)建筑物內(nèi)在結(jié)構(gòu)的考慮,易導(dǎo)致精度不足等問題。
    的頭像 發(fā)表于 11-07 10:16 ?1182次閱讀
    建筑物邊緣感知和邊緣融合的多視圖立體<b class='flag-5'>三維重建</b>方法

    【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

    一、什么是計(jì)算機(jī)視覺?計(jì)算機(jī)視覺,其實(shí)就是教機(jī)器怎么像我們?nèi)艘粯?,用攝像頭看看周圍的世界,然后理解它。比如,它能認(rèn)出這是個(gè)蘋果,或者那邊有
    的頭像 發(fā)表于 10-31 17:00 ?1588次閱讀
    【小白入門必看】一文讀懂深度學(xué)習(xí)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)及學(xué)習(xí)路線