chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

新型計(jì)算機(jī)視覺框架:GQN可以腦補(bǔ)出環(huán)境的另外部分

0wvm_ARchan_TT ? 來源:未知 ? 作者:胡薇 ? 2018-06-21 14:29 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

現(xiàn)在的計(jì)算機(jī)視覺系統(tǒng)大多基于深度神經(jīng)網(wǎng)絡(luò),它們可以通過學(xué)習(xí)大量數(shù)據(jù)集從而得到將圖像投影到普通的場(chǎng)景描述的功能,簡(jiǎn)單說就是見得多了習(xí)慣了。

然而和這種神經(jīng)網(wǎng)絡(luò)相比,我們的大腦顯然更加智能,可以利用先前的知識(shí)來推理,并做出遠(yuǎn)遠(yuǎn)超出看到的物品的推論。例如,如果看到桌子的三條腿,那么可以推斷出第四條腿的存在和其位置,基本與實(shí)際情況相同;即使看不到房間里的所有東西,你也可以畫出它的布局、想象它的外觀。嬰兒在八九個(gè)月時(shí)就可以理解“形狀恒常性”的存在,即使用布蓋住他面前的玩具,他也可以腦補(bǔ)出布下面玩具的樣子,而這,恰是深度神經(jīng)網(wǎng)絡(luò)不能識(shí)別的。

最近,通過模仿人大腦對(duì)環(huán)境的處理方法,DeepMind提出了一種新型計(jì)算機(jī)視覺框架:GQN (the Generative Query Network),這個(gè)框架實(shí)現(xiàn)了前面提到的功能,可以腦補(bǔ)出環(huán)境的另外部分,還可以將2D圖片渲染至3D。

GQN模型由兩部分組成:表示網(wǎng)絡(luò)和世代網(wǎng)絡(luò)。表示網(wǎng)絡(luò)將察結(jié)果輸入并對(duì)基礎(chǔ)場(chǎng)景產(chǎn)生描述性質(zhì)的的矢量表示,然后世代網(wǎng)絡(luò)從以前未觀察過的角度預(yù)測(cè)場(chǎng)景的表現(xiàn)。

表示網(wǎng)絡(luò)通過以分布式表示捕獲對(duì)象位置,顏色和房間布局等元素來實(shí)現(xiàn)準(zhǔn)確描述場(chǎng)景的真實(shí)布局。該網(wǎng)絡(luò)能夠以高度壓縮和抽象的方式描述場(chǎng)景,并將其留給世代網(wǎng)絡(luò),從而可以在必要時(shí)加入詳細(xì)信息。

世代網(wǎng)絡(luò)就像是一個(gè)近似的3D渲染器,它可以以非常精確的方式從新視角預(yù)測(cè)以前未觀測(cè)到的場(chǎng)景。當(dāng)給出場(chǎng)景和新的攝像機(jī)視點(diǎn)時(shí),無(wú)需事先規(guī)定透視法,遮擋法或照明法,它就可以生成清晰的圖像。

那么,GQN的可行性如何?

為了評(píng)估該框架的可行性,研究人員在模擬的3D環(huán)境中進(jìn)行了一系列嘗試。在第一組實(shí)驗(yàn)中,研究人員采用了包含各種對(duì)象的方形房間中的場(chǎng)景,墻面紋理、物體和燈的形狀、位置和顏色都是隨機(jī)的,以此有效地實(shí)現(xiàn)無(wú)限數(shù)量的總場(chǎng)景配置;隨后,研究人員使用有限數(shù)據(jù)集來訓(xùn)練和測(cè)試模型。訓(xùn)練結(jié)束后,GQN通過觀察一個(gè)先前未學(xué)習(xí)的測(cè)試場(chǎng)景的圖像來計(jì)算其場(chǎng)景表示,隨后的結(jié)果顯示,發(fā)生器在視點(diǎn)處的預(yù)測(cè)是高度準(zhǔn)確的,大部分與地面事實(shí)并沒有區(qū)別。

在這個(gè)實(shí)驗(yàn)中,GQN不可能通過隨機(jī)的方式準(zhǔn)確預(yù)測(cè)結(jié)果,它只能通過在場(chǎng)景感知和編碼物體的數(shù)量、位置、顏色,還有墻壁的顏色以及光源的間接觀察位置的方式來學(xué)習(xí)。與傳統(tǒng)的神經(jīng)網(wǎng)絡(luò)學(xué)習(xí)不同,GQN學(xué)習(xí)如何從圖像中進(jìn)行推理,而不需要對(duì)場(chǎng)景內(nèi)容進(jìn)行任何明確的人為標(biāo)注。實(shí)驗(yàn)過程中,當(dāng)場(chǎng)景的內(nèi)容重度遮擋的情況時(shí),預(yù)測(cè)模型就會(huì)出現(xiàn)不確定的情況,這種情況反映在最終結(jié)果的的變化性上。

隨后研究人員還采用了更復(fù)雜,程序化的迷宮環(huán)境來測(cè)試GQN的縮放屬性。迷宮由通過走廊連接的多個(gè)房間組成,不同場(chǎng)景中迷宮的布局和墻壁的顏色都是隨機(jī)的。在這個(gè)實(shí)驗(yàn)中,任何一次觀察都會(huì)提供有關(guān)當(dāng)前迷宮的少量信息。在進(jìn)行多次識(shí)別觀測(cè)后, GQN已經(jīng)可以在新的攝像機(jī)視點(diǎn)做出對(duì)迷宮環(huán)境正確的預(yù)測(cè);在進(jìn)一步的訓(xùn)練中,模型甚至還可以高度準(zhǔn)確地預(yù)測(cè)迷宮自上而下的視圖。

在這個(gè)實(shí)驗(yàn)中,預(yù)測(cè)模型的不確定性隨著觀測(cè)數(shù)量的增大而降低,經(jīng)過大約五次觀察后,GQN的不確定性幾乎完全消失。

現(xiàn)在的GQN還只能在實(shí)驗(yàn)室實(shí)現(xiàn),主要是因?yàn)樾枰芸胤治觥⒄鎸?shí)數(shù)據(jù)集的可用性有限、不足以生成復(fù)雜的模型等原因,但它的確可以處理視覺的遮擋、場(chǎng)景的組合等問題。隨著新的數(shù)據(jù)集可用化和建模能力的增強(qiáng),GQN也會(huì)逐漸實(shí)現(xiàn)應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴

原文標(biāo)題:計(jì)算機(jī)視覺也可以腦補(bǔ)了?

文章出處:【微信號(hào):ARchan_TT,微信公眾號(hào):AR醬】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    工業(yè)計(jì)算機(jī)與商用計(jì)算機(jī)的區(qū)別有哪些

    工業(yè)計(jì)算機(jī)是一種專為工廠和工業(yè)環(huán)境設(shè)計(jì)的計(jì)算系統(tǒng),具有高可靠性和穩(wěn)定性,能夠應(yīng)對(duì)惡劣環(huán)境下的自動(dòng)化、制造和機(jī)器人操作。其特點(diǎn)包括無(wú)風(fēng)扇散熱技術(shù)、無(wú)電纜連接和防塵防水設(shè)計(jì),使其在各種工業(yè)
    的頭像 發(fā)表于 07-10 16:36 ?130次閱讀
    工業(yè)<b class='flag-5'>計(jì)算機(jī)</b>與商用<b class='flag-5'>計(jì)算機(jī)</b>的區(qū)別有哪些

    AR和VR中的計(jì)算機(jī)視覺

    ):計(jì)算機(jī)視覺引領(lǐng)混合現(xiàn)實(shí)體驗(yàn)增強(qiáng)現(xiàn)實(shí)(AR)和虛擬現(xiàn)實(shí)(VR)正在徹底改變我們與外部世界的互動(dòng)方式。即便是在引人入勝的沉浸式
    的頭像 發(fā)表于 02-08 14:29 ?1535次閱讀
    AR和VR中的<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>

    工業(yè)中使用哪種計(jì)算機(jī)?

    在工業(yè)環(huán)境中,工控機(jī)被廣泛使用。這些計(jì)算機(jī)的設(shè)計(jì)可承受極端溫度、灰塵和振動(dòng)等惡劣條件。它們比標(biāo)準(zhǔn)消費(fèi)類計(jì)算機(jī)更耐用、更可靠。工業(yè)計(jì)算機(jī)可控制機(jī)器、監(jiān)控流程并實(shí)時(shí)收集數(shù)據(jù)。其堅(jiān)固的結(jié)構(gòu)和
    的頭像 發(fā)表于 11-29 14:07 ?698次閱讀
    工業(yè)中使用哪種<b class='flag-5'>計(jì)算機(jī)</b>?

    量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別

    ? 本文介紹了量子計(jì)算機(jī)與普通計(jì)算機(jī)工作原理的區(qū)別。 量子計(jì)算是一個(gè)新興的研究領(lǐng)域,科學(xué)家們利用量子力學(xué),制造出具有革命性能力的計(jì)算機(jī)。雖然現(xiàn)在的量子
    的頭像 發(fā)表于 11-24 11:00 ?1455次閱讀
    量子<b class='flag-5'>計(jì)算機(jī)</b>與普通<b class='flag-5'>計(jì)算機(jī)</b>工作原理的區(qū)別

    【小白入門必看】一文讀懂深度學(xué)習(xí)計(jì)算機(jī)視覺技術(shù)及學(xué)習(xí)路線

    一、什么是計(jì)算機(jī)視覺?計(jì)算機(jī)視覺,其實(shí)就是教機(jī)器怎么像我們?nèi)艘粯樱脭z像頭看看周圍的世界,然后理解它。比如說,它能認(rèn)出這是個(gè)蘋果,或者那邊有輛車。除此之外,還能把拍到的照片或者視頻轉(zhuǎn)換
    的頭像 發(fā)表于 10-31 17:00 ?1214次閱讀
    【小白入門必看】一文讀懂深度學(xué)習(xí)<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>技術(shù)及學(xué)習(xí)路線

    計(jì)算機(jī)接口位于什么之間

    地傳輸。計(jì)算機(jī)接口可以分為內(nèi)部接口和外部接口兩大類。 內(nèi)部接口位于計(jì)算機(jī)內(nèi)部各個(gè)部件之間,如CPU、內(nèi)存、主板、硬盤、顯卡等。外部接口則位于
    的頭像 發(fā)表于 10-14 14:02 ?1295次閱讀

    計(jì)算機(jī)存儲(chǔ)系統(tǒng)的工作原理和功能

    計(jì)算機(jī)存儲(chǔ)系統(tǒng)作為計(jì)算機(jī)系統(tǒng)中至關(guān)重要的組成部分,其原理和功能對(duì)于理解計(jì)算機(jī)的運(yùn)行機(jī)制具有關(guān)鍵意義。以下將詳細(xì)闡述計(jì)算機(jī)存儲(chǔ)系統(tǒng)的原理和功能
    的頭像 發(fā)表于 09-26 16:42 ?2927次閱讀

    計(jì)算機(jī)存儲(chǔ)器的分類及其區(qū)別

    計(jì)算機(jī)存儲(chǔ)器是計(jì)算機(jī)系統(tǒng)中不可或缺的重要部分,用于存放程序和數(shù)據(jù)。隨著科技的進(jìn)步,存儲(chǔ)器的種類越來越多,功能和性能也日益豐富。一般來說,計(jì)算機(jī)存儲(chǔ)器
    的頭像 發(fā)表于 09-05 10:40 ?3955次閱讀

    計(jì)算機(jī)視覺有哪些優(yōu)缺點(diǎn)

    計(jì)算機(jī)視覺作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像和視頻中的信息。這一技術(shù)的發(fā)展不僅推動(dòng)了多個(gè)行業(yè)的變革,也帶來了諸多優(yōu)勢(shì),但同時(shí)也伴隨著一些挑戰(zhàn)和局限性。以下是對(duì)
    的頭像 發(fā)表于 08-14 09:49 ?2022次閱讀

    圖像處理器與計(jì)算機(jī)視覺有什么關(guān)系和區(qū)別

    圖像處理器與計(jì)算機(jī)視覺是兩個(gè)在圖像處理領(lǐng)域緊密相連但又有所區(qū)別的概念。它們之間的關(guān)系和區(qū)別可以從多個(gè)維度進(jìn)行探討。
    的頭像 發(fā)表于 08-14 09:36 ?1039次閱讀

    計(jì)算機(jī)視覺中的圖像融合

    在許多計(jì)算機(jī)視覺應(yīng)用中(例如機(jī)器人運(yùn)動(dòng)和醫(yī)學(xué)成像),需要將多個(gè)圖像的相關(guān)信息整合到單一圖像中。這種圖像融合可以提供更高的可靠性、準(zhǔn)確性和數(shù)據(jù)質(zhì)量。多視圖融合可以提高圖像分辨率,并恢復(fù)場(chǎng)
    的頭像 發(fā)表于 08-01 08:28 ?1128次閱讀
    <b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>中的圖像融合

    地平線科研論文入選國(guó)際計(jì)算機(jī)視覺頂會(huì)ECCV 2024

    近日,地平線兩篇論文入選國(guó)際計(jì)算機(jī)視覺頂會(huì)ECCV 2024,自動(dòng)駕駛算法技術(shù)再有新突破。
    的頭像 發(fā)表于 07-27 11:10 ?1457次閱讀
    地平線科研論文入選國(guó)際<b class='flag-5'>計(jì)算機(jī)</b><b class='flag-5'>視覺</b>頂會(huì)ECCV 2024

    DRAM在計(jì)算機(jī)中的應(yīng)用

    DRAM(Dynamic Random Access Memory,動(dòng)態(tài)隨機(jī)存取存儲(chǔ)器)在計(jì)算機(jī)系統(tǒng)中扮演著至關(guān)重要的角色。它是一種半導(dǎo)體存儲(chǔ)器,用于存儲(chǔ)和快速訪問數(shù)據(jù),是計(jì)算機(jī)主內(nèi)存的主要組成部分。以下是對(duì)DRAM在
    的頭像 發(fā)表于 07-24 17:04 ?2967次閱讀

    計(jì)算機(jī)視覺技術(shù)的AI算法模型

    計(jì)算機(jī)視覺技術(shù)作為人工智能領(lǐng)域的一個(gè)重要分支,旨在使計(jì)算機(jī)能夠像人類一樣理解和解釋圖像及視頻中的信息。為了實(shí)現(xiàn)這一目標(biāo),計(jì)算機(jī)視覺技術(shù)依賴于
    的頭像 發(fā)表于 07-24 12:46 ?1784次閱讀

    機(jī)器視覺計(jì)算機(jī)視覺有什么區(qū)別

    機(jī)器視覺計(jì)算機(jī)視覺是兩個(gè)密切相關(guān)但又有所區(qū)別的概念。 一、定義 機(jī)器視覺 機(jī)器視覺,又稱為計(jì)算機(jī)
    的頭像 發(fā)表于 07-16 10:23 ?1152次閱讀