chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌發(fā)明的由2D圖像生成3D圖像技術解析

我快閉嘴 ? 來源:愛集微 ? 作者:嘉德IPR ? 2020-12-24 12:55 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

谷歌發(fā)明的由2D圖像生成3D圖像的技術,利用3D估計神經(jīng)網(wǎng)絡圖像信息的補全以及預測,融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術對于三維建模以及工業(yè)應用都具有極大的指導意義。

谷歌研究人員制作的一個AI工具,可以把涂鴉變成奇怪的怪物。這款工具名為Chimera Painter,使用機器學習來根據(jù)用戶的粗略草圖生成圖像。

Chimera Painter背后的團隊在一篇博客文章中解釋了他們的方法和動機,稱他們的想法是創(chuàng)造一種 “畫筆,它的行為不像工具,而更像助手”。Chimera Painter只是一個原型,但如果這樣的軟件變得普遍,它可以減少創(chuàng)造高質(zhì)量藝術所需的時間。

這種圖像生成技術,其實在三維渲染方面有著非常廣泛的應用,其中最具有代表性的工作之一,就是由2D圖像生成3D圖像。我們知道,3D圖像相比于2D圖像多了深度信息這一個維度,但也就是這一個差別,導致了3D圖像相比于2D圖像所多出的信息不是一星半點。因此,倘若想要從2D圖像生成3D圖像,其難度之大可想而知。

為此,谷歌在18年10月18日申請了一項名為“通過渲染許多3D視圖來學習重構3D形狀”的發(fā)明專利(申請?zhí)枺?01880030823.5),申請人為谷歌有限責任公司。

根據(jù)該專利目前公開的資料,讓我們一起來看看這項從2D圖像到3D圖像的生成方法吧。

谷歌發(fā)明的由2D圖像生成3D圖像技術解析

該技術中,主要使用了3D估計器神經(jīng)網(wǎng)絡,如上圖,為使用3D估計器神經(jīng)網(wǎng)絡來估計圖像中描繪的面部的3D形狀和紋理,并基于估計的3D形狀和紋理生成替身的系統(tǒng)示意圖。用戶通過上傳面部圖像105,系統(tǒng)100可以對照片進行處理后生成替身115,這里所說的替身也就是用戶的3D畫像。

在具體的過程中,照片首先由面部識別引擎110進行處理,從而生成用戶的面部圖像特征112,該特征在3D估計神經(jīng)網(wǎng)絡中被處理,基于圖像特征估計照片中描繪的用戶面部的3D形狀和紋理,從而生成形狀紋理數(shù)據(jù)122。

最后,數(shù)據(jù)122被發(fā)送到3D渲染引擎130中,基于用戶獨特的面部形狀、紋理特征來生成用戶的3D畫像,并且為了做到更加真實,渲染引擎可以給出特定的視圖,視圖中融合了相機角度、光照以及視場的估計信息,可以讓生成的圖像質(zhì)量更加逼真。

谷歌發(fā)明的由2D圖像生成3D圖像技術解析

如上圖,為用于用戶3D渲染圖像生成的3D估計器神經(jīng)網(wǎng)絡220的系統(tǒng)框圖,整個系統(tǒng)的結構還是相當復雜的,從圖中我們可以看到這種神經(jīng)網(wǎng)絡是如何工作的。根據(jù)目前的技術來看,訓練3D估計器神經(jīng)網(wǎng)絡通常有兩個困難:第一,由3D對象的圖像和那些3D對象的3D形狀和紋理組成的訓練對通常是有限的并且難以獲得;第二,訓練3D估計器神經(jīng)網(wǎng)絡可能經(jīng)常導致3D估計器神經(jīng)網(wǎng)絡的網(wǎng)絡欺騙。

因此,該專利發(fā)明的整個網(wǎng)絡分為了監(jiān)督訓練回路以及無監(jiān)督訓練回路,通過二者相結合的方式,在完全訓練階段期間,僅利用無監(jiān)督訓練回路,從而允許估計神經(jīng)網(wǎng)絡輸出更快地收斂。

因為無監(jiān)督訓練回路可以在預訓練階段和完全訓練階段兩者期間使用,所以從無監(jiān)督訓練回路開始,在預訓練之后,完全訓練可以對大量迭代和大量樣本單獨利用無監(jiān)督訓練回路,來改進3D估計神經(jīng)網(wǎng)絡估計圖像中的對象的3D形狀和紋理的能力。

谷歌發(fā)明的由2D圖像生成3D圖像技術解析

最后,是這種無監(jiān)督訓練回路訓練的流程圖,系統(tǒng)首先需要獲取對象圖像的第一圖像特征,該特征就是上述所說用戶面部信息的原始數(shù)據(jù),其次,將這種第一圖像特征提供給3D估計器神經(jīng)網(wǎng)絡并獲取3D形狀和紋理。

根據(jù)這些形狀和紋理進行3D渲染,并從多個3D視圖中導出第二圖像特征,基于圖像特征的損失函數(shù)計算損失,以知道神經(jīng)網(wǎng)絡進行反向傳播以得到更加良好的效果以及減少圖像生成的損失。

以上就是谷歌發(fā)明的利用2D圖像生成3D圖像的專利技術,從2D到3D圖像的轉換過程中,由于2D圖像缺少了很多信息,因此該技術利用3D估計神經(jīng)網(wǎng)絡進行信息的補全以及預測,并融合了拍攝角度、光照等信息,讓生成的3D圖像看起來更加逼真,這種技術對于三維建模以及工業(yè)應用都具有極大的指導意義。

關于嘉德

深圳市嘉德知識產(chǎn)權服務有限公司由曾在華為等世界500強企業(yè)工作多年的知識產(chǎn)權專家、律師、專利代理人組成,熟悉中歐美知識產(chǎn)權法律理論和實務,在全球知識產(chǎn)權申請、布局、訴訟、許可談判、交易、運營、標準專利協(xié)同創(chuàng)造、專利池建設、展會知識產(chǎn)權、跨境電商知識產(chǎn)權、知識產(chǎn)權海關保護等方面擁有豐富的經(jīng)驗。
責任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 3D
    3D
    +關注

    關注

    9

    文章

    3011

    瀏覽量

    115065
  • 谷歌
    +關注

    關注

    27

    文章

    6254

    瀏覽量

    111412
  • 神經(jīng)網(wǎng)絡

    關注

    42

    文章

    4838

    瀏覽量

    107802
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    XS5018C:高性能2D/3D降噪ISP-TX 2K芯片電路圖資料

    HDcctv/CVBS, 支持多種制式 960H/720P/960P/1080P, ISP 最高支持 1080P@30FPS, 高性能 2D 降噪、 3D 降噪, 支持無極降幀。
    發(fā)表于 01-28 16:50 ?0次下載

    2D、2.5D3D封裝技術的區(qū)別與應用解析

    半導體封裝技術的發(fā)展始終遵循著摩爾定律的延伸與超越。當制程工藝逼近物理極限,先進封裝技術成為延續(xù)芯片性能提升的關鍵路徑。本文將從技術原理、典型結構和應用場景三個維度,系統(tǒng)剖析2D、2.
    的頭像 發(fā)表于 01-15 07:40 ?596次閱讀
    <b class='flag-5'>2D</b>、2.5<b class='flag-5'>D</b>與<b class='flag-5'>3D</b>封裝<b class='flag-5'>技術</b>的區(qū)別與應用<b class='flag-5'>解析</b>

    2025 3D機器視覺的發(fā)展趨勢

    迭代與應用拓展成為市場的主要推動力:·技術升級:視覺系統(tǒng)從單一任務的2D相機向多功能3D相機進化。過去用2D相機完成單一任務,如今用戶更愿意為能自動化多流程的
    的頭像 發(fā)表于 12-10 17:25 ?1275次閱讀
    2025 <b class='flag-5'>3D</b>機器視覺的發(fā)展趨勢

    Vitrox的v510i系列的3D AOI光學檢測設備

    V510i部署在SMT生產(chǎn)線的 貼片機之后、回流焊爐之前或之后 ,主要用于檢測貼裝好的電子元件是否存在缺陷。其核心任務是: 3D2D復合檢測 :同時利用3D輪廓信息和2D彩色
    的頭像 發(fā)表于 12-04 09:27 ?666次閱讀

    淺談2D封裝,2.5D封裝,3D封裝各有什么區(qū)別?

    集成電路封裝技術2D3D的演進,是一場從平面鋪開到垂直堆疊、從延遲到高效、從低密度到超高集成的革命。以下是這三者的詳細分析:
    的頭像 發(fā)表于 12-03 09:13 ?848次閱讀

    玩轉 KiCad 3D模型的使用

    時間都在與 2D 的焊盤、走線和絲印打交道。但一個完整的產(chǎn)品,終究是要走向物理世界的。元器件的高度、接插件的朝向、與外殼的配合,這些都是 2D 視圖難以表達的。 幸運的是,KiCad 提供了強大的 3D 可視化功能。它不僅能讓你
    的頭像 發(fā)表于 09-16 19:21 ?1.2w次閱讀
    玩轉 KiCad <b class='flag-5'>3D</b>模型的使用

    TMAG5170D-Q1 3D線性霍爾效應傳感器技術解析與應用指南

    ,每個芯片均可獨立配置,包含帶溫漂補償?shù)臏囟葯z測功能。該器件支持多種測量類型,包括1D線性、2D角度、3D操縱桿和磁性閾值交叉應用。
    的頭像 發(fā)表于 09-06 13:45 ?1279次閱讀
    TMAG5170<b class='flag-5'>D</b>-Q1 <b class='flag-5'>3D</b>線性霍爾效應傳感器<b class='flag-5'>技術</b><b class='flag-5'>解析</b>與應用指南

    iTOF技術,多樣化的3D視覺應用

    視覺傳感器對于機器信息獲取至關重要,正在從二維(2D)發(fā)展到三維(3D),在某些方面模仿并超越人類的視覺能力,從而推動創(chuàng)新應用。3D 視覺解決方案大致分為立體視覺、結構光和飛行時間 (TOF)
    發(fā)表于 09-05 07:24

    TechWiz LCD 3D應用:FFS仿真

    建模任務 堆棧結構 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結構,并生成3D結構 2.3 使用TechWiz LCD 3D進行各項參數(shù)計算 3
    的頭像 發(fā)表于 07-14 14:08 ?684次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應用:FFS仿真

    X-ray設備2D/3D檢測金屬材料及零部件裂紋異物的缺陷

    在高端制造領域,金屬材料及零部件的內(nèi)部質(zhì)量直接關系到產(chǎn)品性能與安全性。X-ray設備憑借其獨特的穿透成像能力,成為檢測裂紋、異物等缺陷的關鍵工具,而2D/3D檢測技術的結合,更將檢測精度與效率提升
    的頭像 發(fā)表于 06-27 17:23 ?1212次閱讀
    X-ray設備<b class='flag-5'>2D</b>/<b class='flag-5'>3D</b>檢測金屬材料及零部件裂紋異物的缺陷

    TechWiz LCD 3D應用:局部液晶配向

    我們所說的局部摩擦是指給液晶盒中不同區(qū)域(可自定義區(qū)域)進行不同的液晶配向,所以也可以稱之為局部掩膜、局部配向等。TechWiz LCD 2D和TechWiz LCD 3D都可以對液晶盒設置局部摩擦
    發(fā)表于 06-16 08:46

    利用NVIDIA 3D引導生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術突飛猛進,從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個
    的頭像 發(fā)表于 06-05 09:24 ?902次閱讀

    HT 可視化監(jiān)控頁面的 2D3D 連線效果

    的連線效果是如何實現(xiàn)的。我們將從 基本概念、實現(xiàn)步驟、關鍵代碼 多個維度,逐步剖析這個效果的具體實現(xiàn)過程,為你提供全面的知識和實踐指導。 盡管 2D3D 連線效果看起來復雜,其本質(zhì)仍然是二維節(jié)點之間的連接。只需要通過一些巧妙的
    的頭像 發(fā)表于 04-09 11:28 ?1528次閱讀
    HT 可視化監(jiān)控頁面的 <b class='flag-5'>2D</b> 與 <b class='flag-5'>3D</b> 連線效果

    安森美這款iToF傳感器讓3D深度測量技術輕松落地

    現(xiàn)代工業(yè)自動化的成功離不開3D視覺技術的強大功能。傳統(tǒng)的2D傳感器只能提供平面圖像,這使其在設備檢測等應用中的效能大打折扣。2D傳感器可以讀
    的頭像 發(fā)表于 03-28 14:31 ?1050次閱讀
    安森美這款iToF傳感器讓<b class='flag-5'>3D</b>深度測量<b class='flag-5'>技術</b>輕松落地

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個關鍵組件,它在端側幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成3D場景和3D標簽,具備重要的研究價值?,F(xiàn)有主流算法主要依賴于點云作為輸入
    的頭像 發(fā)表于 03-17 13:44 ?1238次閱讀
    一種以<b class='flag-5'>圖像</b>為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>