chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

人工智能系統(tǒng)VON,生成最逼真3D圖像

DPVg_AI_era ? 來源:lq ? 2018-12-07 09:28 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

人工智能合成的3D物體模型不夠逼真?谷歌團隊最近開發(fā)了一個AI系統(tǒng)——視覺對象網(wǎng)絡(VON),不僅生成的圖像比當前最先進的方法還要逼真,而且還可以做一系列3D操作。

合成現(xiàn)實3D物體模型的人工智能,看上去并沒有那么遙不可及。

在2018年蒙特利爾NeurIPS大會上,麻省理工學院計算機科學與人工智能實驗室(MIT CSAIL)和谷歌的研究人員發(fā)表了一篇論文,描述了一個能夠生成具有逼真紋理的人工智能系統(tǒng)。

論文名稱:

Visual Object Networks: Image Generation with Disentangled 3D Representation

論文地址:

https://papers.nips.cc/paper/7297-visual-object-networks-image-generation-with-disentangled-3d-representations.pdf

人工智能系統(tǒng)VON,生成最逼真3D圖像

該人工智能系統(tǒng)——視覺對象網(wǎng)絡(Visual Object Networks,VON),不僅生成的圖像比當前最先進的方法還要逼真,還可以進行形狀和紋理編輯、視角轉(zhuǎn)換以及其它3D調(diào)整。

研究人員寫到:“現(xiàn)代深層生成模型學會了合成較為逼真的圖像。大多數(shù)計算模型只專注于生成2D圖像,忽略了世界是3D的本質(zhì)。這種2D視角不可避免地限制了它們在許多領(lǐng)域的實際應用,比如合成數(shù)據(jù)生成、機器人學習、視覺現(xiàn)實和游戲行業(yè)?!?/p>

VON通過聯(lián)合合成三維形狀和二維圖像來解決這個問題,研究人員將其稱為“disentangled object representation”。圖像生成模型被分解為形狀、視點和紋理三個要素,在計算“2.5D”草圖和添加紋理之前,首先學習三維形狀的合成。

重要的是,因為這三個要素是條件獨立的,模型不需要在二維和三維形狀之間配對數(shù)據(jù)。這使得該團隊能夠?qū)ΧS圖像和三維形狀的大規(guī)模集合進行訓練,比如Pix3D、谷歌圖像搜索和ShapeNet,后者包含了55個對象類別的數(shù)千個CAD模型。

為了讓VON學習如何生成自己的形狀,該團隊訓練了一個生成對抗網(wǎng)絡(GAN),試圖在上述三維形狀數(shù)據(jù)集上區(qū)分生成樣本和真實樣本。紋理生成被“降級”到另一個基于GAN的神經(jīng)網(wǎng)絡。

經(jīng)過大約兩到三天的訓練,人工智能系統(tǒng)產(chǎn)生了逼真的128×128×128模型,具有真實的反射率、環(huán)境照度和反照率。

為了評估圖像生成模型,團隊計算了用于生成三維模型的Fréchet初始距離 。此外,他們還向亞馬遜的Mechanical Turk上展示了200對由VON和最先進的模型生成的圖像,被試者的任務是在每對圖像中選擇更加真實的結(jié)果。

VON的性能表現(xiàn)非常突出。與其它AI模型相比,它的Fréchet初始距離最低。Mechanical Turk被試者更喜歡VON生成的圖像,比例高達74%至85%。

研究人員將專注于更加精細化的建模,以更高的分辨率生成形狀和圖像,將紋理分解為光照和外觀,并合成自然場景。

研究團隊寫道:“我們的關(guān)鍵思想是將圖像生成過程分解為三個要素:形狀、視角和紋理,這種分離的3D表示方式使我們能夠在對抗學習框架下從3D和2D視覺數(shù)據(jù)收集中學習模型。與現(xiàn)有的2D生成模型相比,我們的模型合成的圖像更加逼真;它還允許3D操作,這用以前的2D方法是無法實現(xiàn)的?!?/p>

突飛猛進的GAN

近年來,對GAN的研究突飛猛進,尤其是在機器視覺領(lǐng)域:

Google旗下的DeepMind去年10月推出了一個基于GAN的系統(tǒng),可以創(chuàng)建非常逼真的食物、風景、動物等照片;

今年9月,英偉達的研究人員開發(fā)了一種AI模型,可以對腦癌進行合成掃描;

今年8月,卡內(nèi)基梅隆大學(Carnegie Mellon)的一個研究小組展示了如何利用人工智能將一個人錄制下來的動作和面部表情在轉(zhuǎn)移到另一張照片或視頻中的目標對象;

最近,愛丁堡大學感知研究所和天文學研究所的科學家設計了一種可以產(chǎn)生高分辨率的星系圖像。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1811

    文章

    49497

    瀏覽量

    258167
  • 3D圖像
    +關(guān)注

    關(guān)注

    0

    文章

    38

    瀏覽量

    11050

原文標題:谷歌NeurIPS 2018論文:GAN生成3D模型,圖像自帶逼真效果

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    iTOF技術(shù),多樣化的3D視覺應用

    。這些技術(shù)與人工智能 (AI) 相結(jié)合,正在改變各行各業(yè)和人類生活方式的運營范式。 With the proliferation of 3D perception technologies
    發(fā)表于 09-05 07:24

    挖到寶了!人工智能綜合實驗箱,高校新工科的寶藏神器

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:30

    挖到寶了!比鄰星人工智能綜合實驗箱,高校新工科的寶藏神器!

    和生態(tài)體系帶到使用者身邊 ,讓我們在技術(shù)學習和使用上不再受制于人。 三、多模態(tài)實驗,解鎖AI全流程 它嵌入了2D視覺、深度視覺、機械手臂、語音識別、嵌入式傳感器等多種類AI模塊,涵蓋人工智能領(lǐng)域主要
    發(fā)表于 08-07 14:23

    TechWiz LCD 3D應用:FFS仿真

    建模任務 堆棧結(jié)構(gòu) 建模過程 2.1使用TechWiz Layout繪制各層掩模版平面圖 2.2創(chuàng)建堆棧結(jié)構(gòu),并生成3D結(jié)構(gòu) 2.3 使用TechWiz LCD 3D進行各項參數(shù)計算 3
    的頭像 發(fā)表于 07-14 14:08 ?365次閱讀
    TechWiz LCD <b class='flag-5'>3D</b>應用:FFS仿真

    利用NVIDIA 3D引導生成式AI Blueprint控制圖像生成

    AI 賦能的圖像生成技術(shù)突飛猛進,從早期模型會生成手指過多的人類圖像,到現(xiàn)在能創(chuàng)造出令人驚嘆的逼真視覺效果。即使取得了如此飛躍,仍然存在一個
    的頭像 發(fā)表于 06-05 09:24 ?619次閱讀

    生成人工智能認證:重構(gòu)AI時代的人才培養(yǎng)與職業(yè)躍遷路徑

    ,恰似一座連接技術(shù)前沿與個體成長的橋梁,既承載著時代對人才的迫切需求,也指向著未來職場的核心競爭力。 一、技術(shù)革命的雙重性:賦能與失衡并存 生成人工智能的突破性,在于其首次讓機器具備了“無中生有”的創(chuàng)造力。從文本生成
    的頭像 發(fā)表于 05-23 09:29 ?440次閱讀

    NVIDIA助力影眸科技3D生成工具Rodin升級

    。在 NVIDIA Omniverse 平臺、OpenUSD 以及 Isaac Lab 解決方案的助力下,影眸科技實現(xiàn)了 Rodin 平臺的升級,顯著提升了 3D 資產(chǎn)生成的速度、質(zhì)量與用戶體驗,推動具身智能進一步發(fā)展。
    的頭像 發(fā)表于 04-27 15:09 ?846次閱讀

    3D封裝與系統(tǒng)級封裝的背景體系解析介紹

    的核心技術(shù),正在重塑電子系統(tǒng)的集成范式。3D封裝通過垂直堆疊實現(xiàn)超高的空間利用率,而SiP則專注于多功能異質(zhì)集成,兩者共同推動著高性能計算、人工智能和物聯(lián)網(wǎng)等領(lǐng)域的技術(shù)革新。 根據(jù)Mordor Intelligence報告,全球
    的頭像 發(fā)表于 03-22 09:42 ?1295次閱讀
    <b class='flag-5'>3D</b>封裝與<b class='flag-5'>系統(tǒng)</b>級封裝的背景體系解析介紹

    聲智APP通過北京市生成人工智能服務登記

    近日,聲智APP已正式通過北京市第二批生成人工智能服務登記,成為《生成人工智能服務管理暫行辦法》(以下簡稱《辦法》)實施以來,北京市累計已完成46款
    的頭像 發(fā)表于 03-19 16:33 ?721次閱讀

    一種以圖像為中心的3D感知模型BIP3D

    在具身智能系統(tǒng)中,3D感知算法是一個關(guān)鍵組件,它在端側(cè)幫助可以幫助智能體理解環(huán)境信息,在云端可以用來輔助生成
    的頭像 發(fā)表于 03-17 13:44 ?754次閱讀
    一種以<b class='flag-5'>圖像</b>為中心的<b class='flag-5'>3D</b>感知模型BIP<b class='flag-5'>3D</b>

    我國生成人工智能的發(fā)展現(xiàn)狀與趨勢

    作為信息化、數(shù)字化、智能化的新型技術(shù)基座,生成人工智能對于提升國家戰(zhàn)略地位與國際競爭力具有重要意義。2022年11月以來,隨著以ChatGPT為代表的大語言模型迅速發(fā)展,生成
    的頭像 發(fā)表于 02-08 11:31 ?1847次閱讀

    生成人工智能模型的安全可信評測

    近些年來,生成人工智能技術(shù)取得了飛躍發(fā)展。隨著各式各樣的大模型不斷迭代升級,從一般通用生成能力,到各種專有領(lǐng)域的細分能力,再到更注重與用戶的實際交互,大模型的各項能力顯著提升,人工智能
    的頭像 發(fā)表于 01-22 13:55 ?1383次閱讀
    <b class='flag-5'>生成</b>式<b class='flag-5'>人工智能</b>模型的安全可信評測

    騰訊混元3D AI創(chuàng)作引擎正式上線

    近日,騰訊公司宣布其自主研發(fā)的混元3D AI創(chuàng)作引擎已正式上線。這一創(chuàng)新性的創(chuàng)作工具,標志著騰訊在3D內(nèi)容生成領(lǐng)域邁出了重要一步。 混元3D AI創(chuàng)作引擎的核心功能極為強大,用戶只需通
    的頭像 發(fā)表于 01-22 10:26 ?819次閱讀

    AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像

    電子發(fā)燒友網(wǎng)站提供《AN-1249:使用ADV8003評估板將3D圖像轉(zhuǎn)換成2D圖像.pdf》資料免費下載
    發(fā)表于 01-08 14:28 ?0次下載
    AN-1249:使用ADV8003評估板將<b class='flag-5'>3D</b><b class='flag-5'>圖像</b>轉(zhuǎn)換成2<b class='flag-5'>D</b><b class='flag-5'>圖像</b>

    嵌入式和人工智能究竟是什么關(guān)系?

    嵌入式和人工智能究竟是什么關(guān)系? 嵌入式系統(tǒng)是一種特殊的系統(tǒng),它通常被嵌入到其他設備或機器中,以實現(xiàn)特定功能。嵌入式系統(tǒng)具有非常強的適應性和靈活性,能夠根據(jù)用戶需求進行定制化設計。它
    發(fā)表于 11-14 16:39