谷歌發(fā)布VLOGGER AI模型，實現(xiàn)肖像朗讀音頻內容

3 月 19 日，Google 在其官方博客上發(fā)布了關于 VLOGGER AI 模型的相關信息。這是一款利用用戶提供的肖像照片和音頻內容，使人物生動地呈現(xiàn)音頻內容并具備豐富面部表情的人工智能程序。

具體來說，VLOGGER AI 采用一種適應虛擬肖像的多模態(tài) Diffusion 模型，通過 MENTOR 數(shù)據(jù)庫進行訓練，涵蓋了超80萬個人物肖像及超過2200小時的視頻數(shù)據(jù)。得益于此，VLOGGER 可以生成各種族、各年齡段、穿著多樣、姿態(tài)各異的肖像視頻。

研發(fā)團隊指出，相較于之前的同類產(chǎn)品，VLOGGER 的獨特之處在于無需針對每個使用者進行單獨培訓，且不受限于人臉檢測和裁剪，能產(chǎn)出完整的圖像，且能夠處理更多元化的情境如可見的身軀或者其他身份特征，這對于真實再現(xiàn)人物交流過程至關重要。

谷歌將 VLOGGER 視為通往“通用聊天機器人”未來的關鍵一步，使人工智能能以自然的語音、手勢和眼神等方式與人類交互。除此之外，VLOGGER 還可用作報告、教育領域以及旁白等方面的輔助工具，并能對已有的電影進行剪輯和表情調整。

聲明：本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用，如有內容侵權或者其他違規(guī)問題，請聯(lián)系本站處理。舉報投訴

Google

Google

+關注

關注
5

文章
1801

瀏覽量
60272
模型

模型

+關注

關注
1

文章
3649

瀏覽量
51719
VLogger

VLogger

+關注

關注
0

文章
5

瀏覽量
8458

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

谷歌發(fā)布VLOGGER AI模型，實現(xiàn)肖像朗讀音頻內容

評論

搜索歷史

谷歌發(fā)布VLOGGER AI模型，實現(xiàn)肖像朗讀音頻內容

評論

谷歌發(fā)布VLOGGER AI模型，實現(xiàn)肖像朗讀音頻內容