字節(jié)跳動發(fā)布OmniHuman 多模態(tài)框架

2 月 6 日消息，字節(jié)跳動近日發(fā)布了一項(xiàng)重大成果 ——OmniHuman 多模態(tài)框架，其優(yōu)勢在于其強(qiáng)大的視頻生成能力。用戶只需提供一張任意尺寸和人物占比的單張圖片，再結(jié)合一段輸入音頻，就能生成栩栩如生的人物視頻。

與傳統(tǒng) AI 模型不同，OmniHuman-1 能夠生成逼真的全身動畫，并且可以精準(zhǔn)地將手勢和面部表情與語音或音樂同步，打破了以往只能生成面部或上半身動畫的局限。

基于約 19000 小時的人類運(yùn)動數(shù)據(jù)訓(xùn)練，OmniHuman-1 模型支持不同的體型和畫面比例，能在內(nèi)存限制內(nèi)生成任意長度的視頻，并適應(yīng)不同輸入信號，在真實(shí)性和準(zhǔn)確性方面超越其他同類動畫工具。值得一提的是，它還支持卡通角色、人工物體、動物以及復(fù)雜姿勢的輸入，確保生成的動作特征與每種風(fēng)格的獨(dú)特特點(diǎn)相匹配。

在實(shí)際應(yīng)用場景中，OmniHuman 潛力巨大。在影視制作領(lǐng)域，創(chuàng)作者能輕松為虛擬角色打造全身動作戲份；虛擬直播里，主播動作更加自然，可增強(qiáng)直播的趣味性與吸引力；游戲世界中，數(shù)字人 NPC 的動作和表情更豐富，能提升玩家的沉浸感。

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請聯(lián)系本站處理。舉報(bào)投訴

AI

AI

+關(guān)注

關(guān)注
89

文章
38004

瀏覽量
295969
人工智能

人工智能

+關(guān)注

關(guān)注
1813

文章
49706

瀏覽量
261218
字節(jié)跳動

字節(jié)跳動

+關(guān)注

關(guān)注
0

文章
348

瀏覽量
9861

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

字節(jié)跳動發(fā)布OmniHuman 多模態(tài)框架

評論