chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里云視頻生成技術(shù)創(chuàng)新!視頻生成使用了哪些AI技術(shù)和算法

Carol Li ? 來(lái)源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-05-08 00:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)日前,阿里云宣布通義實(shí)驗(yàn)室研發(fā)的視頻生成模型EMO正式上線通義App,免費(fèi)對(duì)所有人開(kāi)放。借助這一功能,用戶可以在歌曲、熱梗、表情包中任選一款模板,然后通過(guò)上傳一張肖像照片就能讓 EMO 合成演戲唱歌視頻。

阿里云在視頻生成領(lǐng)域的創(chuàng)新

EMO(Emote Portrait Alive)是一個(gè)由阿里巴巴集團(tuán)智能計(jì)算研究院開(kāi)發(fā)的框架,一個(gè)音頻驅(qū)動(dòng)的 AI 肖像視頻生成系統(tǒng),能夠通過(guò)輸入單一的參考圖像和語(yǔ)音音頻,生成具有表現(xiàn)力的面部表情和各種頭部姿勢(shì)的視頻。

據(jù)介紹,通義 App 首批上線了80多個(gè) EMO 模板,包括熱門歌曲《上春山》《野狼 Disco》等,還有網(wǎng)絡(luò)熱?!袄徖忞u”“回手掏”等。EMO自2月底公布模型論文以來(lái),在海內(nèi)外引發(fā)廣泛關(guān)注,并與OpenAI的Sora模型相提并論。

具體來(lái)看,EMO的功能包括,音頻驅(qū)動(dòng)的視頻生成,通過(guò)輸入一段音頻(如語(yǔ)音、歌曲等)和一張參考圖片(通常是人物的肖像),就能生成一個(gè)動(dòng)態(tài)的、與音頻內(nèi)容同步的視頻。

阿里EMO使用先進(jìn)的音視頻擴(kuò)散模型和注意力機(jī)制,能夠生成具有高度真實(shí)感和豐富表現(xiàn)力的肖像視頻。肖像的表情和動(dòng)作會(huì)非常自然和流暢,與音頻內(nèi)容緊密同步。

阿里EMO的應(yīng)用場(chǎng)景非常廣泛。它不僅可以用于娛樂(lè)和創(chuàng)作領(lǐng)域,如讓歷史人物“復(fù)活”、為電影角色配音等,還可以用于教育、廣告、游戲等多個(gè)領(lǐng)域,為用戶提供更多樣化、個(gè)性化的視頻內(nèi)容。

另外,阿里EMO采用高效的算法和計(jì)算框架,能夠在較短的時(shí)間內(nèi)生成高質(zhì)量的肖像視頻。這為用戶節(jié)省了大量的時(shí)間成本,提高了工作效率。

阿里EMO的框架還具有良好的可擴(kuò)展性和靈活性,可以根據(jù)用戶的具體需求進(jìn)行定制和優(yōu)化。例如,可以通過(guò)調(diào)整參數(shù)或添加新的模型組件來(lái)優(yōu)化生成視頻的質(zhì)量和性能。

阿里在視頻生成領(lǐng)域做過(guò)非常多創(chuàng)新,此前還推出過(guò)VideoComposer,這是一個(gè)結(jié)合了空間條件和時(shí)序條件的視頻生成框架。它利用單張圖像或草圖作為空間條件,同時(shí)結(jié)合運(yùn)動(dòng)矢量和深度序列等時(shí)序條件,來(lái)生成具有高度視覺(jué)逼真度的視頻。

阿里云還發(fā)布了AtomoVideo模型,這是一種能夠從單一靜態(tài)圖像生成高保真視頻序列的技術(shù)。它結(jié)合了個(gè)性化文本到圖像(T2I)模型,能夠根據(jù)文字描述和靜態(tài)圖片生成符合描述的視頻內(nèi)容。

此外,阿里云視覺(jué)智能開(kāi)放平臺(tái)提供了豐富的視頻生產(chǎn)能力,包括視頻摘要、視頻編輯、視頻人臉融合等功能。這些功能可以應(yīng)用于電商、影視、廣告等多個(gè)領(lǐng)域,幫助用戶快速生成高質(zhì)量的視頻內(nèi)容。

視頻生成使用到的AI技術(shù)和算法

視頻生成是一個(gè)涉及多個(gè)步驟和技術(shù)的過(guò)程,目前國(guó)內(nèi)外有多款視頻生成工具,如Pixverse、Pika、Runway Gen-2、Kaiber、Plaiday、Genmo等。其中,Pika因其高質(zhì)量和穩(wěn)定的畫(huà)面生成能力而受到用戶好評(píng),Runway Gen-2則可以將midjourney生成的圖像轉(zhuǎn)換為高質(zhì)量動(dòng)畫(huà)。另外,Sora作為一款新興的視頻生成工具,其獨(dú)特之處在于能夠生成高質(zhì)量的長(zhǎng)視頻內(nèi)容,并理解長(zhǎng)文本指令以生成詳盡細(xì)節(jié)的視頻內(nèi)容。

從算法的角度來(lái)看,視頻生成涉及到一些基本的算法和技術(shù)。例如,循環(huán)神經(jīng)網(wǎng)絡(luò)(RNN)中的GRU和LSTM可以有效避免梯度下降和衰減的問(wèn)題,而encoder-decoder架構(gòu)則使得機(jī)器翻譯等任務(wù)的效果大幅提升。在視頻生成領(lǐng)域,這些算法和技術(shù)可能用于生成視頻的內(nèi)容、結(jié)構(gòu)、風(fēng)格等方面。

視頻生成采用了相當(dāng)多的技術(shù),包括深度學(xué)習(xí)模型,這是視頻生成中最為關(guān)鍵的技術(shù)之一。深度學(xué)習(xí)模型,特別是生成對(duì)抗網(wǎng)絡(luò)(GANs)和變分自編碼器(VAEs),被廣泛應(yīng)用于視頻生成中。這些模型能夠?qū)W習(xí)并模仿視頻數(shù)據(jù)的分布,從而生成新的、與原始數(shù)據(jù)相似的視頻。

計(jì)算機(jī)圖形學(xué),它在視頻生成中扮演著重要角色,特別是在創(chuàng)建虛擬場(chǎng)景、角色和特效時(shí)。通過(guò)計(jì)算機(jī)圖形學(xué)技術(shù),可以生成逼真的虛擬場(chǎng)景和角色,并將其與真實(shí)視頻相結(jié)合,創(chuàng)造出獨(dú)特的視覺(jué)效果。

物理模擬,為了生成更逼真的視頻,物理模擬技術(shù)被用來(lái)模擬物體的運(yùn)動(dòng)和交互。這包括模擬物體的運(yùn)動(dòng)軌跡、碰撞效果、光影變化等,以使得生成的視頻更加真實(shí)可信。

自然語(yǔ)言處理,隨著技術(shù)的發(fā)展,自然語(yǔ)言處理(NLP)也被應(yīng)用于視頻生成中。通過(guò)解析文本描述,NLP技術(shù)可以指導(dǎo)視頻生成模型生成與文本內(nèi)容相匹配的視頻。這為視頻生成提供了更多的創(chuàng)意和可能性。

還有音頻合成技術(shù),除了視覺(jué)元素外,音頻也是視頻的重要組成部分。音頻合成技術(shù)可以生成與視頻內(nèi)容相匹配的音效和背景音樂(lè),從而提升視頻的觀看體驗(yàn)。此外,還有一些其他的技術(shù)也被用于視頻生成中,如增強(qiáng)學(xué)習(xí)、遷移學(xué)習(xí)等。這些技術(shù)使得視頻生成更加靈活、高效和多樣化。

寫在最后

經(jīng)過(guò)近些年的發(fā)展,視頻生成技術(shù)也逐漸成熟,并且在新聞報(bào)道、廣告制作、教育培訓(xùn)、電影與游戲制作、醫(yī)療健康等領(lǐng)域有不少實(shí)際的應(yīng)用案例。未來(lái),娛樂(lè)與媒體、廣告與營(yíng)銷、教育培訓(xùn)、虛擬現(xiàn)實(shí)/增強(qiáng)現(xiàn)實(shí)、醫(yī)療健康等都將會(huì)成為視頻生成技術(shù)的主流應(yīng)用。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 算法
    +關(guān)注

    關(guān)注

    23

    文章

    4739

    瀏覽量

    96721
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    37012

    瀏覽量

    290009
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1023

    瀏覽量

    45272
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    全球首個(gè)動(dòng)漫專屬AI視頻生成平臺(tái)Animon,國(guó)內(nèi)版"萌動(dòng)AI"正式發(fā)布

    Animon國(guó)內(nèi)版——"萌動(dòng)AI"首秀:AI動(dòng)漫創(chuàng)作進(jìn)入全民時(shí)代 北京2025年9月25日?/美通社/ -- CreateAI(OTC:TSPH)今日宣布,其打造的全球首個(gè)專注于動(dòng)漫的AI視頻
    的頭像 發(fā)表于 09-25 12:33 ?321次閱讀

    4K、多模態(tài)、長(zhǎng)視頻AI視頻生成的下一個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080P高品質(zhì)
    的頭像 發(fā)表于 06-16 00:13 ?6751次閱讀

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開(kāi)發(fā)視頻應(yīng)用

    開(kāi)發(fā)一個(gè)視頻內(nèi)容生成Agent。 訪問(wèn)語(yǔ)聚AI平臺(tái)官網(wǎng) ,進(jìn)行注冊(cè)或登錄。 在平臺(tái)首頁(yè),了解語(yǔ)聚AI的功能和應(yīng)用場(chǎng)景,特別是其支持的視頻生成
    發(fā)表于 03-05 19:52

    字節(jié)跳動(dòng)即將推出多模態(tài)視頻生成模型OmniHuman

    一條完整的AI視頻。 據(jù)即夢(mèng)AI相關(guān)負(fù)責(zé)人透露,OmniHuman模型在研發(fā)過(guò)程中融入了前沿的人工智能技術(shù),通過(guò)復(fù)雜的算法和深度學(xué)習(xí)機(jī)制,實(shí)
    的頭像 發(fā)表于 02-08 10:53 ?1011次閱讀

    阿里媽媽“淘寶星辰·圖生視頻”商用上線

    近日,阿里媽媽宣布其自研的淘寶星辰視頻生成大模型已成功轉(zhuǎn)化為商用級(jí)應(yīng)用——淘寶星辰·圖生視頻。這一創(chuàng)新性的AI工具現(xiàn)已正式對(duì)淘寶、天貓商家開(kāi)
    的頭像 發(fā)表于 01-16 10:43 ?969次閱讀

    阿里通義萬(wàn)相2.1視頻生成模型震撼發(fā)布

    近日,阿里旗下的通義萬(wàn)相迎來(lái)了重要升級(jí),正式推出了全新的萬(wàn)相2.1視頻生成模型。這一創(chuàng)新成果標(biāo)志著阿里
    的頭像 發(fā)表于 01-13 10:00 ?986次閱讀

    Google兩款先進(jìn)生成AI模型登陸Vertex AI平臺(tái)

    新的 AI 模型,包括最先進(jìn)的視頻生成模型Veo以及最高品質(zhì)的圖像生成模型Imagen 3。近日,我們?cè)?Google Cloud 上進(jìn)一步推動(dòng)這一勢(shì)頭,客戶可以在Vertex AI
    的頭像 發(fā)表于 12-30 09:56 ?840次閱讀

    華為 Flexus 服務(wù)器 X 實(shí)例 Windows 系統(tǒng)部署一鍵短視頻生成 AI 工具 moneyprinter

    在追求創(chuàng)新與效率并重的今天,我們公司迎難而上,決定自主搭建一款短視頻生成 AI 工具——MoneyPrinter,旨在為市場(chǎng)帶來(lái)前所未有的創(chuàng)意風(fēng)暴。面對(duì)服務(wù)器選擇的難題,我們經(jīng)過(guò)深思熟慮與多方比較
    的頭像 發(fā)表于 12-30 09:10 ?826次閱讀
    華為<b class='flag-5'>云</b> Flexus <b class='flag-5'>云</b>服務(wù)器 X 實(shí)例 Windows 系統(tǒng)部署一鍵短<b class='flag-5'>視頻生成</b> <b class='flag-5'>AI</b> 工具 moneyprinter

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無(wú)推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪問(wèn)量遠(yuǎn)超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?798次閱讀

    Lightricks與Shutterstock攜手,推動(dòng)開(kāi)源LTXV視頻人工智能生成視頻模型發(fā)展

    ,Lightricks將能夠利用高質(zhì)量HD和4K視頻素材,進(jìn)一步訓(xùn)練其開(kāi)源視頻生成模型——LTX Video(LTXV)。 Lightricks成為首個(gè)在Shutterstock行業(yè)首創(chuàng)
    的頭像 發(fā)表于 12-15 09:31 ?650次閱讀
    Lightricks與Shutterstock攜手,推動(dòng)開(kāi)源LTXV<b class='flag-5'>視頻</b>人工智能<b class='flag-5'>生成</b>式<b class='flag-5'>視頻</b>模型發(fā)展

    中國(guó)電信發(fā)布自研視頻生成大模型

    ,中國(guó)電信隆重發(fā)布了首個(gè)由央企全自研的視頻生成大模型。該模型采用了創(chuàng)新的“VAST(Video As Storyboard from Text)二階段視頻生成
    的頭像 發(fā)表于 12-13 15:40 ?742次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這一新品的發(fā)布,無(wú)疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora
    的頭像 發(fā)表于 12-12 09:40 ?927次閱讀

    OpenAI開(kāi)放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國(guó)及其他市場(chǎng)的ChatGPT Plus訂閱用戶開(kāi)放。自去年首次公開(kāi)預(yù)覽以來(lái),Sora歷經(jīng)約10個(gè)月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?917次閱讀

    字節(jié)跳動(dòng)自研視頻生成模型Seaweed開(kāi)放

    近日,字節(jié)跳動(dòng)旗下的AI內(nèi)容平臺(tái)即夢(mèng)AI傳來(lái)新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺(tái)用戶開(kāi)放使用。這一舉措標(biāo)志著字節(jié)跳動(dòng)在AI
    的頭像 發(fā)表于 11-11 14:31 ?917次閱讀

    智譜視頻生成大模型清影升級(jí),開(kāi)啟有聲電影新時(shí)代

    近日,智譜公司的視頻生成大模型產(chǎn)品——清影,迎來(lái)了重要升級(jí)。此次升級(jí)后,清影能夠支持生成10秒、4K分辨率、60幀的超高清視頻,并且極大地提升了人物表演的細(xì)節(jié)表現(xiàn)。這一技術(shù)突破無(wú)疑將為
    的頭像 發(fā)表于 11-11 11:40 ?935次閱讀