chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

4K、多模態(tài)、長(zhǎng)視頻:AI視頻生成的下一個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

Carol Li ? 來(lái)源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-06-16 00:13 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線(xiàn)視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080P高品質(zhì)視頻,主體運(yùn)動(dòng)穩(wěn)定性與畫(huà)面自然度較高。

相關(guān)技術(shù)報(bào)告顯示,在國(guó)際知名評(píng)測(cè)榜單Artificial Analysis上,Seedance在文生視頻、圖生視頻兩項(xiàng)任務(wù)上均排名首位,超越Veo3、可靈2.0等優(yōu)秀模型。目前,該模型已通過(guò)豆包App、即夢(mèng)AI、火山引擎等平臺(tái)對(duì)外開(kāi)放。

筆者在在豆包App試用,發(fā)現(xiàn)真的非常方便好用,比如,只需在對(duì)話(huà)框選擇“照片動(dòng)起來(lái)”,上傳圖片或輸入文字指令,等待一會(huì)兒就能生成一段視頻。相較此前效果,新模型的視頻結(jié)果更符合物理邏輯且富于生動(dòng)張力,同時(shí)可以保持對(duì)原圖人臉的保真度。

除了豆包的視頻生成模型之外,近年來(lái),國(guó)內(nèi)外已經(jīng)出現(xiàn)過(guò)多款視頻生成模型,如國(guó)外的Runway、Pika、Sora、Veo,國(guó)內(nèi)有可靈、PixVerse、騰訊混元、通義萬(wàn)相等。

Runway

2025年4月8日,Runway 官方稱(chēng),現(xiàn)已推出最新版視頻模型Gen-4 Turbo。Gen-4Turbo是Runway Gen-4系列的最新迭代版本。相較于此前的模型,Gen-4Turbo在保持高保真度和動(dòng)態(tài)運(yùn)動(dòng)表現(xiàn)的基礎(chǔ)上,大幅縮短了生成時(shí)間。使用 Gen-4 Turbo,用戶(hù)只需 30 秒即可生成10秒的視頻,非常適合快速迭代和創(chuàng)意探索。Runway方面表示,Gen-4Turbo現(xiàn)已開(kāi)始向所有付費(fèi)用戶(hù)逐步開(kāi)放,包括個(gè)人用戶(hù)和企業(yè)客戶(hù)。

Pika

當(dāng)?shù)貢r(shí)間2024年12月13日,美國(guó)AI視頻生成初創(chuàng)公司Pika推出了新版視頻生成模型 Pika 2.0。Pika 2.0最大的亮點(diǎn)是其卓越的可定制性,新推出的“場(chǎng)景配料”功能,允許用戶(hù)上傳和自定義角色、物體和場(chǎng)景等各個(gè)元素。通過(guò)先進(jìn)的圖像識(shí)別技術(shù),這些元素能夠完美地融入場(chǎng)景中,讓創(chuàng)作者能夠更精細(xì)地控制內(nèi)容。

在技術(shù)層面,Pika 2.0 在文本對(duì)齊和運(yùn)動(dòng)渲染方面都實(shí)現(xiàn)了新突破。系統(tǒng)能夠準(zhǔn)確理解并執(zhí)行復(fù)雜的文字提示,即使是最具挑戰(zhàn)性的場(chǎng)景描述也能被完整地轉(zhuǎn)化為連貫的視頻片段。不論是真實(shí)世界的自然運(yùn)動(dòng),還是科幻場(chǎng)景中的特效,都能呈現(xiàn)出令人信服的效果。

Sora

2024年12月,OpenAI推出AI視頻生成模型Sora。OpenAI表示,該工具不僅可以通過(guò)文本提示生成視頻,還能夠基于靜態(tài)圖片和已有視頻創(chuàng)建新的內(nèi)容。例如,用戶(hù)可以上傳一段視頻剪輯,Sora會(huì)生成擴(kuò)展這個(gè)片段的后續(xù)畫(huà)面,使視頻變得更長(zhǎng)、更完整。新版工具Sora Turbo可以生成最長(zhǎng)達(dá)20秒的視頻,并且可以提供這些視頻的多種變體。

Veo 3

在今年5月的I/O開(kāi)發(fā)者大會(huì)上,谷歌發(fā)布第三代視頻生成模型Veo 3。Veo 3能夠根據(jù)提示詞生成高質(zhì)量視頻,同時(shí)自動(dòng)生成與畫(huà)面同步的對(duì)白、唇動(dòng)對(duì)齊、擬真環(huán)境音效以及情緒氛圍音軌。其底層技術(shù)V2A(Video-to-Audio)通過(guò)將視頻像素轉(zhuǎn)化為語(yǔ)義信號(hào),結(jié)合文本提示生成同步音頻波形,從而實(shí)現(xiàn)了音畫(huà)同步。

Veo 3的音畫(huà)同步功能基于對(duì)物理世界的深刻理解,能夠?qū)崟r(shí)生成與畫(huà)面匹配的聲音,例如腳步聲、烹飪聲等,而不是后期拼接。此外,Veo 3還能精準(zhǔn)捕捉畫(huà)面情緒,渲染氛圍音效,甚至在多角色、多種風(fēng)格的復(fù)雜場(chǎng)景下表現(xiàn)出色。在長(zhǎng)提示詞理解與事件流生成方面,Veo 3也能處理復(fù)雜的事件流,生成邏輯連貫、多步驟執(zhí)行的視頻片段。

可靈AI

2025年4月15日,可靈AI宣布基座模型升級(jí),面向全球正式發(fā)布可靈2.0視頻生成模型及可圖2.0圖像生成模型??伸`是全球首個(gè)用戶(hù)可用的DiT(Diffusion Transformer)視頻生成模型,其2.0版本的模型在動(dòng)態(tài)質(zhì)量、語(yǔ)義響應(yīng)和畫(huà)面美學(xué)做了相應(yīng)提升,而可圖2.0模型主要集中在指令遵循、電影質(zhì)感及藝術(shù)風(fēng)格表現(xiàn)等方面。

5月29日,可靈AI宣布,推出全新可靈2.1系列模型。可靈2.1模型包含標(biāo)準(zhǔn)(720p)、高品質(zhì)(1080p)兩種模式,主打高性?xún)r(jià)比和高效生成。其高品質(zhì)模式(1080p)生成5s視頻僅需不到1分鐘,處于業(yè)內(nèi)領(lǐng)先水平。在動(dòng)態(tài)表現(xiàn)方面,模型動(dòng)態(tài)細(xì)節(jié)更好、動(dòng)態(tài)響應(yīng)更強(qiáng)、動(dòng)態(tài)幅度更大;其次,物理模擬更真實(shí),人物動(dòng)作幅度等更加貼近現(xiàn)實(shí)。

PixVerse(拍我AI

最近,美國(guó)iOS應(yīng)用商店有一個(gè)新變化。全球用戶(hù)量最大的國(guó)產(chǎn)AI視頻生成平臺(tái)之一——PixVerse更新了4.5版本,一下子沖到了美國(guó)iOS應(yīng)用商店總榜第四,視頻類(lèi)應(yīng)用第一。今年6月初,PixVerse正式推出國(guó)內(nèi)版產(chǎn)品——拍我AI,同步上線(xiàn)網(wǎng)頁(yè)端及移動(dòng)端應(yīng)用,并開(kāi)放最新V4.5模型供用戶(hù)使用。據(jù)介紹,PixVerse自海外上線(xiàn)以來(lái),已累計(jì)吸引全球超6000萬(wàn)用戶(hù),月活躍用戶(hù)突破1600萬(wàn),居AI視頻生成領(lǐng)域第一梯隊(duì)。

V4.5模型在生成速度、畫(huà)面精細(xì)度及多主體控制等方面均有顯著優(yōu)化,支持更復(fù)雜的電影級(jí)運(yùn)鏡與多角色互動(dòng)敘事?!芭奈褹I”采用“App+網(wǎng)頁(yè)端”雙端策略,滿(mǎn)足不同用戶(hù)群體的需求:App端主打趣味化、低門(mén)檻體驗(yàn),內(nèi)置百余種創(chuàng)意模板,如“寵物跳舞”“噴火特效”等,用戶(hù)上傳一張照片即可一鍵生成高質(zhì)量短視頻,極大降低AI視頻創(chuàng)作的技術(shù)門(mén)檻。

網(wǎng)頁(yè)端則面向?qū)I(yè)創(chuàng)作者,提供更精細(xì)的參數(shù)調(diào)節(jié)功能,支持多主體運(yùn)動(dòng)控制、動(dòng)態(tài)運(yùn)鏡及智能音效匹配,適用于短劇制作、廣告創(chuàng)意、游戲開(kāi)發(fā)等高階需求。

除服務(wù)C端用戶(hù)外,“拍我AI”還推出了企業(yè)級(jí)API開(kāi)放平臺(tái),目前已與百度、科大訊飛、藍(lán)色光標(biāo)等國(guó)內(nèi)頭部企業(yè)達(dá)成合作,提供高效的視頻生成工具。企業(yè)可通過(guò)API快速生成營(yíng)銷(xiāo)視頻、電商素材、私域運(yùn)營(yíng)內(nèi)容等,大幅降低傳統(tǒng)視頻制作的成本與時(shí)間。

騰訊混元

2025年3月6日,據(jù)騰訊混元消息,騰訊混元發(fā)布圖生視頻模型并對(duì)外開(kāi)源,同時(shí)上線(xiàn)對(duì)口型與動(dòng)作驅(qū)動(dòng)等玩法,并支持生成背景音效及2K高質(zhì)量視頻。騰訊混元圖生視頻模型目前已經(jīng)上線(xiàn),企業(yè)和開(kāi)發(fā)者可在騰訊云申請(qǐng)使用API接口;用戶(hù)通過(guò)混元AI視頻官網(wǎng)即可體驗(yàn)?;煸曨l生成開(kāi)源模型目前在Github、HuggingFace等主流開(kāi)發(fā)者社區(qū)均可下載體驗(yàn)。

基于圖生視頻的能力,用戶(hù)只需上傳一張圖片,并簡(jiǎn)短描述希望畫(huà)面如何運(yùn)動(dòng)、鏡頭如何調(diào)度等,混元即可按照用戶(hù)要求讓圖片動(dòng)起來(lái),變成5秒的短視頻,還能自動(dòng)配上合適的背景音效。此外,上傳一張人物圖片,并輸入希望“對(duì)口型”的文字或音頻,圖片中的人物即可“說(shuō)話(huà)”或“唱歌”;如果選擇動(dòng)作模版,還能一鍵生成同款跳舞視頻。目前用戶(hù)通過(guò)混元AI視頻官網(wǎng)即可體驗(yàn),企業(yè)和開(kāi)發(fā)者可在騰訊云申請(qǐng)使用API接口使用。

通義萬(wàn)相

2024年9月 19 日,在杭州云棲大會(huì)上,阿里云CTO周靖人宣布通義萬(wàn)相全面升級(jí),并發(fā)布全新視頻生成模型,可生成影視級(jí)高清視頻,可應(yīng)用于影視創(chuàng)作、動(dòng)畫(huà)設(shè)計(jì)、廣告設(shè)計(jì)等領(lǐng)域。即日起,所有用戶(hù)可通過(guò)通義APP及通義萬(wàn)相官網(wǎng)免費(fèi)體驗(yàn)。

通義萬(wàn)相首批上線(xiàn)文生視頻、圖生視頻功能,在文生視頻功能中,用戶(hù)輸入任意文字提示詞,即可生成一段高清視頻,支持中英文多語(yǔ)言輸入,并可以通過(guò)靈感擴(kuò)寫(xiě)功能智能豐富視頻內(nèi)容表現(xiàn)力,支持16:9、9:16等多種比例生成;在圖生視頻功能中,支持用戶(hù)將任意圖片轉(zhuǎn)化為動(dòng)態(tài)視頻,按照上傳的圖像比例或預(yù)設(shè)比例進(jìn)行生成,同時(shí)可以通過(guò)提示詞來(lái)控制視頻運(yùn)動(dòng)?,F(xiàn)場(chǎng),阿里云演示了該模型強(qiáng)大的運(yùn)動(dòng)生成和概念組合能力,輸入“穿著滑冰鞋的小兔子在冰面上靈活移動(dòng)的可愛(ài)場(chǎng)景”,通義萬(wàn)相僅用數(shù)分鐘就能生成一段高清、逼真的視頻。

寫(xiě)在最后

AI視頻生成工具有著可觀(guān)的市場(chǎng)前景,如在影視制作領(lǐng)域,AI可承擔(dān)分鏡設(shè)計(jì)、后期渲染等任務(wù),降低制作成本,縮短周期;在廣告營(yíng)銷(xiāo)領(lǐng)域,可支持批量生成個(gè)性化廣告,通過(guò)數(shù)字人形象與用戶(hù)實(shí)時(shí)互動(dòng),提升轉(zhuǎn)化率;在教育領(lǐng)域,可模擬復(fù)雜操作流程,提供3D動(dòng)態(tài)演示,提升學(xué)習(xí)效率。

如今國(guó)內(nèi)外企業(yè)已經(jīng)推出眾多AI視頻生成模型工具。在技術(shù)迭代上,主流模型已經(jīng)實(shí)現(xiàn)4K分辨率、60秒以上視頻生成,并支持多模態(tài)輸入,包括文本、圖像、音頻。盡管如此,AI視頻生成仍然有很多不足之處,如復(fù)雜物理交互仍易出錯(cuò);大多模型在生成較長(zhǎng)時(shí)間視頻方面仍存在困難;高分辨率視頻生成需要強(qiáng)大硬件支持,訓(xùn)練和推理成本高昂等。所以,如論是從模型角度還是硬件支持角度,AI視頻生成模型還有待持續(xù)優(yōu)化。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI Agent 應(yīng)用與項(xiàng)目實(shí)戰(zhàn)》----- 學(xué)習(xí)如何開(kāi)發(fā)視頻應(yīng)用

    開(kāi)發(fā)個(gè)視頻內(nèi)容生成Agent。 訪(fǎng)問(wèn)語(yǔ)聚AI平臺(tái)官網(wǎng) ,進(jìn)行注冊(cè)或登錄。 在平臺(tái)首頁(yè),了解語(yǔ)聚A
    發(fā)表于 03-05 19:52

    字節(jié)跳動(dòng)即將推出模態(tài)視頻生成模型OmniHuman

    字節(jié)跳動(dòng)旗下一站式AI創(chuàng)作平臺(tái)即夢(mèng)AI即將迎來(lái)重大更新,全新模態(tài)視頻生成模型OmniHuman
    的頭像 發(fā)表于 02-08 10:53 ?764次閱讀

    阿里云通義萬(wàn)相2.1視頻生成模型震撼發(fā)布

    近日,阿里云旗下的通義萬(wàn)相迎來(lái)了重要升級(jí),正式推出了全新的萬(wàn)相2.1視頻生成模型。這創(chuàng)新成果標(biāo)志著阿里云在視頻生成技術(shù)領(lǐng)域的又次重大突破。 據(jù)悉,萬(wàn)相2.1
    的頭像 發(fā)表于 01-13 10:00 ?838次閱讀

    OpenAI暫不推出Sora視頻生成模型API

    OpenAI近日宣布,目前暫無(wú)推出其視頻生成模型Sora的應(yīng)用程序接口(API)的計(jì)劃。Sora模型能夠基于文本和圖像生成視頻,引發(fā)了廣泛關(guān)注。然而,由于訪(fǎng)問(wèn)量遠(yuǎn)超預(yù)期,OpenAI此前不得不緊急
    的頭像 發(fā)表于 12-20 14:23 ?532次閱讀

    OpenAI推出AI視頻生成模型Sora

    近日,備受期待的OpenAI再次推出了其創(chuàng)新之作——AI視頻生成模型Sora。這新品的發(fā)布,無(wú)疑為AI技術(shù)注入了新的活力。 據(jù)悉,Sora與OpenAI旗下的
    的頭像 發(fā)表于 12-12 09:40 ?720次閱讀

    OpenAI開(kāi)放Sora視頻生成模型

    OpenAI近日宣布,其傾力打造的人工智能視頻生成系統(tǒng)Sora已正式向美國(guó)及其他市場(chǎng)的ChatGPT Plus訂閱用戶(hù)開(kāi)放。自去年首次公開(kāi)預(yù)覽以來(lái),Sora歷經(jīng)約10個(gè)月的精心研發(fā)與優(yōu)化,現(xiàn)已全面
    的頭像 發(fā)表于 12-10 11:16 ?745次閱讀

    HDMI接口如何實(shí)現(xiàn)4K視頻傳輸

    隨著科技的不斷進(jìn)步,人們對(duì)視頻質(zhì)量的要求也越來(lái)越高。4K視頻以其超高清的分辨率和細(xì)膩的畫(huà)質(zhì)逐漸成為主流。HDMI作為連接顯示器和視頻源的標(biāo)準(zhǔn)接口,其在
    的頭像 發(fā)表于 11-27 14:37 ?2904次閱讀

    4K視頻傳輸?shù)慕涌趯?duì)比

    在選擇適合4K視頻傳輸?shù)慕涌跁r(shí),需要考慮多個(gè)因素,包括分辨率、刷新率、色深、音頻支持、擴(kuò)展功能等。目前接口般有HDMI、DisplayPort (DP)、USB-C 和 Thunderbolt 等,本文將圍繞這些接口進(jìn)行解析,
    的頭像 發(fā)表于 11-22 09:16 ?2473次閱讀
    <b class='flag-5'>4K</b><b class='flag-5'>視頻</b>傳輸?shù)慕涌趯?duì)比

    字節(jié)跳動(dòng)自研視頻生成模型Seaweed開(kāi)放

    近日,字節(jié)跳動(dòng)旗下的AI內(nèi)容平臺(tái)即夢(mèng)AI傳來(lái)新消息,宣布自研的視頻生成模型Seaweed即日起正式面向平臺(tái)用戶(hù)開(kāi)放使用。這舉措標(biāo)志著字節(jié)跳動(dòng)在AI
    的頭像 發(fā)表于 11-11 14:31 ?703次閱讀

    智譜視頻生成大模型清影升級(jí),開(kāi)啟有聲電影新時(shí)代

    近日,智譜公司的視頻生成大模型產(chǎn)品——清影,迎來(lái)了重要升級(jí)。此次升級(jí)后,清影能夠支持生成10秒、4K分辨率、60幀的超高清視頻,并且極大地提升了人物表演的細(xì)節(jié)表現(xiàn)。這
    的頭像 發(fā)表于 11-11 11:40 ?754次閱讀

    4K視頻為何越來(lái)越糊?SGMII與HEVC如何重拾高碼流體驗(yàn)

    1.引言隨著網(wǎng)絡(luò)視頻平臺(tái)的發(fā)展,用戶(hù)對(duì)于4K高清畫(huà)質(zhì)的需求日益增長(zhǎng)。然而,許多用戶(hù)發(fā)現(xiàn),即使購(gòu)買(mǎi)了視頻平臺(tái)的會(huì)員,觀(guān)看4K內(nèi)容時(shí)畫(huà)質(zhì)卻不如預(yù)期,有時(shí)甚至還會(huì)出現(xiàn)模糊、卡頓的情況。這種現(xiàn)
    的頭像 發(fā)表于 11-01 08:01 ?2690次閱讀
    <b class='flag-5'>4K</b><b class='flag-5'>視頻</b>為何越來(lái)越糊?SGMII與HEVC如何重拾高碼流體驗(yàn)

    使用dp接口播放4K視頻的技巧

    的硬件支持和些技巧。 1. 了解dp接口 dp接口是一種數(shù)字視頻和音頻接口標(biāo)準(zhǔn),主要用于連接顯示器和視頻源設(shè)備。它支持高分辨率視頻傳輸,包括4K
    的頭像 發(fā)表于 10-30 13:56 ?1595次閱讀

    今日看點(diǎn)丨Vishay裁員800人,關(guān)閉上海等三家工廠(chǎng);字節(jié)跳動(dòng)發(fā)布兩款視頻生成大模型

    企業(yè)市場(chǎng)開(kāi)啟邀測(cè)。 ? 火山引擎介紹,豆包視頻生成模型基于DiT架構(gòu),通過(guò)高效的DiT融合計(jì)算單元,能更充分地壓縮編碼視頻與文本,讓視頻在大動(dòng)態(tài)與運(yùn)鏡中自由切換,擁有變焦、環(huán)繞、平搖、縮放、目標(biāo)跟隨等
    發(fā)表于 09-25 15:48 ?953次閱讀

    火山引擎推出豆包·視頻生成模型

    在近期舉辦的2024火山引擎AI創(chuàng)新巡展上,火山引擎總裁譚待隆重推出了豆包·視頻生成模型,這舉措標(biāo)志著火山引擎在視頻內(nèi)容生成領(lǐng)域邁出了重要
    的頭像 發(fā)表于 09-25 14:11 ?651次閱讀

    阿里首推AI視頻生成利器Tora:指尖畫(huà)圈,自由操控物體運(yùn)動(dòng)軌跡

    近日,阿里巴巴團(tuán)隊(duì)震撼發(fā)布了項(xiàng)革命性的創(chuàng)新成果——Tora,個(gè)前所未有的AI視頻生成框架。Tora深度融合了文本、視覺(jué)與軌跡條件,依托其
    的頭像 發(fā)表于 08-06 16:41 ?1429次閱讀