chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線(xiàn)課程
  • 觀(guān)看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

文生視頻Pika 1.0爆火!一句話(huà)生成視頻,普通人也能當(dāng)“導(dǎo)演”

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2023-12-01 01:08 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)11月29日,美國(guó)AI初創(chuàng)公司Pika labs發(fā)布了全新的文生視頻產(chǎn)品Pika 1.0,這款產(chǎn)品能夠生成和編輯3D動(dòng)畫(huà)、動(dòng)漫、卡通和電影。用Pika 1.0制作視頻幾乎不需要任何門(mén)檻,用戶(hù)只需要輸入一句話(huà),就可以生成想要的各種風(fēng)格的視頻,并通過(guò)簡(jiǎn)單的描述,更改視頻中的形象和風(fēng)格。

一句話(huà)生成視頻,顛覆傳統(tǒng)視頻制作

Pika成立于今年4月,創(chuàng)始人郭文景和聯(lián)合創(chuàng)始人兼CTO Chenlin Meng,都是斯坦福大學(xué)AI Lab博士生。一位專(zhuān)注于NLP(自然語(yǔ)言處理)和圖形學(xué),另一位主攻計(jì)算機(jī)視覺(jué)方向,都有生成式AI的學(xué)術(shù)經(jīng)歷。今年7月,Pika在Discord推出服務(wù)器,截至目前用戶(hù)已超50萬(wàn),每周能生成數(shù)百萬(wàn)個(gè)視頻。

11月29日,Pika Labs正式推出了最新一代視頻生成模型Pika 1.0。Pika 1.0 不僅對(duì)視頻生成質(zhì)量進(jìn)行了提升,還支持 3D 動(dòng)畫(huà)、動(dòng)漫或電影等多種風(fēng)格視頻。此外,用戶(hù)還能夠通過(guò) Pika 實(shí)現(xiàn)畫(huà)布延展、局部修改、視頻時(shí)長(zhǎng)拓展等編輯需求。

具體來(lái)看,Pika 1.0的效果有多驚艷。視頻生成方面,可以通過(guò)文字生成視頻,也可以圖片生成視頻。比如,只需輸入提示詞“馬斯克穿著太空服,3D動(dòng)畫(huà)”,一個(gè)動(dòng)畫(huà)版本、穿著太空服準(zhǔn)備乘坐火箭上太空的馬斯克即可生成,外形、動(dòng)作、背景等元素均十分逼真,可以媲美花大成本制作的3D動(dòng)畫(huà)影像。





這是文字生成視頻,另外也可以圖片配合提示詞生成視頻,圖片為第一幀,再用文字控制動(dòng)畫(huà)變化效果和鏡頭。比如,可以輕松讓名畫(huà)《最后的晚餐》變得生動(dòng)起來(lái)。



除了文字生成視頻,圖片生成視頻,還可以通過(guò)原有視頻生成更高質(zhì)量的視頻。其展示了一個(gè)騎馬的黑白原視頻,通過(guò)Pika 1.0生成了物種不同風(fēng)格的動(dòng)畫(huà),幾乎涵蓋現(xiàn)有電影和動(dòng)畫(huà)大部分風(fēng)格,看上去質(zhì)量效果非常好。



除了視頻生成,Pika 1.0還能夠進(jìn)行視頻編輯,用戶(hù)只需要選定編輯區(qū)域,就能根據(jù)文本提示詞修改特定區(qū)域。比如,不喜歡視頻中的衣服,可以輕松更換衣服的款式和顏色;只需要用鼠標(biāo)框一下,輸入“一副酷酷的太陽(yáng)鏡”,馬上就能給視頻中的狒狒帶上墨鏡。




此外,Pika 1.0還能夠修改輕松修改視頻尺寸。雖然這個(gè)技術(shù)在AI繪畫(huà)領(lǐng)域早就實(shí)現(xiàn)了,但是目前Pika第一個(gè)將其用在視頻領(lǐng)域。



總的來(lái)說(shuō),Pika 1.0的功能包括:文本生成視頻、圖像生成視頻功能,只需要輸入簡(jiǎn)單的文本描述,或上傳圖像配合文字,就可以創(chuàng)建高質(zhì)量的視頻;視頻風(fēng)格轉(zhuǎn)換;對(duì)視頻內(nèi)容進(jìn)行編輯,更改或者增加圖片里面的元素,還能夠更改視頻的寬高比尺寸等。

據(jù)稱(chēng),當(dāng)前Pika Labs團(tuán)隊(duì)僅有4位全職成員,但兼具學(xué)術(shù)和創(chuàng)意兩個(gè)領(lǐng)域的頂尖人才。Demi Guo 和 Chenlin Meng 同為 Stanford AILab 的博士研究人員,擁有頂尖的學(xué)術(shù)和科研經(jīng)歷;Karli Chen 作為團(tuán)隊(duì)第三位創(chuàng)始人及創(chuàng)始工程師擁有CMU的ML&CV碩士學(xué)位,Karlin 本科期間就在機(jī)器視覺(jué)公司 SenseTime 擔(dān)任工程師;Matan Cohen-Grumi則在創(chuàng)意領(lǐng)域經(jīng)驗(yàn)豐富。

在正式推出Pika 1.0的同一天,Pika也公開(kāi)透露,目前已完成A輪融資,籌資總額達(dá)到5500萬(wàn)美元。投資人包括OpenAI創(chuàng)始成員安德烈·卡帕西(Andrej Karpath)、Github前CEO納特·弗里德曼(Nat Friedman)、Quora創(chuàng)始人亞當(dāng)·迪安杰羅(Adam D'Angelo)等。

目前Pika 1.0已經(jīng)開(kāi)啟申請(qǐng)?jiān)囉?,該公司表示,正在努力修?a target="_blank">算法進(jìn)一步改進(jìn)模型,并開(kāi)發(fā)用于過(guò)濾受版權(quán)保護(hù)材料的模型。另外,目前Pika的產(chǎn)品還是免費(fèi)的,但最終可能會(huì)推出分層訂閱模式,付費(fèi)用戶(hù)能享受更多功能。同時(shí)Pika也在開(kāi)啟招聘計(jì)劃,包括技術(shù)、產(chǎn)品、運(yùn)營(yíng)等,預(yù)計(jì)明年會(huì)將團(tuán)隊(duì)擴(kuò)充到20人。

AI視頻生成技術(shù)的前景及挑戰(zhàn)

近段時(shí)間,除了Pika 1.0,已經(jīng)有多家企業(yè)發(fā)布新的視頻生成工具。11月16日,社交媒體巨頭Meta發(fā)布工具Emu Video,能夠基于文本和圖像輸入生成視頻剪輯。幾乎同時(shí),字節(jié)跳動(dòng)發(fā)布了PixelDance模型,通過(guò)描述(純文本)+首幀指導(dǎo)(圖片)+尾幀指導(dǎo)(圖片),即可生成包含復(fù)雜場(chǎng)景和動(dòng)作的視頻。

11月21日,Runway動(dòng)態(tài)筆刷Motion Brush面世,該工具發(fā)布的時(shí)候引起不小的關(guān)注,其特別之處在于,只需在任意圖片上抹一筆,就能讓其變成一段動(dòng)態(tài)視頻。作為最早探索視頻生成領(lǐng)域的領(lǐng)頭羊之一,過(guò)去一年,Runway先后發(fā)布了 Gen1、Gen2,此次推出的Motion Brush在可靠性上更是又向前邁進(jìn)一大步。



11月24日,專(zhuān)注于開(kāi)發(fā)人工智能產(chǎn)品的初創(chuàng)公司Stable AI發(fā)布了其最新的AI模型Stable Video Diffusion(穩(wěn)定視頻擴(kuò)散模型),這款模型能夠通過(guò)現(xiàn)有圖片生成視頻,是基于之前發(fā)布的Stable Diffusion文本轉(zhuǎn)圖片模型的延伸。

除此之外,Adobe也在文生視頻領(lǐng)域有新動(dòng)作。日前,該公司宣布已收購(gòu)AI視頻生成創(chuàng)業(yè)公司Rephrase.ai,后者主要通過(guò)AI技術(shù)將文本轉(zhuǎn)換為虛擬形象視頻。Adobe高級(jí)副總裁兼總經(jīng)理Ashley Still稱(chēng),Rephrase.ai團(tuán)隊(duì)在生成式AI音視頻技術(shù)、文本到視頻生成工具方面的專(zhuān)業(yè)知識(shí)將擴(kuò)展Adobe的生成式視頻功能。

從Adobe收購(gòu)Rephrase.ai,及國(guó)內(nèi)外企業(yè)紛紛布局AI視頻生成領(lǐng)域,可以看到,AI生成內(nèi)容大潮已經(jīng)逐漸從文本和圖片,進(jìn)一步轉(zhuǎn)向視頻生成。

當(dāng)前,短視頻、短劇市場(chǎng)方興未艾,AI視頻技術(shù)的不斷成熟和應(yīng)用,有望讓視頻創(chuàng)作更簡(jiǎn)單,成本更低。正如在Pika 1.0發(fā)布之際,OpenAI創(chuàng)始成員安德烈·卡帕西(Andrej Karpathy)在X平臺(tái)發(fā)文感慨“每個(gè)人都能成為多模式夢(mèng)想的導(dǎo)演,就像《盜夢(mèng)空間》中的建筑師一樣?!?br />
全世界最大的AI開(kāi)源社區(qū)Hugging Face的CEO克萊門(mén)特(Clement)表示:“2024年,某個(gè)主流媒體領(lǐng)域?qū)?huì)充斥AI生成的內(nèi)容。”

AI視頻生成有著可想象的美好前景,同時(shí)當(dāng)前來(lái)看,它也存在一些挑戰(zhàn)。它與此前的AI生成圖片有所不同,Pika Labs創(chuàng)始人Demi接受媒體采訪(fǎng)時(shí)表示,視頻有很多和圖片不一樣的問(wèn)題,比如要確保視頻的流暢性、確保動(dòng)作,視頻比圖像更大,需要更大的GPU內(nèi)存,視頻生成需要考慮邏輯問(wèn)題,還要考慮如何生成,是一幀一幀生成,還是一起生成,現(xiàn)在很多模型是一起生成,生成的視頻就很短。如果要一幀一幀生成,要怎么做,其實(shí)視頻生成有很多圖片生成不會(huì)面臨的新的技術(shù)問(wèn)題。

該公司的聯(lián)合創(chuàng)世人Chenlin談到,雖然視頻的每一幀都是一張圖片,但比圖片困難得多。每一幀的生成質(zhì)量要高,相鄰幀之間還要有關(guān)聯(lián)性。當(dāng)視頻很長(zhǎng)時(shí),確保每一幀都協(xié)調(diào)一致是個(gè)相當(dāng)復(fù)雜的問(wèn)題。在訓(xùn)練時(shí),處理視頻數(shù)據(jù)時(shí)要處理多張圖片,模型需要適應(yīng)這種情況。比如,如何將100幀圖片傳輸?shù)紾PU上是一個(gè)挑戰(zhàn)。而在推理時(shí),由于涉及到生成大量幀,推理速度相對(duì)于單張圖片會(huì)更慢,計(jì)算成本也會(huì)增加。

從目前的情況來(lái)看,雖然現(xiàn)在的AI視頻生成已經(jīng)展現(xiàn)出很驚人的效果,不過(guò)仍然面臨新的挑戰(zhàn),還有需要突破的地方,比如視頻的時(shí)長(zhǎng),清晰度等等,相關(guān)企業(yè)對(duì)此還需要持續(xù)探索。

總結(jié)

過(guò)去兩年,生成式AI大潮席卷全球,圖片生成率先火出圈并獲得大量使用,不少AI創(chuàng)業(yè)企業(yè)也因此實(shí)現(xiàn)盈利。如今,AI視頻生成逐漸成為創(chuàng)業(yè)企業(yè)及資本追逐的新熱點(diǎn),目前已經(jīng)有眾多企業(yè)推出相關(guān)產(chǎn)品,隨著Pika 1.0的發(fā)布,AI視頻生成技術(shù)也走上了一個(gè)新高度。可以想象,隨著技術(shù)的不斷突破,AI視頻生成技術(shù)將短視頻、短劇等行業(yè)帶來(lái)新的可能。








聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀(guān)點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    告別手忙腳亂!蜀瑞創(chuàng)新語(yǔ)音鍵順控,一句話(huà)搞定開(kāi)關(guān)柜

    語(yǔ)音鍵順控,不是簡(jiǎn)單加個(gè)語(yǔ)音功能,而是可視化 + 語(yǔ)音 + 五防 + 自動(dòng)順控的體化升級(jí) —— 讓開(kāi)關(guān)柜 “聽(tīng)得懂、做得準(zhǔn)、看得見(jiàn)”,把電力運(yùn)維從 “繁瑣人工” 推向 “智能語(yǔ)音” 時(shí)代。一句話(huà),搞定倒閘;
    的頭像 發(fā)表于 04-24 09:16 ?291次閱讀
    告別手忙腳亂!蜀瑞創(chuàng)新語(yǔ)音<b class='flag-5'>一</b>鍵順控,<b class='flag-5'>一句話(huà)</b>搞定開(kāi)關(guān)柜

    一句話(huà)讓大模型控制硬件:手把手教你給 EmbedClaw 添加自己的 Tool!

    很多人第次看到EmbedClaw會(huì)有種錯(cuò)覺(jué):然而事實(shí)是:不能直接操作,但可以通過(guò)Tool去操作。這也是EmbedClaw很有意思的點(diǎn)。它不是把大模型硬塞進(jìn)ESP32里當(dāng)聊天機(jī)器人
    的頭像 發(fā)表于 04-01 18:32 ?151次閱讀
    <b class='flag-5'>一句話(huà)</b>讓大模型控制硬件:手把手教你給 EmbedClaw 添加自己的 Tool!

    手把手教你打造個(gè)專(zhuān)屬小智AI機(jī)器人,零基礎(chǔ)能玩轉(zhuǎn)AI創(chuàng)客(附詳細(xì)教程資料及學(xué)習(xí)路線(xiàn))

    到底是什么,我們普通人零基礎(chǔ)怎么動(dòng)手打造,還有超多好玩的實(shí)戰(zhàn)項(xiàng)目可以跟著玩。01遍全網(wǎng)的小智AI,到底是什么?2024年9月小智AI正式開(kāi)源,短短幾個(gè)月就登
    的頭像 發(fā)表于 03-30 14:32 ?502次閱讀
    手把手教你打造<b class='flag-5'>一</b>個(gè)專(zhuān)屬小智AI機(jī)器人,零基礎(chǔ)<b class='flag-5'>也</b>能玩轉(zhuǎn)AI創(chuàng)客(附詳細(xì)教程資料及學(xué)習(xí)路線(xiàn))

    普通人能看懂的鋰電池外殼氣密性測(cè)試設(shè)備講解-岳信儀器

    鋰電池外殼氣密性測(cè)試設(shè)備,就是專(zhuān)門(mén)檢查外殼是否漏氣的“神器”,今天就用大白話(huà),給大家講明白它的作用、用法和注意事項(xiàng),普通人輕松看懂。首先,這款設(shè)備點(diǎn)都不復(fù)雜
    的頭像 發(fā)表于 03-27 14:25 ?226次閱讀
    <b class='flag-5'>普通人</b><b class='flag-5'>也</b>能看懂的鋰電池外殼氣密性測(cè)試設(shè)備講解-岳信儀器

    逆天了!把OpenClaw裝入ESP32-S3上是種什么體驗(yàn)

    最近小龍蝦OpenClaw實(shí)在是太火了,相信你或多或少都刷到過(guò)。如果一句話(huà)解釋什么是OpenClaw:款可以運(yùn)行在任何系統(tǒng)上的A
    的頭像 發(fā)表于 03-22 10:05 ?883次閱讀
    逆天了!把OpenClaw裝入ESP32-S3上是<b class='flag-5'>一</b>種什么體驗(yàn)

    EMMI-InGaAs 與 OBIRCH:分鐘教你看懂兩款失效定位設(shè)備原理與應(yīng)用

    一句話(huà)區(qū)別總結(jié) EMMI 看光 → 漏電、擊穿這類(lèi)“會(huì)發(fā)光的異?!? OBIRCH 看熱 → 金屬短路、高阻這類(lèi)“無(wú)光但致命的問(wèn)題”
    的頭像 發(fā)表于 12-05 16:21 ?1394次閱讀
    EMMI-InGaAs 與 OBIRCH:<b class='flag-5'>一</b>分鐘教你看懂兩款失效定位設(shè)備原理與應(yīng)用

    一句話(huà),多個(gè)命令同時(shí)執(zhí)行,AI語(yǔ)音模組多任務(wù)處理?

    、 Ai-WV02-32S ? 將語(yǔ)音識(shí)別、喚醒、語(yǔ)義理解等核心功能, 濃縮在顆小小的模組中。 安信可AI語(yǔ)音模組支持 MCP 協(xié)議(Multi Command Processing,多命令并行處理) ,讓語(yǔ)音交互從“單線(xiàn)程”進(jìn)化為真正的“多任務(wù)協(xié)同”! 一句話(huà)喚醒“
    的頭像 發(fā)表于 10-31 14:45 ?690次閱讀
    <b class='flag-5'>一句話(huà)</b>,多個(gè)命令同時(shí)執(zhí)行,AI語(yǔ)音模組<b class='flag-5'>也</b><b class='flag-5'>能</b>多任務(wù)處理?

    真正免費(fèi)的AI生成PPT工具盤(pán)點(diǎn):告別收費(fèi)陷阱

    的戰(zhàn)斗機(jī)",其他9款工具各有絕活,保證讓你告別收費(fèi)陷阱,輕松做出專(zhuān)業(yè)級(jí)PPT! 、AiPPT:一句話(huà)生成PPT的"時(shí)間管理大師" 一句話(huà)
    的頭像 發(fā)表于 10-30 15:43 ?6954次閱讀
    真正免費(fèi)的AI<b class='flag-5'>生成</b>PPT工具盤(pán)點(diǎn):告別收費(fèi)陷阱

    智多晶SA5T-200 FPGA開(kāi)發(fā)板重磅發(fā)布

    在科技飛速發(fā)展的今天,硬件與軟件的融合正不斷重塑我們的世界。而在芯片領(lǐng)域,流傳著這樣一句話(huà):“軟件定義世界,F(xiàn)PGA定義未來(lái)”。
    的頭像 發(fā)表于 10-11 11:45 ?1179次閱讀

    全球首個(gè)動(dòng)漫專(zhuān)屬AI視頻生成平臺(tái)Animon,國(guó)內(nèi)版&quot;萌動(dòng)AI&quot;正式發(fā)布

    平臺(tái)Animon正式推出國(guó)內(nèi)版產(chǎn)品——"萌動(dòng)AI",為數(shù)億創(chuàng)作者帶來(lái)視覺(jué)革命。該平臺(tái)由專(zhuān)業(yè)的動(dòng)漫制作團(tuán)隊(duì)和頂尖的AI技術(shù)團(tuán)隊(duì)聯(lián)合打造,并將專(zhuān)為專(zhuān)業(yè)創(chuàng)作團(tuán)隊(duì)和個(gè)人工作室設(shè)計(jì)的Animon工作室版本同步推向中國(guó)創(chuàng)作者,致力于讓每個(gè)擁有想象力的普通人,都能輕松成為自己的動(dòng)漫
    的頭像 發(fā)表于 09-25 12:33 ?1367次閱讀

    遠(yuǎn)程控制電表:不在現(xiàn)場(chǎng),鍵斷電”

    催收難、斷電靠跑腿”的困境,實(shí)現(xiàn)用電管理的自動(dòng)化和遠(yuǎn)程化,是現(xiàn)代集中用電場(chǎng)景的“強(qiáng)管控利器”。、傳統(tǒng)斷電有多難?一句話(huà):人得跑,事難辦過(guò)去處理欠費(fèi)或退房,只能靠
    的頭像 發(fā)表于 09-17 16:38 ?2301次閱讀
    遠(yuǎn)程控制電表:不在現(xiàn)場(chǎng),<b class='flag-5'>也</b><b class='flag-5'>能</b>“<b class='flag-5'>一</b>鍵斷電”

    一句話(huà)了解21種計(jì)算模式

    、智能化趨勢(shì)、安全與可持續(xù)四個(gè)維度,梳理了21種計(jì)算模式,并盡量用通俗易懂的一句話(huà)向您介紹每種模式的定義。架構(gòu)與資源維度并行計(jì)算:把大任務(wù)拆成多個(gè)小任務(wù),讓多顆處理器
    的頭像 發(fā)表于 08-06 14:31 ?868次閱讀
    <b class='flag-5'>一句話(huà)</b>了解21種計(jì)算模式

    2025 AI主戰(zhàn)場(chǎng),連鎖門(mén)店“變形記”

    讓業(yè)務(wù)駕馭AI,當(dāng)大模型的價(jià)值通過(guò)“取漢堡更快”“一句話(huà)點(diǎn)咖啡”來(lái)實(shí)現(xiàn),這場(chǎng)技術(shù)變革才算真正落地
    的頭像 發(fā)表于 07-24 12:41 ?1400次閱讀
    2025 AI主戰(zhàn)場(chǎng),連鎖門(mén)店“變形記”

    一句話(huà)秒出PPT“的榮耀YOYO,AI生產(chǎn)力有多強(qiáng)?

    釋放AI生產(chǎn)力,榮耀讓智能體告別發(fā)布會(huì)炫技
    的頭像 發(fā)表于 07-14 14:15 ?2833次閱讀
    “<b class='flag-5'>一句話(huà)</b>秒出PPT“的榮耀YOYO,AI生產(chǎn)力有多強(qiáng)?

    4K、多模態(tài)、長(zhǎng)視頻:AI視頻生成的下個(gè)戰(zhàn)場(chǎng),誰(shuí)在領(lǐng)跑?

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎) 6月11日,豆包App上線(xiàn)視頻生成模型豆包Seedance 1.0 pro。這是字節(jié)跳動(dòng)最新視頻模型,支持文字與圖片輸入,可生成多鏡頭無(wú)縫切換的1080
    的頭像 發(fā)表于 06-16 00:13 ?7571次閱讀