chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Sora到底牛在哪 | AI爆發(fā)的大趨勢下,普通人真正該學(xué)的是什么

王嵐 ? 來源:jf_23355247 ? 作者:jf_23355247 ? 2024-03-06 22:46 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Sora炸裂了的地方,在于它能理解自然語言,知道那個畫面該是怎么樣的,它學(xué)習(xí)很多視頻內(nèi)容(大力出奇跡,需要很多算力),而且一上來就是能制作60s的視頻,剛好是短視頻的需求,之前的AI視頻生成的時間都很短(幾秒鐘).

就說Sora有多火吧,生成的視頻上線一個,瘋傳一個。

明顯能看出來Sora生成的視頻中的各項細節(jié)都讓人驚嘆,一如去年的ChatGPT,Sora被認為是AGI(通用人工智能)的又一個里程碑時刻。

一.sora的出現(xiàn)可以如何看待:

對于許多行業(yè)來說,都應(yīng)該關(guān)注Open AI和sora這些人工智能相關(guān)的產(chǎn)品。

尤其是對設(shè)計領(lǐng)域來說,比如以前做logo、做海報、宣傳冊、做操作視頻剪輯、拍攝等等相關(guān)的行業(yè)。

其一是思考,面對這些新技術(shù)、新工具,對自己有哪些挑戰(zhàn),應(yīng)對策略是什么。

其二是結(jié)合,基于自己當前的業(yè)務(wù),哪些可以利用這些技術(shù)進行結(jié)合,從而提升自己的效率和業(yè)務(wù)場景。

比如美圖秀秀、稿定設(shè)計、剪映等產(chǎn)品,就基于AI立馬推出了相關(guān)的產(chǎn)品。

(PS:目前 openai 官方還未開放 sora 灰度,不過根據(jù)文生圖模型 DALL·E 案例,一定是先給 ChatGPT Plus 付費用戶使用,需要注冊或者升級 GPT Plus 可以看這個教程:升級 ChatGPT Plus 的教程,一分鐘完成升級)

二. 以終為始地看,AI爆發(fā)的大趨勢下,普通人真正該學(xué)的是什么?

我覺得有三點:講故事的能力、結(jié)構(gòu)化思考力和內(nèi)容專業(yè)力。

1. 講故事的能力

以文生視頻為例,先不說Sora,很多人連Pika、Runway都用不利索。

用文字描述一件事、一個觀點、一個訴求并不難,但描述一段畫面、一個場景、一則完整故事,對絕大多數(shù)人是極高的門檻。

Sora不會讓影視行業(yè)失業(yè),正相反,如果視頻生成的AI技術(shù)持續(xù)普及,會讓真正會寫故事的人發(fā)揮才能,而不是受限于影視行業(yè)的潛規(guī)則而灰心放棄。

2. 結(jié)構(gòu)化思考力

很多寫Sora的文章,都在講它在模型算法、算力涌現(xiàn)、物理模擬上的創(chuàng)新。對我而言,會更驚訝它在訓(xùn)練視頻數(shù)據(jù)時,以一種結(jié)構(gòu)化提示詞方法,解決了視頻標注問題:

“We first train a highly descriptive captioner model and then use it to produce text captions for all videos in our training set”

本質(zhì)上看,無論是B端訓(xùn)練數(shù)據(jù),還是C端和大模型對話,都用到了結(jié)構(gòu)化表達能力。包括那些所謂“Sora培訓(xùn)”,其實教你的也是怎么寫好提示詞。舉個例子,對這樣的場景:

該怎么描述呢?一個在沉思的老爺爺?一個戴眼鏡的老爺爺?一個在咖啡廳發(fā)呆的老爺爺?可能大部分人想到這兒就結(jié)束了。但更加結(jié)構(gòu)化的描述可以是:

主體人物::一位 60 多歲留著胡須的白發(fā)老人

鏡頭景別:臉部特寫

背景環(huán)境:巴黎的一家咖啡館

人物狀態(tài):注視著窗外行走的人們,一動不動陷入沉思,后又抿嘴微微一笑

人物細節(jié):穿著一件羊毛大衣和一件紐扣襯衫、頭戴棕色貝雷帽,戴著眼鏡,像是個教授

環(huán)境細節(jié):金色的燈光和背景中的巴黎街道和城市

鏡頭技術(shù):景深、35 毫米電影膠片,有電影感

具備寫出上述提示詞的能力,才能真正發(fā)揮多模態(tài)技術(shù)的價值。這背后蘊含著的,就是結(jié)構(gòu)化總結(jié)和思考能力。

有句話很形象,寫提示詞就像客戶講brief,能把需求說清楚,就離正確答案不遠了。

3. 內(nèi)容專業(yè)力

這點又說回到創(chuàng)作者本身,我比較喜歡楊遠騁老師(「躺島」和「新世相」聯(lián)合創(chuàng)始人)的一個觀點:

最大的影響會是出現(xiàn)新的創(chuàng)作者,會出現(xiàn)完全不在人們視野里的新的內(nèi)容偶像,他們有非常好的品位、思維方式和世界觀,但受限于表達技術(shù),在過去卻連基本的視頻制作能力都不具備。

Koji,公眾號:十字路口CrossingSora 喧囂過后,理性浮現(xiàn) | 我問出了這 5 位頂級創(chuàng)作者的真實想法

是的,除了上文提到的講故事能力。如果你具備對“好內(nèi)容”的理解力,懂得怎樣更合理地設(shè)計腳本、做分鏡、上特效、畫故事板、運鏡、調(diào)度、選角、布景、調(diào)光、配音、后期等等,AI就是你發(fā)揮想象力最好的幫手。能用好 AI 的人,一定能做出更好作品、獲得更多收入。

因此我堅定地認為,這波AI趨勢,對高潛力的作家、畫手、設(shè)計師、編劇等創(chuàng)作者,是絕對的利好。如果你也想從中獲益,先把“創(chuàng)作一部好內(nèi)容”作為目標學(xué)起來吧。

總的來講,我認為圍著Sora去追新聞沒啥必要。能跳出對Sora本身鋪天蓋地的宣傳,去思考這背后該真正掌握的技能是什么。用結(jié)構(gòu)化思維去訓(xùn)練講故事的能力,成為一名優(yōu)秀創(chuàng)作者,才是值得為此付出時間的。

三、sora原理常見問題及解答:

Q:訓(xùn)練數(shù)據(jù)的一個 clip 中如果有場景/鏡頭的切換,那 casual 3D CNN 還是會和過往的幀都有關(guān)系嗎?

A:訓(xùn)練數(shù)據(jù)中大概率是有:一個 clip 有鏡頭/場景的切換。如果有切換,那么使用 casual 3D CNN 可能會帶來問題:在切換前后的內(nèi)容是不同的,不僅會增加模型訓(xùn)練難度,也會帶來瑕疵。這個可能就直接訓(xùn)練了,通過相應(yīng)數(shù)據(jù)的訓(xùn)練就能解決。


Q:訓(xùn)練數(shù)據(jù)的來源?

A:大家猜測有 1)youtube 的視頻。2)Shutterstock,之前有公告:Shutterstock 擴大與 OpenAI 的合作伙伴關(guān)系,簽署新的六年協(xié)議以提供高質(zhì)量的訓(xùn)練數(shù)據(jù):渲染引擎的數(shù)據(jù),這個網(wǎng)絡(luò)上大家貼出了一些間接證據(jù)。渲染引擎的數(shù)據(jù)能夠針對性地模擬出很多符合 3D 一致性、物理一致性的數(shù)據(jù),對于模型的訓(xùn)練應(yīng)該有很好的幫助。


Q:輸出變長的長度、分辨率和長寬比是如何做到的?

A:1. diffusion 過程中,輸入的 noise tokens 就添加 factorized positional embedding。比如最直接的實現(xiàn)方式,每個 token 對應(yīng)有三個數(shù)字(t, h, w)分別表示時間、長和寬,然后添加相應(yīng)的 position embedding 去區(qū)分。

訓(xùn)練的時候也采用了變長的長度、分辨率和長寬比。這些 examples 模型在訓(xùn)練的時候見過。

這樣,可以做到技術(shù)報告中提到的:At inference time, we can control the size of generated videos by arranging randomly-initialized patches in an appropriately-sized grid。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39911

    瀏覽量

    301538
  • ChatGPT
    +關(guān)注

    關(guān)注

    31

    文章

    1598

    瀏覽量

    10297
  • Sora
    +關(guān)注

    關(guān)注

    0

    文章

    87

    瀏覽量

    810
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    OpenClaw 落地新選擇!視美泰 AI 主機盒率先適配,打造人人能用的本地智能體

    什么?簡單說,OpenClaw是一款能部署在本地的開源AI智能體,主打一個“說句話就能干活”,打破了傳統(tǒng)AI聊天機器人“只對話不落地”的問題,不用懂編程,普通人用自然語言
    的頭像 發(fā)表于 03-02 17:03 ?1350次閱讀
    OpenClaw 落地新選擇!視美泰 <b class='flag-5'>AI</b> 主機盒率先適配,打造人人能用的本地智能體

    想請教一,在哪兒可以找到教材,使用Mixly 來作進一步修改AI 小智聊天機寸的程式在ESP32 開發(fā)板

    我在網(wǎng)上買了用ESP32S3 開發(fā)板自己接線的小智AI 聊天機械人,想請教一在哪兒可以找到教材,使用Mixly 來作進一步修改AI 小智聊天機寸的程式,例如我可以邊和小智
    發(fā)表于 01-28 15:01

    華為發(fā)布2026充電網(wǎng)絡(luò)產(chǎn)業(yè)十大趨勢

    1月16日,華為以“讓有路的地方就有高質(zhì)量充電”為主題,舉辦2026充電網(wǎng)絡(luò)產(chǎn)業(yè)十大趨勢發(fā)布會。華為智能充電網(wǎng)絡(luò)領(lǐng)域總裁王志武從產(chǎn)業(yè)與技術(shù)多重維度全面解讀,正式發(fā)布2026充電網(wǎng)絡(luò)產(chǎn)業(yè)十大趨勢。
    的頭像 發(fā)表于 01-21 09:38 ?492次閱讀

    華為發(fā)布2026智能光伏十大趨勢

    華為數(shù)字能源以“全場景構(gòu)網(wǎng),激發(fā)AI潛能,鑄就高質(zhì)量,加速光風(fēng)儲成為主力電源”為主題,舉辦2026智能光伏十大趨勢發(fā)布會。華為數(shù)字能源智能光伏業(yè)務(wù)副總裁、首席營銷官鐘明明重磅發(fā)布了智能光伏十大趨勢和白皮書,為光風(fēng)儲加速成為新型電
    的頭像 發(fā)表于 01-14 14:56 ?522次閱讀

    使用ROHM Solist-AI技術(shù)讓你在MCU上玩轉(zhuǎn)AI

    今天,人工智能 (AI) 正在以超乎想象的速度迅猛發(fā)展,在這一大背景,有兩大趨勢特別值得關(guān)注:一個趨勢是近兩年基于大模型的生成式AI的狂飆
    的頭像 發(fā)表于 12-24 14:26 ?1177次閱讀
    使用ROHM Solist-<b class='flag-5'>AI</b>技術(shù)讓你在MCU上玩轉(zhuǎn)<b class='flag-5'>AI</b>

    知存科技王紹迪:AI可穿戴需求爆發(fā),存算一體成主流AI芯片架構(gòu)

    王紹迪指出,國內(nèi)半導(dǎo)體行業(yè)尤其芯片設(shè)計業(yè)仍將保持快速增長的趨勢,核心動力主要還是來自AI大模型、具身智能等應(yīng)用的爆發(fā)式需求,2025年設(shè)計業(yè)29.4%的高增速也印證了行業(yè)活力。2026年,機遇主要
    的頭像 發(fā)表于 12-23 09:34 ?9673次閱讀
    知存科技王紹迪:<b class='flag-5'>AI</b>可穿戴需求<b class='flag-5'>爆發(fā)</b>,存算一體成主流<b class='flag-5'>AI</b>芯片架構(gòu)

    一文淺談2026年五大趨勢

    ? -?????? IBM 商業(yè)價值研究院發(fā)布商業(yè)領(lǐng)袖需要關(guān)注的五大趨勢 北京, Dec. 15, 2025 /PRNewswire/ -- 近日,IBM商業(yè)價值研究院發(fā)布 《2026年五大趨勢
    的頭像 發(fā)表于 12-15 17:09 ?865次閱讀
    一文淺談2026年五<b class='flag-5'>大趨勢</b>

    系統(tǒng)調(diào)用和API有什么區(qū)別呢?

    到這一點呢?很簡單實際上就是賦予不同的人不同的權(quán)限,只有銀行工作人員才有權(quán)限進出金庫、存取現(xiàn)金,普通人如果進入金庫是會觸發(fā)報警的,也就是說普通人沒有權(quán)限來進出金庫。 實際上計算機中的程序也有不同的權(quán)限,普通
    發(fā)表于 12-03 06:52

    OpenAI Sora 2模型上線微軟Azure AI Foundry國際版

    我們非常激動地宣布,OpenAI 的新一代多模態(tài)視頻生成模型 Sora 2 現(xiàn)已在 Azure AI Foundry(國際版)上線,進入公共預(yù)覽階段。
    的頭像 發(fā)表于 10-22 09:44 ?785次閱讀
    OpenAI <b class='flag-5'>Sora</b> 2模型上線微軟Azure <b class='flag-5'>AI</b> Foundry國際版

    全球首個動漫專屬AI視頻生成平臺Animon,國內(nèi)版&quot;萌動AI&quot;正式發(fā)布

    生成平臺Animon正式推出國內(nèi)版產(chǎn)品——"萌動AI",為數(shù)億創(chuàng)作者帶來視覺革命。該平臺由專業(yè)的動漫制作團隊和頂尖的AI技術(shù)團隊聯(lián)合打造,并將專為專業(yè)創(chuàng)作團隊和個人工作室設(shè)計的Animon工作室版本同步推向中國創(chuàng)作者,致力于讓每一個擁有想象力的
    的頭像 發(fā)表于 09-25 12:33 ?965次閱讀

    2025 AI玩具元年,技術(shù)、政策、資本共振的產(chǎn)業(yè)爆發(fā)

    電子發(fā)燒友網(wǎng)綜合報道 今年以來,AI玩具市場進入到了技術(shù)、政策、資本三線共振的爆發(fā)期,2025年也被成為AI玩具的元年。近期,由京東聯(lián)合深圳市玩具行業(yè)協(xié)會發(fā)布《2025 AI玩具消費
    的頭像 發(fā)表于 08-31 07:14 ?4829次閱讀

    2025人工智能十大趨勢

    在2025世界人工智能大會·騰訊論壇上,騰訊研究院聯(lián)合騰訊優(yōu)圖實驗室、騰訊云智能、騰訊科技聯(lián)合發(fā)布了《共生伙伴:2025人工智能十大趨勢》報告。基于騰訊研究院多位研究員對全球技術(shù)、產(chǎn)業(yè)趨勢的長期觀察
    的頭像 發(fā)表于 08-05 11:42 ?5882次閱讀
    2025人工智能十<b class='flag-5'>大趨勢</b>

    Gartner 發(fā)布2025年中國人工智能十大趨勢

    本文來源:Gartner公司Gartner發(fā)布2025年中國人工智能(AI)十大趨勢。企業(yè)不應(yīng)流連于夸大其詞的宣傳或陷入到過度炒作所帶來的恐懼中,而是應(yīng)該關(guān)注AI的可持續(xù)的發(fā)展路徑、實際的經(jīng)濟效益
    的頭像 發(fā)表于 06-30 11:20 ?1266次閱讀
    Gartner 發(fā)布2025年中國人工智能十<b class='flag-5'>大趨勢</b>

    Gartner發(fā)布云技術(shù)發(fā)展的六大趨勢

    Gartner發(fā)布未來四年云技術(shù)發(fā)展的六大趨勢,包括對云技術(shù)不滿、人工智能/機器學(xué)習(xí)(AI/ML)、多云和跨云、可持續(xù)性、數(shù)字主權(quán)以及行業(yè)解決方案。Gartner顧問總監(jiān)JoeRogus表示:“這些
    的頭像 發(fā)表于 05-19 11:40 ?1036次閱讀
    Gartner發(fā)布云技術(shù)發(fā)展的六<b class='flag-5'>大趨勢</b>

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》

    《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》是一本為普通人量身打造的AI開發(fā)指南。它不僅深入淺出地講解了Agent的概念和發(fā)展,還通過詳細的工具介紹和實戰(zhàn)案例,幫助讀者快速掌握
    發(fā)表于 03-18 12:03