chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌新一代生成式AI媒體模型登陸Vertex AI平臺

谷歌開發(fā)者 ? 來源:谷歌云服務 ? 2025-06-18 09:56 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于谷歌云服務,作者 Google Cloud

Katie Nguyen

開發(fā)者關系工程師

我們在Vertex AI上推出新一代生成式 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。

我們已經(jīng)看到有客戶使用 Imagen 3 (Google 的圖像生成模型) 生成出令人驚艷、栩栩如生的圖像。并通過 Veo 2 將這些圖像轉化為高質量的視頻和素材。我們甚至看到客戶將這些引人注目的視頻,通過 Lyria (Google 先進的 AI 音樂生成模型) 生成專業(yè)級音頻,賦予其生命力。

隨著生成式 AI 媒體在市場營銷、媒體等領域的廣泛應用,講述故事變得前所未有的簡單。用戶可以更快地創(chuàng)建廣告素材,并打造突破性的創(chuàng)意內容。接下來,讓我們來了解一下每個模型,并指導您如何立即開始使用。

Imagen 4: 更高質量的圖像生成

我們宣布 Imagen 4 文本轉圖像生成功能在 Vertex AI 上推出公開預覽版。作為 Google 最高質量的圖像生成模型,Imagen 4 提供以下功能:

●出色的文本渲染和提示詞遵循性

●在所有風格下都能實現(xiàn)更高的整體圖像質量

●支持多語言的提示詞,助力全球創(chuàng)作者

提示詞:捕捉一個親密的特寫鏡頭,沐浴在溫暖柔和的午后陽光中,陽光透過窗戶灑入一間典型的 1960 年代廚房。焦點是一個迷人設計的全能面粉復古包裝,愜意地擺放在帶有斑點的防火板 (Formica) 臺面上。包裝本身喚起了純粹的懷舊感: 也許是厚厚的、略有質感的暖奶油色紙張,上面裝飾著簡單粗獷的排版 (友好的襯線字體或手寫字體) 以經(jīng)典的紅色和藍色標示 "ALL-PURPOSE FLOUR (通用面粉)",并且配有一個美麗的插圖,比如風格化的小麥穗或一個愉快的面包師形象。包裝底部用較小的粗體字打印著:"凈重 5 磅 (80 盎司) 2.27 公斤"。清晰對焦于包裝的細節(jié)——紙袋略顯柔和的邊緣、復古印刷的質感、以及引人注目的 "通用面粉" 字樣。1960 年代廚房的微妙元素構成了畫面的背景——臺面的鍍鉻邊緣柔和地閃著光,模糊中可以看到淡黃色瓷磚的墻面,或者一個略微失焦的復古金屬罐的一角。淺景深讓注意力鎖定在設計精美的包裝上,營造出一種充滿溫暖、真實和懷舊魅力的美感。

提示詞:這部四格漫畫采用了一種迷人的、刻意像素化的藝術風格,讓人聯(lián)想起經(jīng)典的 8 位電子游戲,以簡單的形狀和有限而明亮的調色板為主,主要以綠色、藍色、棕色和恐龍標志性的灰黑色為主,場景設定在一個風格化的像素海灘。第一格展示了我們熟悉的谷歌瀏覽器小恐龍 (T-Rex),它有著標志性的像素化外形,戴著小小的像素太陽鏡,躺在像素化的沙灘巾上,沐浴在塊狀的黃色陽光下。背景中,像素化的棕櫚樹在藍色像素天空的映襯下輕輕搖曳。一個帶有像素化字體的標題框寫著:"Even error messages need a vacation.(就算是錯誤信息也需要放個假)" 第二格是小恐龍正試圖建造一座像素沙堡的特寫。它笨拙地用它小小的像素化的手臂拍打著一堆棕色像素塊,一副專注的樣子。周圍的沙灘上點綴著一些小小的像素化貝殼。第三格描繪了小恐龍歡快地跳過海灘附近種植的一系列像素化仙人掌,模擬它在游戲中的避障動作。每次跳躍上方都會出現(xiàn) "Boing!Boing!(蹦!蹦!)" 的短促音效文字,并以塊狀字體顯示。一只像素化的螃蟹在一旁注視著,揮舞著它的像素蟹鉗。最后一格描繪了小恐龍平靜地仰面漂浮在塊狀藍色像素水中,墨鏡依然戴著,表情滿足。上方有一個小小的思維泡泡,里面是像素化的 "Zzz……",表示它正在放松。

提示詞:以電影般的鏡頭從駕駛座拍攝,清晰地展現(xiàn)前排乘客座位上那位有著醒目紅發(fā)的年輕乘客的側面輪廓。她目光凝視前方,專注于觀察著透過側窗可見的塵土飛揚、孤寂的公路。側窗模糊映照著一片廣闊干涸的干地,或許還有遠處朦朧的群山。她的手臂搭在窗臺或方向盤上。鏡頭中還捕捉到了她身旁那輛老舊卡車內飾的一部分——車門面板,或許還有一絲磨損的座椅面料。光線可能是午后的陽光,在她臉上和卡車內部投下長長的陰影和溫暖的高光。這個角度凸顯了她在廣闊空曠的景色中獨自的存在和沉思的狀態(tài)。

要在 Vertex AI 上開始訪問處于公開預覽階段的 Imagen 4,您可以使用 Media Studio 或運行以下代碼示例,該示例使用適用于 Python 的 Google Gen AI SDK。

fromgoogleimportgenai

# TODO(developer): Update and un-comment below lines
# project_id = "PROJECT_ID"
client = genai.Client(vertexai=True, project=project_id, location="us-central1")

prompt ="""
A white wall with two Art Deco travel posters mounted. First poster has the text: "NEPTUNE", tagline: "The jewel of the solar system!' Second poster has the text: "JUPITER", tagline: "Travel with the giants!
"""

image = client.models.generate_images(
 model="imagen-4.0-generate-preview-05-20",
 prompt=prompt,
)

# OPTIONAL: View the generated image in a notebook
# image.generated_images[0].image.show()

Veo 3: 生成有音頻和語音的高質量視頻

Veo 3 是我們最新推出的、來自 Google DeepMind 的先進視頻生成模型。借助 Veo 3,您可以生成以下類型的視頻:

●從文本和圖像提示詞生成視頻時,質量得到提升

●語音,例如對話和旁白

●音頻,例如音樂和音效

以下是一些客戶對 Veo 帶來的生產(chǎn)力和創(chuàng)造力提升的評價:

數(shù)字支付領域的領導者Klarna正在利用 Vertex AI 上的 Veo 和 Imagen 來提升內容創(chuàng)作效率。從B-roll (補充鏡頭) 到 YouTube 視頻的片頭片尾,該公司正在顯著縮短制作周期。

"在 Klarna,我們不斷探索突破營銷創(chuàng)新界限的方法,而 Veo 徹底改變了我們的創(chuàng)意工作流程。借助 Veo 和 Imagen,過去耗時耗力的制作流程轉變成了快速高效的任務,使我們能夠快速擴展內容創(chuàng)作規(guī)模。無論是制作吸引人的 B-roll、打造引人注目的 YouTube 片頭,還是開發(fā)生動的社交媒體動畫,這些工具都讓我們的團隊更加靈活和富有創(chuàng)造力。結果顯而易見,它們帶來了更高的參與度和內容表現(xiàn)。借助 Google Cloud,我們正在為未來的業(yè)務發(fā)展奠定基礎,并徹底改變我們品牌煥發(fā)生機的方式。"—— Klarna 首席營銷官 David Sandstr?m

Jellyfish是 Brandtech 集團旗下一家知名的數(shù)字營銷公司,已將 Veo 集成到其性能卓越的 AI 營銷平臺 Pencil 中,并與日本航空合作,提供 AI 生成的機上娛樂服務。

"Veo 2 與 Pencil 的結合,進一步強化了我們致力于賦能市場營銷人員的承諾。利用先進的 AI,使他們能夠制作出不僅更智能、更快速,同時也更大膽、更富藝術靈感的營銷活動。我們的試點項目取得了令人矚目的成果,成本和產(chǎn)品上市時間平均降低了 50%。這種在控制和質量上的重大改進,能夠在幾分鐘內將之前不可能實現(xiàn)的創(chuàng)意轉化為真實的營銷內容。日本航空公司 (Japan Airlines) 在將生成式 AI 應用于旅游行業(yè)方面處于領先地位,我們期待看到其他品牌效仿。"—— Brandtech 創(chuàng)始人兼首席執(zhí)行官 David Jones

卡夫亨氏 (Kraft Heinz)的 Tastemaker 平臺使其團隊能夠訪問 Imagen 和 Veo,從而顯著加快創(chuàng)意和營銷活動的開發(fā)流程。

"使用 Vertex AI 上的 Veo 和 Imagen 作為我們 Tastemaker 平臺的一部分,卡夫亨氏的創(chuàng)意工作流程實現(xiàn)了前所未有的速度和效率。以前需要八周才能完成的工作現(xiàn)在只需八小時,從而大幅節(jié)省了成本。"——數(shù)字體驗與增長主管 Justin Thomas

Envato是全球領先的數(shù)字創(chuàng)意資源和模板提供商,該公司使用 Veo 2 開發(fā)了其最新推出的視頻生成功能 VideoGen,旨在幫助創(chuàng)意專業(yè)人士將文本或圖像轉換為超逼真和電影般的視頻內容。

"我們嘗試過許多頂級的視頻模型,而 Veo 2 在處理各種文本和圖像輸入時,在速度和質量方面都取得了令人印象深刻的效果。在推出后的最初幾天內,就有數(shù)萬名 Envato 訂閱用戶訪問了 VideoGen,他們生成的視頻中近 60% 被下載用于創(chuàng)意項目。自 3 月份以來,Envato 的 VideoGen 使用量逐月增長超過 100%。與 Google Cloud 合作,通過 Veo 將 Envato 的 VideoGen 功能變?yōu)楝F(xiàn)實,這令人非常愉快。"——Envato AI 產(chǎn)品負責人 Aaron Rutley

了解其工作方式:Veo 3 能夠處理復雜的提示詞細節(jié),如以下示例所示。

提示詞:中景鏡頭,歷史冒險場景:溫暖的燈光照亮了一位制圖師,他正坐在雜亂的書房里,仔細端詳著一張攤在大桌子上的古老而雜亂的地圖。制圖師:"根據(jù)這張古老的海圖,那座失落的島嶼并非神話!我們必須立即準備一次探險!"

提示詞:低角度鏡頭展示了一扇敞開的淡紫色大門,從一間有著淺紫色墻壁和灰色地板的房間通向一個生機勃勃的戶外場景。茂盛的綠草和野花從門口蔓延到室內地板,在空間之間營造出一種奇妙的過渡。門外,連綿起伏的綠色山丘上點綴著更多的野花,綿延至明亮清澈的天空。一棵樹矗立在戶外場景的前景中,它的葉子為視野增添了深度。陽光和自然元素與室內空間的簡約形成對比,引人產(chǎn)生奇妙和想要逃離的感覺。

Veo 3 目前在 Vertex AI 上提供私有預覽版,并將在未來幾周內更廣泛地推出。

Lyria 2: 通過音樂生成實現(xiàn)更強大的創(chuàng)意控制

在 Google Cloud Next 2025 大會上,我們宣布了在 Vertex AI 中推出 Google 的文本轉音樂模型 Lyria。我們宣布 Lyria 2 已在 Vertex AI 中正式發(fā)布。作為 Google 最新的音樂生成模型,Lyria 2 能夠生成多種風格的高保真音樂。作為您下一個創(chuàng)意合作伙伴,Lyria 2 提供以下功能:

●從文本提示詞生成高品質音頻內容

●更好地控制樂器、BPM 和其他特征進行更強的創(chuàng)意控制

要開始使用 Lyria 2 創(chuàng)建內容,請查看 Vertex AI 上的 Media Studio。之后,您可以根據(jù)文本提示詞生成音樂,或通過 Vertex AI 訪問模型 API。想要獲取靈感,請查看下面的一些音樂片段和提示詞。

提示詞:節(jié)奏明快、充滿迷幻色彩的秘魯坎比亞音樂 (Peruvian Cumbia),用于洛杉磯拉丁音樂節(jié)現(xiàn)場演出。融合電吉他、貝斯,并突出使用定音鼓打擊樂部分,營造出強勁有力、適合跳舞的氛圍。充滿活力和能量。

提示詞:氣勢恢宏的管弦樂電影配樂,倫敦原生錄音室錄制,百人管弦樂隊演繹,音樂風格氣勢恢宏,深邃。融合高亢的旋律、戲劇性的和聲變化以及強勁的打擊樂元素,樂器包括圓號、弦樂、定音鼓。并以主題性手法演繹,具有復雜的編曲、寬廣的動態(tài)范圍和深刻的情感,營造出電影般恢弘且令人敬畏的氛圍。

看看我們的一些客戶到目前為止對 Lyria 2 的評價:

Captions是一款 AI 驅動的視頻創(chuàng)作工具,可幫助用戶快速輕松地創(chuàng)建工作室級別的有聲視頻。他們已將 Lyria 2 集成到 Mirage Edit 功能中,使用戶能夠快速生成帶有自定義聲音的完整視頻。

"在 Captions,我們的 Mirage Edit 功能已經(jīng)讓訂閱用戶能夠通過提示詞便可生成經(jīng)過完整編輯的 AI 有聲視頻,包括圖像、B-roll (補充) 片段、旁白和過渡效果?,F(xiàn)在,我們又添加了一個關鍵元素: 由 Google Lyria 2 提供支持的自適應音樂。只需一個提示詞,Lyria 就能創(chuàng)作出與劇本、節(jié)奏和每個情緒節(jié)點的轉場同步的配樂,這樣我們的客戶無需離開 Captions 或翻閱素材庫,即可發(fā)布電影級短視頻。"——Captions.ai 的聯(lián)合創(chuàng)始人兼首席運營官 Dwight Churchill

Dashverse擁有 Dashtoon 和 DashReels 等數(shù)字內容平臺,目前正在 Vertex AI 上利用 Google 的 Lyria 2,為下一代 AI 原生創(chuàng)作者提供先進的音樂生成功能。這種集成使用戶能夠創(chuàng)作動感十足、情感豐富的配樂,并與 DashReels 等平臺上的內容敘事和節(jié)奏無縫銜接。

"在 Dashverse,我們始終致力于賦能日常創(chuàng)作者,無論他們是在 Dashtoon 上創(chuàng)作漫畫,還還是在 DashReels 上制作短劇。我們通過 DashReels 向動態(tài)的、情感共鳴的敘事方式邁進,這需要一個同樣富有表現(xiàn)力和響應能力的音樂引擎。Vertex AI 上的 Lyria 2 正好滿足了這一點。它為我們的用戶提供了對音樂的錄音室級別控制,能夠適應情感、場景和節(jié)奏,而且沒有額外的開銷。它不僅僅是一個音軌生成器;它更是一個敘事放大器。我們非常期待它能為下一代 AI 原生創(chuàng)作者解鎖無限可能。"——Dashverse 首席技術官Soumyadeep Mukherjee

安全創(chuàng)作,負責任分享

任何 AI 生成內容的安全性和可靠性都至關重要。因此,這些模型都內置了安全保護措施,讓您能夠專注于創(chuàng)意工作。Veo 3、Imagen 4 和 Lyria 2 都與 Google DeepMind 合作,將安全性作為其核心設計原則。

水印:所有使用 Veo、Imagen 和 Lyria 生成的作品默認都使用 SynthID 技術,該技術將隱形水印直接嵌入到生成的輸出中。此水印可以識別 AI 生成的媒體,確保透明度。

安全過濾器:所有生成式 AI 媒體模型的輸入提示詞和輸出內容都可以通過安全過濾器列表進行訪問。通過配置內容過濾的嚴格程度,您可以確保資產(chǎn)符合您的品牌價值觀。在視覺輸出數(shù)據(jù)中,您還可以控制人物的生成。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6244

    瀏覽量

    110207
  • AI
    AI
    +關注

    關注

    89

    文章

    38004

    瀏覽量

    295959
  • 模型
    +關注

    關注

    1

    文章

    3644

    瀏覽量

    51684

原文標題:通過下一波生成式 AI 媒體模型擴展 Vertex AI

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI模型的配置AI模型該怎么做?

    STM32可以跑AI,這個AI模型怎么搞,知識盲區(qū)
    發(fā)表于 10-14 07:14

    【內測活動同步開啟】這么?。窟@么強?新一代模型MCP開發(fā)板來啦!

    【內測活動同步開啟】這么???這么強?新一代模型MCP開發(fā)板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE & BT / NPU,與「小聆
    發(fā)表于 09-25 11:47

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的科學應用

    種快速反應能力,是直接的感知;靈感是種通過思考和探索獲得的創(chuàng)造性想法,是種創(chuàng)意。 AI怎么模擬直覺與靈感呢?四、AI代替人類的假說
    發(fā)表于 09-17 11:45

    OpenAI開源模型登陸IBM watsonx.ai開發(fā)平臺

    OpenAI 已向公眾發(fā)布了兩款 AI 模型,允許開發(fā)者和企業(yè)可自由下載、運行并進行定制。其中模型現(xiàn)已部署在 IBM watsonx.ai
    的頭像 發(fā)表于 08-26 15:36 ?735次閱讀

    智能體化AI生成AI的區(qū)別

    生成 AI 的核心是“生成內容” —— 比如用大模型寫報告,是對輸入指令的被動響應。而智能體化 AI
    的頭像 發(fā)表于 08-25 17:24 ?1172次閱讀

    【Sipeed MaixCAM Pro開發(fā)板試用體驗】基于MaixCAM-Pro的AI生成圖像鑒別系統(tǒng)

    1. 項目概述 本項目旨在開發(fā)并部署個高精度的深度學習模型,用于自動鑒別張圖片是由AI生成(如Stable Diffusion, DAL
    發(fā)表于 08-21 13:59

    摩爾線程“AI工廠”:以系統(tǒng)級創(chuàng)新定義新一代AI基礎設施

    演講中表示,為應對生成AI爆發(fā)式增長下的大模型訓練效率瓶頸,摩爾線程將通過系統(tǒng)級工程創(chuàng)新,構建新一代A
    發(fā)表于 07-28 10:34 ?2365次閱讀
    摩爾線程“<b class='flag-5'>AI</b>工廠”:以系統(tǒng)級創(chuàng)新定義<b class='flag-5'>新一代</b><b class='flag-5'>AI</b>基礎設施

    首創(chuàng)開源架構,天璣AI開發(fā)套件讓端側AI模型接入得心應手

    基石。 Neuron Studio打造全流程一站式開發(fā)體驗,為AI應用開發(fā)按下加速鍵 AI 應用的開發(fā)瓶頸,從來都不是“點的問題”,而是“鏈的問題”:開發(fā)工具碎片化,調優(yōu)過程靠手動,單模型
    發(fā)表于 04-13 19:52

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預計于今年晚些時候面向 Google
    的頭像 發(fā)表于 04-12 00:57 ?3154次閱讀

    AI Agent 應用與項目實戰(zhàn)》----- 學習如何開發(fā)視頻應用

    開發(fā)個視頻內容生成Agent。 訪問語聚AI平臺官網(wǎng) ,進行注冊或登錄。 在平臺首頁,了解語聚A
    發(fā)表于 03-05 19:52

    聚云科技榮獲亞馬遜云科技生成AI能力認證

    Bedrock等技術,從應用范圍、模型選擇、數(shù)據(jù)處理、模型調優(yōu)到應用集成與部署等方面,助力企業(yè)加速生成AI應用落地。此外,聚云科技還基于
    的頭像 發(fā)表于 02-14 16:07 ?680次閱讀

    聚云科技榮獲亞馬遜云科技生成AI能力認證 助力企業(yè)加速生成AI應用落地

    北京 ——2025 年 2 月 14 日 云管理服務提供商聚云科技獲得亞馬遜云科技生成AI能力認證,利用亞馬遜云科技全托管的生成
    發(fā)表于 02-14 13:41 ?315次閱讀

    DeepSeek最新AI模型現(xiàn)已登陸IBM watsonx.ai平臺

    DeepSeek-R1 是款先進的 AI 模型,以卓越的推理能力著稱,可廣泛應用于編程、規(guī)劃和數(shù)學問題求解等領域,從而驅動智能代理應用、代碼生成,調試支持及優(yōu)化建議、解決復雜數(shù)學問題
    的頭像 發(fā)表于 02-08 09:21 ?1028次閱讀

    NVIDIA推出多個生成AI模型和藍圖

    NVIDIA 宣布推出多個生成 AI 模型和藍圖,將 NVIDIA Omniverse 體化進
    的頭像 發(fā)表于 01-08 10:48 ?1009次閱讀

    Google兩款先進生成AI模型登陸Vertex AI平臺

    新的 AI 模型,包括最先進的視頻生成模型Veo以及最高品質的圖像生成模型Imagen 3。近日
    的頭像 發(fā)表于 12-30 09:56 ?964次閱讀