chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌全新推出開放式視覺語言模型PaliGemma

谷歌開發(fā)者 ? 來源:谷歌開發(fā)者 ? 2024-10-15 17:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者 / 產(chǎn)品管理總監(jiān) Tris Warkentin;高級研究員翟曉華;產(chǎn)品經(jīng)理 Ludovic Peran

在 Google,我們相信合作和開放研究能夠推動創(chuàng)新。我們非常感謝社區(qū)對 Gemma 的支持,使其自發(fā)布短短幾個月以來就獲得了數(shù)百萬的下載量。

這種熱烈的反響非常鼓舞人心,開發(fā)者們打造了一系列多樣的項目,例如用于印度語言的多語言變體 Navarasa,以及設(shè)備端側(cè)動作模型 Octopus v2。開發(fā)者們展示了 Gemma 在打造極具影響力且易于使用的 AI 解決方案方面的巨大潛力。

這種探索和創(chuàng)造精神也促使我們開發(fā)了 CodeGemma (具有強大的代碼補全和生成能力) 和 RecurrentGemma (在高效推理和研究領(lǐng)域極具潛力)。

Gemma 是先進的輕量級開放模型系列,采用了與創(chuàng)建 Gemini 模型相同的研究和技術(shù)。今天,我們非常高興地推出強大的開放式視覺語言模型 (VLM) PaliGemma,進一步擴展 Gemma 系列。同時我們將介紹 Gemma 2 的相關(guān)信息,讓您搶先了解即將推出的全新功能。此外,我們通過更新 Responsible Generative AI 工具包,為開發(fā)者提供用于評估模型安全性和過濾有害內(nèi)容的全新和增強型工具,進一步落實在負責(zé)任 AI 方面的承諾。

PaliGemma: 全新推出的

開放式視覺語言模型

PaliGemma 是一個強大的開放式 VLM,其靈感源自 PaLI-3。PaliGemma 基于開放式組件 (包括 SigLIP 視覺模型和 Gemma 語言模型) 構(gòu)建,可在廣泛的視覺語言任務(wù)中實現(xiàn)卓越的微調(diào)性能。這包括為圖片和短視頻描述生成、視覺問答、理解圖像中的文本、對象檢測和對象分割。

我們將提供支持多種分辨率且經(jīng)過預(yù)訓(xùn)練和微調(diào)檢查點,以及專門針對多種任務(wù)進行微調(diào)的檢查點,供您立即探索。

為了促進開放式探索和研究,PaliGemma 可通過多種平臺和資源使用。歡迎您立即通過 Kaggle 和 Colab 筆記本等免費方式開始探索!在視覺語言研究領(lǐng)域?qū)で笸黄频膶W(xué)術(shù)研究人員還可以申請 Google Cloud 積分,更好地開展工作。

立即開始使用 PaliGemma。您可以在 GitHub、Hugging Face 模型、Kaggle、Vertex AI Model Garden 和 ai.nvidia.com (通過 TensoRT-LLM 加速) 中找到 PaliGemma,并可通過 JAX 和 Hugging Face Transformers 輕松集成該模型。Keras 集成方式即將推出,您還可以通過此 Hugging Face Space 與該模型交互。

Gemma 2 推出:

性能和效率再上新臺階

我們非常高興地宣布,新一代 Gemma 模型 Gemma 2 即將發(fā)布。Gemma 2 將提供新的模型大小,以滿足廣泛的 AI 開發(fā)者用例的需求;此外,它還將采用全新架構(gòu)來實現(xiàn)突破性的性能和效率,帶來以下優(yōu)勢:

卓越性能: Gemma 2 具有 270 億個參數(shù),其性能可與 Llama 3 70B 相媲美,但大小卻不到 Llama 3 70B 的一半。這種突破性的效率為開放模型領(lǐng)域樹立了新的標(biāo)桿。

更低部署成本: Gemma 2 采用高效設(shè)計,最低所需的計算資源不到同級別模型的一半。27B 模型經(jīng)過專門優(yōu)化,可在 NVIDIA 的 GPU 上運行,也可在 Vertex AI 中的單個 TPU 主機上高效運行,讓更多的用戶能夠更方便、更經(jīng)濟高效地部署該模型。

多元化調(diào)優(yōu)工具鏈: Gemma 2 提供多元化的平臺和工具生態(tài)系統(tǒng),讓開發(fā)者可從中選用穩(wěn)健的調(diào)優(yōu)功能。從 Google Cloud 等云端解決方案到 Axolotl 等熱門社區(qū)工具,豐富多樣的選擇讓微調(diào) Gemma 2 變得更加簡單。此外,Gemma 2 與 Hugging Face、NVIDIA TensorRT-LLM 等眾多合作伙伴實現(xiàn)了無縫整合,同時還集成了 Google JAX 和 Keras,讓您可以優(yōu)化性能,并在各種硬件配置中實現(xiàn)高效部署。

擴展 Responsible Generative AI 工具包

為了迎接該模型的發(fā)布,我們將開源發(fā)布 LLM Comparator 來擴展 Responsible Generative AI 工具包,以便開發(fā)者進行更穩(wěn)健的模型評估。LLM Comparator 是一種新的交互式視覺工具,能夠進行有效的并排評估,以評估模型響應(yīng)的質(zhì)量和安全性。您可以查看 LLM Comparator 的實際應(yīng)用演示,了解 Gemma 1.1 和 Gemma 1.0 的對比情況。

我們希望 LLM Comparator 可以進一步推進該工具包的使命,助力開發(fā)者打造兼具創(chuàng)新性和安全性且負責(zé)任的 AI 應(yīng)用。

我們將不斷擴展 Gemma 開放模型系列,并一如既往地營造協(xié)作環(huán)境,讓前沿 AI 技術(shù)與負責(zé)任的開發(fā)齊頭并進。我們對您將利用這些新工具打造的應(yīng)用充滿期待,與您共赴 AI 美好未來!

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • Google
    +關(guān)注

    關(guān)注

    5

    文章

    1807

    瀏覽量

    60506
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301313
  • 語言模型
    +關(guān)注

    關(guān)注

    0

    文章

    571

    瀏覽量

    11310

原文標(biāo)題:全新推出 PaliGemma、Gemma 2 和升級擴展 Responsible AI 工具包

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    谷歌推出TranslateGemma全新開放翻譯模型系列

    我們已正式推出 TranslateGemma,這一全新開放翻譯模型系列基于 Gemma 3 構(gòu)建,并提供 4B、12B 和 27B 三種參數(shù)規(guī)模。TranslateGemma 的問世
    的頭像 發(fā)表于 02-26 10:22 ?481次閱讀

    從TWS紅海突圍:開放式耳機市場進入AI重構(gòu)時代

    近年來,全球可穿戴音頻設(shè)備正經(jīng)歷一場結(jié)構(gòu)性變革。隨著用戶對健康、舒適與場景融合體驗需求的提升,傳統(tǒng)TWS逐漸遭遇同質(zhì)化,開放式耳機憑借“不堵耳、保環(huán)境感知、全天候佩戴無負擔(dān)”等優(yōu)勢,迅速崛起為行業(yè)
    的頭像 發(fā)表于 02-12 09:18 ?5032次閱讀
    從TWS紅海突圍:<b class='flag-5'>開放式</b>耳機市場進入AI重構(gòu)時代

    韶音CES 2026新品發(fā)布:OpenFit Pro推出開放式濾噪新方案

    2026年1月6日,全球消費電子盛會CES在美國拉斯維加斯開幕,全球領(lǐng)先的開放式耳機品牌Shokz韶音以“重塑開放之聲”為主題,于展會首日舉辦新品發(fā)布會,正式推出旗下首款搭載開放式濾噪
    的頭像 發(fā)表于 01-12 16:17 ?351次閱讀
    韶音CES 2026新品發(fā)布:OpenFit Pro<b class='flag-5'>推出</b><b class='flag-5'>開放式</b>濾噪新方案

    NVIDIA在CES 2026發(fā)布全新開放模型、數(shù)據(jù)和工具

    為擴展開放模型生態(tài),NVIDIA 發(fā)布全新開放模型、數(shù)據(jù)和工具,推動各行業(yè) AI 技術(shù)的發(fā)展。
    的頭像 發(fā)表于 01-09 10:42 ?538次閱讀

    NVIDIA 推出 Nemotron 3 系列開放模型

    token 數(shù)。 ● Nemotron 通過先進的強化學(xué)習(xí)技術(shù)以及大規(guī)模并行多環(huán)境后訓(xùn)練,實現(xiàn)了卓越的準(zhǔn)確率。 ● NVIDIA 率先推出整套前沿的開放模型、訓(xùn)練數(shù)據(jù)集及強化學(xué)習(xí)環(huán)境與
    的頭像 發(fā)表于 12-16 09:27 ?623次閱讀
    NVIDIA <b class='flag-5'>推出</b> Nemotron 3 系列<b class='flag-5'>開放</b><b class='flag-5'>模型</b>

    芯原與谷歌聯(lián)合推出開源Coral NPU IP

    芯原股份近日宣布與谷歌聯(lián)合推出面向始終在線、超低能耗端側(cè)大語言模型應(yīng)用的Coral NPU IP。
    的頭像 發(fā)表于 11-13 11:24 ?589次閱讀
    芯原與<b class='flag-5'>谷歌</b>聯(lián)合<b class='flag-5'>推出</b>開源Coral NPU IP

    開放式超聲波傳感器:開啟智能感知新紀(jì)元

    在萬物互聯(lián)的智能時代,傳統(tǒng)封閉傳感器已難以滿足復(fù)雜場景的精準(zhǔn)感知需求。而開放式超聲波傳感器憑借其獨特的結(jié)構(gòu)設(shè)計與技術(shù)優(yōu)勢,正成為工業(yè)自動化、智能家居、自動駕駛等領(lǐng)域的“感知神經(jīng)”,重新定義著人
    的頭像 發(fā)表于 10-20 08:40 ?540次閱讀
    <b class='flag-5'>開放式</b>超聲波傳感器:開啟智能感知新紀(jì)元

    華為開放式耳機FreeArc搭載芯導(dǎo)科技P14C5N芯片

    近期,華為再次推出了一款耳掛設(shè)計的開放式耳機——HUAWEI FreeArc,采用140° 三角穩(wěn)固設(shè)計、大面積超柔軟液態(tài)硅膠材質(zhì)包裹,搭配IP57級防塵抗水性能,不僅滿足日常使用需求,還更加適合
    的頭像 發(fā)表于 08-15 16:43 ?1743次閱讀
    華為<b class='flag-5'>開放式</b>耳機FreeArc搭載芯導(dǎo)科技P14C5N芯片

    亞馬遜云科技現(xiàn)已上線OpenAI開放權(quán)重模型

    開放權(quán)重模型,向數(shù)百萬亞馬遜云科技客戶開放。 客戶可利用這些全新開放權(quán)重模型的先進推理能力,支持Agentic工作流、代碼生成、科學(xué)分析和數(shù)
    的頭像 發(fā)表于 08-06 19:29 ?843次閱讀

    DC監(jiān)測技術(shù)、3+1麥開放式降噪,榮耀可穿戴新品重構(gòu)AI邊界

    電子發(fā)燒友網(wǎng)綜合報道?當(dāng)前,可穿戴設(shè)備行業(yè)的產(chǎn)品不斷迭代,特別是智能手表和耳機等消費類可穿戴設(shè)備。就在7月2日,榮耀在榮耀Magic V5暨AI終端生態(tài)發(fā)布會上,正式發(fā)布了新一代開放式耳機——榮耀
    的頭像 發(fā)表于 07-06 10:52 ?2904次閱讀
    DC監(jiān)測技術(shù)、3+1麥<b class='flag-5'>開放式</b>降噪,榮耀可穿戴新品重構(gòu)AI邊界

    炬芯科技助力Cleer ARC 5音弧開放式AI耳機發(fā)布

    此前,2025年4月22日(第56個世界地球日),國際智能聲學(xué)品牌Cleer以「戴上Cleer AI聽新世界」為主題,在深圳國際低碳城·氣膜館舉行新品發(fā)布會,重磅發(fā)布了旗艦產(chǎn)品——新一代Cleer ARC 5 音弧開放式AI耳機。
    的頭像 發(fā)表于 05-16 09:06 ?1309次閱讀

    Wi-Fi音頻傳輸+百倍AI性能飛躍!開放式耳機上新高度

    電子發(fā)燒友網(wǎng)報道(文/莫婷婷)繼小米發(fā)布小米Buds 5 Pro入耳耳機首發(fā)支持Wi-Fi技術(shù)之后,在近期Cleer也發(fā)布了旗下首款Wi-Fi耳機——新一代Cleer ARC 5 音弧開放式AI
    的頭像 發(fā)表于 04-28 00:14 ?3870次閱讀
    Wi-Fi音頻傳輸+百倍AI性能飛躍!<b class='flag-5'>開放式</b>耳機上新高度

    英偉達GTC2025亮點 NVIDIA推出Cosmos世界基礎(chǔ)模型和物理AI數(shù)據(jù)工具的重大更新

    、Figure AI、Skild AI 是最早采用該技術(shù)的公司。 NVIDIA 宣布推出全新 NVIDIA Cosmos 世界基礎(chǔ)模型 (WFM) 的重大更新,該模型引入了
    的頭像 發(fā)表于 03-20 19:01 ?1333次閱讀

    ?VLM(視覺語言模型)?詳細解析

    視覺語言模型(Visual Language Model, VLM)是一種結(jié)合視覺(圖像/視頻)和語言(文本)處理能力的多模態(tài)人工智能
    的頭像 發(fā)表于 03-17 15:32 ?8796次閱讀
    ?VLM(<b class='flag-5'>視覺</b><b class='flag-5'>語言</b><b class='flag-5'>模型</b>)?詳細解析

    ??低?b class='flag-5'>推出視覺模型系列攝像機

    依托海康觀瀾大模型技術(shù)體系,海康威視將大模型能力直接部署至端側(cè),推出一系列視覺模型攝像機。
    的頭像 發(fā)表于 03-05 14:06 ?1521次閱讀