chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

基于NVIDIA GPU加速端點使用千問3.5 VLM開發(fā)原生多模態(tài)智能體

NVIDIA英偉達(dá)企業(yè)解決方案 ? 來源:NVIDIA英偉達(dá)企業(yè)解決方案 ? 2026-03-04 16:37 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

阿里巴巴推出了全新開源千問3.5系列,專為構(gòu)建原生多模態(tài)智能體而設(shè)計。該系列的首個模型是一款總參數(shù)為397B、具備推理能力的原生視覺語言模型(VLM),基于由混合專家模型(MoE)和門控Delta網(wǎng)絡(luò)(Gated Delta Networks)組成的混合架構(gòu)構(gòu)建。千問3.5能夠理解和導(dǎo)航用戶界面,相較上一代VLM有了顯著提升。

千問3.5適用于各種用例,包括:

編碼任務(wù),包括Web開發(fā)

視覺推理任務(wù),包括移動端和Web界面

聊天應(yīng)用

復(fù)雜搜索

千問3.5
模態(tài) 視覺、語言
總參數(shù) 397B
激活參數(shù) 17B
激活率 4.28%
輸入上下文長度 256K token,可擴展至1M token
支持的語言 200+
其他配置信息
專家 512
共享專家 1
每個token使用的專家數(shù)量 11(10個路由專家+ 1個共享專家)
層數(shù) 60
詞表大小 248,320

表1. 千問3.5模型的規(guī)格和配置詳情

使用NVIDIA端點進(jìn)行構(gòu)建

您可以在NVIDIA官網(wǎng)上免費使用由NVIDIA GPU驅(qū)動的GPU加速端點使用千問3.5進(jìn)行構(gòu)建。作為NVIDIA開發(fā)者計劃的一部分,您可以在瀏覽器中快速體驗、試驗不同的提示詞,并使用自己的數(shù)據(jù)測試模型,以評估其在實際場景中的性能。

視頻1.了解如何在NVIDIA GPU加速端點上測試千問3.5

您還可以通過API來調(diào)用NVIDIA托管的模型,注冊NVIDIA開發(fā)者計劃即可免費使用。

import requests 
   
invoke_url = "https://integrate.api.nvidia.com/v1/chat/completions" 
   
headers = { 
    "Authorization": "Bearer $NVIDIA_API_KEY", 
    "Accept": "application/json", 
} 
   
payload = { 
  "messages": [ 
    { 
    "role": "user", 
    "content": "" 
    } 
  ], 
  "model": "qwen/qwen3.5-397b-a17b", 
  "chat_template_kwargs": { 
    "thinking": True 
  }, 
  "frequency_penalty": 0, 
  "max_tokens": 16384, 
  "presence_penalty": 0, 
  "stream": True, 
  "temperature": 1, 
  "top_p": 1 
} 
   
# re-use connections 
session = requests.Session() 
   
response = session.post(invoke_url, headers=headers, json=payload) 
   
response.raise_for_status() 
response_body = response.json() 
print(response_body)

要使用工具調(diào)用功能,只需定義一個由OpenAI兼容工具組成的數(shù)組,并將其添加到聊天補全接口的tools參數(shù)中。

NVIDIA NIM可以輕松將千問3.5從開發(fā)階段遷移到生產(chǎn)環(huán)境。NIM提供經(jīng)過優(yōu)化的容器化推理微服務(wù),將模型與性能調(diào)優(yōu)、標(biāo)準(zhǔn)化API和企業(yè)所需的部署靈活性打包集成。您可以在各類環(huán)境中下載并運行,無論是本地、云上或混合環(huán)境。

使用NVIDIANeMo自定義模型

千問3.5已具備出色的“開箱即用”多模態(tài)功能,NVIDIA NeMo框架仍提供了關(guān)鍵的工具集,使其進(jìn)一步適配特定領(lǐng)域的需求。開發(fā)者可以使用NeMo Automodel庫微調(diào)千問3.5 397B參數(shù)架構(gòu),實現(xiàn)高吞吐效率。

NeMoAutomodel是一個原生PyTorch訓(xùn)練庫,提供Day 0 Hugging Face支持,無需繁瑣的模型轉(zhuǎn)換,即可在現(xiàn)有檢查點上直接進(jìn)行訓(xùn)練。無論是執(zhí)行全量監(jiān)督微調(diào)(Supervised Fine-Tuning, SFT),還是使用LoRA等內(nèi)存高效方法,都有助于快速開展實驗。

作為參考實現(xiàn)指南,開發(fā)者可以利用醫(yī)學(xué)視覺問答技術(shù)教程,該教程詳細(xì)說明了如何在放射學(xué)數(shù)據(jù)集上微調(diào)千問3.5。在大規(guī)模場景下,NeMo支持多節(jié)點Slurm和Kubernetes部署,從而確保即使是最大的MoE模型,也能在特定領(lǐng)域的推理和復(fù)雜智能體工作流中實現(xiàn)低延遲的優(yōu)化,并將延遲降至最低。

開始使用千問3.5

從數(shù)據(jù)中心部署到可隨時隨地進(jìn)行容器化部署的NVIDIA NIM,NVIDIA提供了千問3.5的集成解決方案。訪問Hugging Face上的千問3.5模型頁面,并前往NVIDIA官網(wǎng)體驗千問3.5的功能。

關(guān)于作者

Anu Srivastava 是高級技術(shù)營銷經(jīng)理,專注于開放 AI 模型。她與主要合作伙伴和基金會合作,為開源開發(fā)者生態(tài)系統(tǒng)提供 NVIDIA 加速平臺支持。加入 NVIDIA 之前,她曾在 Google 擔(dān)任各種工程職務(wù)超過 10 年,并擁有德克薩斯大學(xué)奧斯汀分校計算機科學(xué)學(xué)位。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5592

    瀏覽量

    109706
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5194

    瀏覽量

    135417
  • 阿里巴巴
    +關(guān)注

    關(guān)注

    7

    文章

    1647

    瀏覽量

    49184

原文標(biāo)題:基于 NVIDIA GPU 加速端點,使用千問3.5 VLM 開發(fā)原生多模態(tài)智能體

文章出處:【微信號:NVIDIA-Enterprise,微信公眾號:NVIDIA英偉達(dá)企業(yè)解決方案】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    《CST Studio Suite 2024 GPU加速計算指南》

    監(jiān)控/利用率、選擇可用GPU卡子集等內(nèi)容。 6. 故障排除:針對NVIDIA驅(qū)動安裝、GPU設(shè)置、GPU模式、硬件識別、CUDA錯誤、TC
    發(fā)表于 12-16 14:25

    NVIDIA火熱招聘GPU高性能計算架構(gòu)師

    這邊是NVIDIA HR Allen, 我們目前在上海招聘GPU高性能計算架構(gòu)師(功能驗證)的崗位,有意向的朋友歡迎發(fā)送簡歷到 allelin@nvidia
    發(fā)表于 09-01 17:22

    AI開發(fā)者福音!阿里云推出國內(nèi)首個基于英偉達(dá)NGC的GPU優(yōu)化容器

    云計算服務(wù)異構(gòu)加速平臺,為人工智能產(chǎn)業(yè)提供場景化的全球加速能力。2017年11月,阿里云發(fā)布了國內(nèi)首個支持 NVIDIA ?Tesla ?
    發(fā)表于 04-04 14:39

    NVIDIA-SMI:監(jiān)控GPU的絕佳起點

    nvidia-smi可執(zhí)行文件位于虛擬機管理程序上。如果在同一部署中您選擇在GPU上使用作為傳遞,那么GPU正在尋找訪客上的NVIDIA驅(qū)動程序,因此
    發(fā)表于 09-04 15:18

    Nvidia GPU風(fēng)扇和電源顯示ERR怎么解決

    問題最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時候,如果機器鎖屏一段時間再打開的時候鼠標(biāo)非??D,或者說顯示界面非??D,使用nvidia-smi查看發(fā)現(xiàn),訓(xùn)練模型的GPU
    發(fā)表于 12-30 06:44

    在Ubuntu上使用Nvidia GPU訓(xùn)練模型

    問題最近在Ubuntu上使用Nvidia GPU訓(xùn)練模型的時候,沒有問題,過一會再訓(xùn)練出現(xiàn)非??D,使用nvidia-smi查看發(fā)現(xiàn),顯示GPU的風(fēng)扇和電源報錯:解決方案自動風(fēng)扇控制在
    發(fā)表于 01-03 08:24

    慕尼黑電子展回顧:啟明智顯模態(tài)硬件智能引領(lǐng)科技潮流

    在剛剛落幕的慕尼黑電子展上,啟明云端攜啟明智顯與觸覺智能兩家子公司,共同為全球觀眾呈現(xiàn)了一場科技盛宴。本次展會,啟明智顯憑借其創(chuàng)新的模態(tài)硬件智能
    的頭像 發(fā)表于 07-10 16:17 ?1032次閱讀
    慕尼黑電子展回顧:啟明智顯<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>硬件<b class='flag-5'>智能</b><b class='flag-5'>體</b>引領(lǐng)科技潮流

    商湯絕影在行業(yè)率先實現(xiàn)原生模態(tài)大模型的車端部署

    “基于原生模態(tài)大模型,商湯絕影正在打造一系列全新的車載智能化產(chǎn)品,推動智能汽車向超級智能
    的頭像 發(fā)表于 07-23 10:52 ?1215次閱讀
    商湯絕影在行業(yè)率先實現(xiàn)<b class='flag-5'>原生</b><b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>大模型的車端部署

    ?VLM(視覺語言模型)?詳細(xì)解析

    視覺語言模型(Visual Language Model, VLM)是一種結(jié)合視覺(圖像/視頻)和語言(文本)處理能力的模態(tài)人工智能模型,能夠理解并生成與視覺內(nèi)容相關(guān)的自然語言。以下
    的頭像 發(fā)表于 03-17 15:32 ?8802次閱讀
    ?<b class='flag-5'>VLM</b>(視覺語言模型)?詳細(xì)解析

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗

    隨著行百業(yè)數(shù)智化進(jìn)程的不斷加速,模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語音、視頻等多樣化的交互方式正逐漸成為推動行業(yè)變革的新動力。3月20日,全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移遠(yuǎn)通信
    的頭像 發(fā)表于 03-20 19:03 ?816次閱讀
    移遠(yuǎn)通信<b class='flag-5'>智能</b>模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新體驗

    移遠(yuǎn)通信智能模組全面接入模態(tài)AI大模型,重塑智能交互新體驗

    隨著行百業(yè)數(shù)智化進(jìn)程的不斷加速模態(tài)AI大模型的應(yīng)用需求不斷攀升,圖像、語音、視頻等多樣化的交互方式正逐漸成為推動行業(yè)變革的新動力。 ? 3月20日,全球物聯(lián)網(wǎng)整體解決方案供應(yīng)商移
    發(fā)表于 03-21 14:12 ?532次閱讀
    移遠(yuǎn)通信<b class='flag-5'>智能</b>模組全面接入<b class='flag-5'>多</b><b class='flag-5'>模態(tài)</b>AI大模型,重塑<b class='flag-5'>智能</b>交互新體驗

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的
    的頭像 發(fā)表于 03-28 09:59 ?1296次閱讀

    百度文心快碼推出AI原生開發(fā)環(huán)境工具Comate AI IDE

    6月23日圖靈誕辰日,Comate AI IDE正式發(fā)布,成為行業(yè)首個模態(tài)智能體協(xié)同的獨立AI原生
    的頭像 發(fā)表于 06-27 11:30 ?1162次閱讀

    沐曦股份曦云C系列GPU深度適配通義Qwen3.5模型

    今天,通義今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權(quán)重版本。沐曦股
    的頭像 發(fā)表于 02-26 14:26 ?394次閱讀
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>深度適配通義<b class='flag-5'>千</b><b class='flag-5'>問</b>Qwen<b class='flag-5'>3.5</b>模型

    沐曦股份曦云C系列GPU全面適配通義Qwen3.5三款新模型

    今日,通義團隊正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Q
    的頭像 發(fā)表于 02-28 10:05 ?364次閱讀
    沐曦股份曦云C系列<b class='flag-5'>GPU</b>全面適配通義<b class='flag-5'>千</b><b class='flag-5'>問</b>Qwen<b class='flag-5'>3.5</b>三款新模型