騰訊于5月14日宣布將混元文生圖大模型升級并公之于眾,已發(fā)布至Hugging Face以及Github之上,包括模型權(quán)重、推理代碼、模型算法等全方位數(shù)據(jù),均向企業(yè)與個人開發(fā)者提供免費商業(yè)使用權(quán)限。
升級版混元文生圖大模型采取了與Sora相同的DiT架構(gòu)設(shè)計。騰訊強調(diào),這是全球首個中英雙語DiT架構(gòu)。
基于Diffusion Transformer的混元DiT是一種文本到圖像生成模塊,具備中英細(xì)粒度理解能力,能與用戶進行多輪對話,根據(jù)上下文生成并完善圖像。
此外,它還是業(yè)界首個中文原生DiT架構(gòu)文生圖開源模型,支持中英文雙語輸入及理解,參數(shù)規(guī)模高達(dá)15億。
運行該模型需配備支持CUDA的NVIDIA GPU,單次運行混元DiT所需最低顯存為11GB;若要同時運行DialogGen(騰訊推出的文本轉(zhuǎn)圖像多模態(tài)交互式對話系統(tǒng))和混元DiT,則至少需32GB顯存。騰訊表示,他們已在Linux環(huán)境下對NVIDIA的V100和A100 GPU進行過測試。
國內(nèi)首次官方“大模型標(biāo)準(zhǔn)符合性評測”結(jié)果出爐,騰訊混元大模型成功入選首批通過評測的國產(chǎn)大模型行列,其他通過評測的大模型還包括阿里通義千問、360智腦和百度文心一言。
-
算法
+關(guān)注
關(guān)注
23文章
4739瀏覽量
96715 -
圖像
+關(guān)注
關(guān)注
2文章
1094瀏覽量
42002 -
大模型
+關(guān)注
關(guān)注
2文章
3348瀏覽量
4706
發(fā)布評論請先 登錄
大規(guī)模專家并行模型在TensorRT-LLM的設(shè)計

華為正式開源盤古7B稠密和72B混合專家模型
上新:小米首個推理大模型開源 馬斯克:下周推出Grok 3.5
英偉達(dá)GROOT N1 全球首個開源人形機器人基礎(chǔ)模型
NVIDIA 發(fā)布全球首個開源人形機器人基礎(chǔ)模型 Isaac GR00T N1——并推出加速機器人開發(fā)的仿真框架

評論