4月23日,騰訊混元Hy3 preview語言模型發(fā)布并開源。依托全棧自研技術(shù)優(yōu)勢,壁仞科技基于vLLM主流開源框架實現(xiàn)Hy3 preview模型的Day0適配及推理驗證。Hy3 preview與壁礪166系列GPU產(chǎn)品的“國模+國芯”聯(lián)合,將充分釋放大模型落地效能,全面賦能多元真實業(yè)務(wù)場景,為開發(fā)者和行業(yè)用戶帶來更高效、更穩(wěn)定的部署體驗。
Hy3 preview的官方介紹
Hy3 preview是一個快慢思考融合的混合專家模型,總參數(shù)295B,激活參數(shù)21B,最大支持256K上下文長度。這是混元重建后訓(xùn)練的第一個模型,在復(fù)雜推理、指令遵循、上下文學(xué)習(xí)、代碼、智能體等能力及推理性能上實現(xiàn)了大幅的提升。
Hy3 preview可以視為混元快速探索實用性大模型、解決真實世界問題的一個開端。目前,Hy3 preview已在騰訊云、元寶、ima、CodeBuddy、WorkBuddy、QQ等首發(fā)上線,微信公眾號、和平精英、騰訊新聞等多個主線產(chǎn)品也在陸續(xù)上線。另外,Hy3 preview支持接入流行的開源智能體產(chǎn)品,如OpenClaw、OpenCode、KiloCode等,并已上架騰訊云大模型服務(wù)平臺TokenHub。
全棧技術(shù)優(yōu)勢實現(xiàn)Day0適配
得益于成熟的BIRENSUPA軟件生態(tài)以及軟硬協(xié)同能力,壁仞科技實現(xiàn)Hy3 preview模型Day0適配,快速貫通推理全鏈路。一方面,壁仞科技自研底層算子庫覆蓋全面、框架兼容性優(yōu)異,可高效支撐Hy3 preview在注意力計算、MoE專家路由、長序列推理等關(guān)鍵鏈路上快速完成遷移與優(yōu)化;另一方面,壁仞科技多機多卡推理部署能力出色,可穩(wěn)定支持Tensor Parallel與Pipeline Parallel等并行方案,保障Hy3 preview在大參數(shù)、多卡協(xié)同場景下的運行效率。

Hy3 preview基于壁礪166系列產(chǎn)品完成推理任務(wù)
針對Hy3 preview的192 Expert稀疏激活、Shared Expert共享專家、QK Norm注意力機制、GQA以及128K長上下文等核心特性,壁仞科技圍繞專家調(diào)度、算子融合、KV Cache管理和執(zhí)行鏈路開展深度優(yōu)化,充分釋放模型推理性能;通過自動化分析、算子調(diào)優(yōu)和關(guān)鍵路徑優(yōu)化,顯著縮短模型適配與性能優(yōu)化周期,進一步提升Hy3 preview的推理效率與部署可用性。
“Day0 適配”陣營持續(xù)擴容
作為國產(chǎn)大模型生態(tài)的重要算力支撐,壁仞科技持續(xù)擴容“Day0 適配”陣營,領(lǐng)跑國產(chǎn)GPU生態(tài)建設(shè)。
近期,依托壁礪166系列產(chǎn)品的高通用性與全自研BIRENSUPA軟件棧的成熟度,壁仞科技已完成騰訊混元系列、月之暗面Kimi系列、阿里巴巴千問Qwen系列、MiniMax M2系列、智譜GLM系列、階躍星辰Step系列、OpenMOSS MOVA系列等領(lǐng)先大模型的全面適配,覆蓋語言、多模態(tài)、AIGC全品類矩陣。未來,壁仞科技將以全?;芰χa(chǎn)SOTA大模型規(guī)模化落地,降低開發(fā)者的模型部署與應(yīng)用門檻,全面加速AI應(yīng)用普惠進程。
-
gpu
+關(guān)注
關(guān)注
28文章
5278瀏覽量
136077 -
壁仞科技
+關(guān)注
關(guān)注
1文章
91瀏覽量
4203 -
大模型
+關(guān)注
關(guān)注
2文章
3787瀏覽量
5273
原文標(biāo)題:Day0適配 | 壁仞科技x騰訊混元,率先支持Hy3 preview語言模型
文章出處:【微信號:Birentech,微信公眾號:壁仞科技Birentech】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型
騰訊Hy3 preview開源:重構(gòu)AI大模型技術(shù)范式,開啟智能計算新紀(jì)元
壁仞科技壁礪166系列GPU產(chǎn)品率先支持Kimi K2.6模型
壁仞科技光速支持阿里Qwen3.6-35B-A3B大模型
壁仞科技壁礪166系列產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型
壁仞科技壁礪166系列產(chǎn)品深度適配MiniMax M2.5和智譜GLM-5模型
壁仞科技壁礪166M產(chǎn)品適配模思智能MOSS-TTS Family模型
壁仞科技壁礪166系列產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash
壁仞科技壁礪166M產(chǎn)品適配騰訊混元開源翻譯模型1.5版本
壁仞科技壁礪166系列GPU產(chǎn)品率先支持騰訊混元Hy3 preview語言模型
評論