2026年4月24日,DeepSeek-V4系列模型正式發(fā)布并同步開源。AtomGit平臺(tái)為DeepSeek-V4昇騰適配版本首發(fā)平臺(tái),為開發(fā)者提供從模型獲取、算力適配到工程部署的一站式實(shí)踐入口。
本次首發(fā)適配,昇騰作為國產(chǎn)算力代表,已完成DeepSeek-V4系列模型的推理與訓(xùn)練側(cè)深度適配支持。開發(fā)者可通過AtomGit獲取相關(guān)工程實(shí)踐,基于國產(chǎn)算力環(huán)境開展模型推理、微調(diào)、訓(xùn)練優(yōu)化和應(yīng)用驗(yàn)證。
為開發(fā)者提供國產(chǎn)算力適配入口
本次AtomGit首發(fā)上線的內(nèi)容主要包括:
一是DeepSeek-V4模型推理優(yōu)化實(shí)踐,面向開發(fā)者提供基于國產(chǎn)算力環(huán)境的推理部署參考,幫助用戶理解模型在不同輸入長度、推理引擎和硬件環(huán)境下的部署方式。
二是DeepSeek-V4 Ascend C融合算子優(yōu)化實(shí)踐,面向算子開發(fā)、模型性能優(yōu)化和底層工程適配場景,提供更細(xì)粒度的優(yōu)化參考。
三是基于CANN平臺(tái)的TorchTitan-NPU+AutoFuse極簡訓(xùn)練優(yōu)化實(shí)踐,面向訓(xùn)練側(cè)適配和續(xù)訓(xùn)練場景,提供可參考的工程路徑。
通過這些資源,AtomGit不只是發(fā)布模型相關(guān)鏈接,而是進(jìn)一步將模型、代碼、算力適配、工具鏈和開發(fā)者討論連接起來,使DeepSeek-V4的開源發(fā)布能夠更快進(jìn)入國產(chǎn)算力生態(tài)和真實(shí)應(yīng)用環(huán)境。
昇騰完成DeepSeek-V4系列支持
在本次DeepSeek-V4國產(chǎn)算力適配中,昇騰完成了對(duì)DeepSeek-V4-Pro與DeepSeek-V4-Flash的推理和訓(xùn)練側(cè)支持。相關(guān)適配能力通過AtomGit首發(fā)開放,開發(fā)者可基于公開實(shí)踐方案開展部署驗(yàn)證與二次開發(fā)。
推理側(cè),昇騰超節(jié)點(diǎn)系列產(chǎn)品已支持DeepSeek-V4系列模型部署。圍繞長序列推理場景,適配方案結(jié)合融合Kernel、多流并行、量化算法和KV Cache優(yōu)化,降低Attention計(jì)算和訪存開銷,提升模型推理吞吐與時(shí)延表現(xiàn)。
DeepSeek-V4已具備在國產(chǎn)算力環(huán)境中開展規(guī)?;评韺?shí)踐的基礎(chǔ)條件。對(duì)于希望在本地化算力、行業(yè)私有化部署、國產(chǎn)技術(shù)棧環(huán)境中探索大模型應(yīng)用的開發(fā)者和企業(yè)而言,這提供了更直接的工程參考。
連接開源模型、國產(chǎn)算力與開發(fā)者生態(tài)
DeepSeek-V4在AtomGit首發(fā)適配國產(chǎn)算力,是一次模型開源與工程生態(tài)協(xié)同的具體實(shí)踐。
AtomGit在這一過程中承擔(dān)的是“連接器”和“基礎(chǔ)設(shè)施入口”的角色:一端連接DeepSeek-V4這樣的開源模型,一端連接國產(chǎn)算力與工具鏈生態(tài),同時(shí)面向開發(fā)者開放可復(fù)現(xiàn)的工程實(shí)踐。
目前,DeepSeek-V4國產(chǎn)算力適配相關(guān)資源已在AtomGit平臺(tái)開放,包括:
●DeepSeek-V4 模型推理優(yōu)化實(shí)踐
https://atomgit.com/cann/cann-recipes-infer/tree/master/docs/models/deepseek-v4/deepseek_v4_inference_guide.md
●DeepSeek-V4 Ascend C 融合算子優(yōu)化
https://atomgit.com/cann/cann-recipes-infer/tree/master/docs/models/deepseek-v4/deepseek_v4_ascendc_operator_guide.md
●基于CANN平臺(tái)的TorchTitan-NPU + AutoFuse 極簡訓(xùn)練優(yōu)化實(shí)踐
https://atomgit.com/cann/cann-recipes-train/blob/master/docs/llm_pretrain/deepseek-v4_torchtitan_npu_autofuse.md
DeepSeek-V4開源發(fā)布,AtomGit首發(fā)適配國產(chǎn)算力
AtomGit互動(dòng)討論區(qū)
https://atomgit.com/org/cann/discussions/85
面向未來,隨著更多模型、算力、工具鏈和開發(fā)者資源在AtomGit匯聚,開源人工智能生態(tài)將不再只是模型能力的競爭,更將成為工程能力、基礎(chǔ)設(shè)施能力和生態(tài)協(xié)同能力的綜合競爭。DeepSeek-V4在AtomGit首發(fā)適配國產(chǎn)算力,正是這一趨勢的具體體現(xiàn)。
-
開源
+關(guān)注
關(guān)注
3文章
4368瀏覽量
46451 -
算力
+關(guān)注
關(guān)注
2文章
1697瀏覽量
16837 -
DeepSeek
+關(guān)注
關(guān)注
2文章
855瀏覽量
3410
原文標(biāo)題:DeepSeek-V4開源發(fā)布,AtomGit首發(fā)適配國產(chǎn)算力
文章出處:【微信號(hào):開放原子,微信公眾號(hào):開放原子】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
云天勵(lì)飛完成DeepSeek-V4系列模型關(guān)鍵機(jī)制適配驗(yàn)證
摩爾線程攜手智源人工智能研究院Day-0適配DeepSeek-V4 Pro和Flash雙模型
摩爾線程攜手上海AI實(shí)驗(yàn)室Day-0適配DeepSeek-V4核心算子
摩爾線程TileLang-MUSA率先支持DeepSeek-V4全新TileKernels
登臨科技GPU+架構(gòu)深度適配DeepSeek-V4大模型
寒武紀(jì)Day 0適配DeepSeek-V4模型
華為云首發(fā)適配DeepSeek-V4模型
沐曦股份Day 0適配DeepSeek-V4-Flash模型
燧原科技L600 FP8原生適配DeepSeek-V4-Pro/Flash模型
壁仞科技壁礪166系列GPU產(chǎn)品率先支持DeepSeek-V4模型
開放原子AtomGit平臺(tái)首發(fā)適配DeepSeek-V4系列模型
評(píng)論