chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

沐曦股份Day 0適配DeepSeek-V4-Flash模型

沐曦MetaX ? 來源:沐曦metaX ? 2026-04-28 15:53 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

4月24日,沐曦股份攜手FlagOS,已完對(duì)DeepSeek最新開源的DeepSeek-V4-Flash模型的Day 0適配。同日,沐曦股份還聯(lián)合上海人工智能實(shí)驗(yàn)室KernelSwift智能算子遷移系統(tǒng),率先完成DeepSeek-V4核心算子的Day0適配。

截至目前,沐曦股份已完成針對(duì)國內(nèi)19款主流開源模型的極速適配,全面覆蓋DeepSeek、MiniMax、智譜、阿里巴巴、騰訊、階躍星辰、百度等頭部廠商最新旗艦?zāi)P停N類涵蓋語言、多模態(tài)、OCR、3D生成等全領(lǐng)域,效率領(lǐng)跑行業(yè)。

能夠取得這一成果,既得益于沐曦股份在GPU硬件設(shè)計(jì)與自研軟件棧MXMACA上的長期技術(shù)積累,也與上海人工智能實(shí)驗(yàn)室、FlagOS合作伙伴的深度協(xié)同密不可分。

FlagOS三大核心技術(shù)支持,沐曦芯片完成全量適配

在沐曦股份與FlagOS的合作中,背后有三大關(guān)鍵技術(shù)提供支持:

高性能通用大模型算子庫FlagGems。據(jù)FlagOS介紹,F(xiàn)lagGems 提供支持8種以上芯片的全算子替代。此次DeepSeek V4在注意力機(jī)制和量化策略上引入了5個(gè)新算子,F(xiàn)lagGems針對(duì)全部5個(gè)算子進(jìn)行了重新實(shí)現(xiàn),以支持國產(chǎn)多芯片適配。

FlagOS采用獨(dú)立并行策略,解除張量并行最多單機(jī)8卡限制,將可運(yùn)行芯片范圍從“僅限單機(jī)80GB以上顯存的個(gè)別高端卡”擴(kuò)展到“多機(jī)64GB/32GB的更多主流國產(chǎn)芯片”。

FlagOS支持從“FP4+FP8混合精度” 到 BF16的精度轉(zhuǎn)換。此次 DeepSeek-V4-Flash模型發(fā)布時(shí)首次采用 FP4+FP8混合精度,F(xiàn)lagOS 完成了從 FP4 到 BF16 的完整精度轉(zhuǎn)換,使得模型可部署在 FP8 及 BF16 生態(tài)的主流國產(chǎn)芯片上。

目前,F(xiàn)lagOS已經(jīng)完成針對(duì)DeepSeek-V4開源模型的多芯全量適配與推理部署,開發(fā)者可直接獲取對(duì)應(yīng)芯片的開箱即用方案。

沐曦適配版本鏈接

魔搭:

https://modelscope.cn/models/FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

HuggingFace:

https://huggingface.co/FlagRelease/DeepSeek-V4-Flash-metax-FlagOS

KernelSwift加速,沐曦芯片實(shí)現(xiàn)核心算子高效遷移

算子遷移效率與性能優(yōu)化是解鎖國產(chǎn)算力的關(guān)鍵。

沐曦股份在與上海人工智能實(shí)驗(yàn)室的合作中,借助實(shí)驗(yàn)室研發(fā)的智能算子遷移系統(tǒng)KernelSwift,沐曦芯片率先完成了DeepSeek-V4核心算子的Day0適配, 算子平均通過率約80%。

在DeepSeek-V4模型發(fā)布后,KernelSwift啟動(dòng)全自動(dòng)流程生成核心算子并適配多元國產(chǎn)芯片,全程無人工干預(yù)。DeepSeek-V4模型共計(jì)21個(gè)核心算子中,KernelSwift采用融合策略,核心算子相比?TileLang?達(dá)到1.2倍以上性能加速,國產(chǎn)芯片平均實(shí)現(xiàn)75%+正確性,平均加速比達(dá)3.4倍。自動(dòng)生成的算子經(jīng)人工修改后,國產(chǎn)芯片平均實(shí)現(xiàn)100%正確性,大大提高了算子開發(fā)和遷移效率。

依托“自研GPU硬件+MXMACA軟件?!避浻惨惑w計(jì)算平臺(tái)的核心優(yōu)勢(shì),沐曦股份快速響應(yīng)大模型迭代節(jié)奏,高效完成了多款主流模型的適配工作,以全棧技術(shù)實(shí)力為大模型快速落地筑牢算力支撐。

未來,沐曦股份將繼續(xù)與上海人工智能實(shí)驗(yàn)室、FlagOS深度合作,以Day 0適配為標(biāo)準(zhǔn),實(shí)現(xiàn)大模型“發(fā)布即落地”,共同打造從底層算力到上層應(yīng)用的無縫銜接生態(tài),加速AI技術(shù)在千行百業(yè)的規(guī)模化部署,共建自主可控的智能計(jì)算新底座。

關(guān)于沐曦股份

沐曦股份致力于自主研發(fā)全棧高性能GPU芯片及計(jì)算平臺(tái),為智算、通用計(jì)算、云渲染等前沿領(lǐng)域提供高能效、高通用性的算力支撐,助力數(shù)字經(jīng)濟(jì)發(fā)展。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 人工智能
    +關(guān)注

    關(guān)注

    1820

    文章

    50344

    瀏覽量

    266985
  • 沐曦
    +關(guān)注

    關(guān)注

    1

    文章

    103

    瀏覽量

    1880
  • DeepSeek
    +關(guān)注

    關(guān)注

    2

    文章

    847

    瀏覽量

    3406

原文標(biāo)題:沐曦股份攜手FlagOS、上海人工智能實(shí)驗(yàn)室,完成DeepSeek-V4 Day 0適配

文章出處:【微信號(hào):沐曦MetaX,微信公眾號(hào):沐曦MetaX】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    華為云首發(fā)適配DeepSeek-V4模型

    ,DeepSeek-V4-Flash模型參數(shù)下降至284B,推理成本進(jìn)一步降低,模型參數(shù)和激活更小,V4-Flash能夠提供更加快捷、經(jīng)濟(jì)的API服務(wù),實(shí)現(xiàn)百萬上下文普惠。當(dāng)前,華為云
    的頭像 發(fā)表于 04-28 17:01 ?98次閱讀

    股份云C系列GPU產(chǎn)品Day 0適配小米MiMo-V2.5-Pro模型

    4月23日,小米開啟 MiMo-V2.5系列模型的公測(cè),并于4月28日正式發(fā)布及開源。
    的頭像 發(fā)表于 04-28 15:59 ?51次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>小米MiMo-<b class='flag-5'>V</b>2.5-Pro<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配騰訊混元Hy3 preview語言模型

    4月23日,騰訊混元團(tuán)隊(duì)正式發(fā)布并開源Hy3 preview語言模型。股份旗下云 C 系列
    的頭像 發(fā)表于 04-28 15:51 ?86次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>騰訊混元Hy3 preview語言<b class='flag-5'>模型</b>

    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,Day-0適配DeepSeek-V4

    4月24日,摩爾線程攜手智源眾智FlagOS社區(qū),在旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000上,率先實(shí)現(xiàn)對(duì)新一代大模型DeepSeek-V4-FlashDay-0極速
    發(fā)表于 04-24 16:30 ?1006次閱讀
    摩爾線程S5000 + 智源FlagOS:基于原生FP8引擎,<b class='flag-5'>Day-0</b><b class='flag-5'>適配</b><b class='flag-5'>DeepSeek-V4</b>

    股份Day 0適配阿里千問Qwen3.6-35B-A3B大模型

    阿里巴巴千問模型團(tuán)隊(duì)最新宣布,開源旗下多模態(tài)“智能體小鋼炮” Qwen3.6-35B-A3B模型。股份與FlagOS合作,完成了該
    的頭像 發(fā)表于 04-22 11:13 ?581次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>阿里千問Qwen3.6-35B-A3B大<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配百度文心ERNIE-Image文生圖模型

    4月15日,百度文心大模型團(tuán)隊(duì)重磅推出ERNIE?Image文生圖模型,股份
    的頭像 發(fā)表于 04-15 17:39 ?467次閱讀

    MiniMax M2.7全球開源,摩爾線程、等完成Day0適配

    電子發(fā)燒友網(wǎng)綜合報(bào)道 4月12日,MiniMax M2.7在全球正式開源。華為昇騰、摩爾線程、股份、昆侖芯、NVIDIA,以及TogetherAI、Fireworks、Ollama
    的頭像 發(fā)表于 04-14 11:05 ?1753次閱讀

    股份云C系列GPU產(chǎn)品Day 0適配MiniMax M2.7模型

    4月12日,MiniMax新一代Agent旗艦大模型M2.7開源。股份云C系列GPU已完成
    的頭像 發(fā)表于 04-13 17:08 ?825次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU產(chǎn)品<b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>MiniMax M2.7<b class='flag-5'>模型</b>

    股份云C系列GPU產(chǎn)品Day 0適配智譜GLM-5.1旗艦模型

    4月8日,智譜新一代旗艦模型GLM-5.1實(shí)現(xiàn)開源。目前,股份云 C 系列 GPU已完成該
    的頭像 發(fā)表于 04-09 11:25 ?395次閱讀

    股份云C系列GPU全面適配通義千問Qwen3.5三款新模型

    今日,通義千問團(tuán)隊(duì)正式開源發(fā)布Qwen3.5系列中等規(guī)模模型,推出包括Qwen3.5-35B-A3B、Qwen3.5-122B-A10B、Qwen3.5-27B三個(gè)版本。股份旗下
    的頭像 發(fā)表于 02-28 10:05 ?732次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU全面<b class='flag-5'>適配</b>通義千問Qwen3.5三款新<b class='flag-5'>模型</b>

    股份云C系列GPU深度適配通義千問Qwen3.5模型

    今天,通義千問今天正式發(fā)布 Qwen3.5,并推出Qwen3.5系列的第一款模型 Qwen3.5-397B-A17B 的開放權(quán)重版本。股份
    的頭像 發(fā)表于 02-26 14:26 ?802次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU深度<b class='flag-5'>適配</b>通義千問Qwen3.5<b class='flag-5'>模型</b>

    云C系列GPU Day 0 適配智譜全新一代大模型GLM-5

    智譜AI正式上線并開源全新一代大模型 GLM-5,股份實(shí)現(xiàn)?Day 0 深度
    的頭像 發(fā)表于 02-12 10:53 ?1104次閱讀
    <b class='flag-5'>曦</b>云C系列GPU <b class='flag-5'>Day</b> <b class='flag-5'>0</b> <b class='flag-5'>適配</b>智譜全新一代大<b class='flag-5'>模型</b>GLM-5

    云C600 GPU產(chǎn)品適配階躍星辰基座模型Step 3.5 Flash

    今天,階躍星辰技術(shù)團(tuán)隊(duì)發(fā)布并開源最新旗艦基座模型 Step 3.5 Flash。股份已實(shí)現(xiàn)
    的頭像 發(fā)表于 02-02 14:44 ?549次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C600 GPU產(chǎn)品<b class='flag-5'>適配</b>階躍星辰基座<b class='flag-5'>模型</b>Step 3.5 <b class='flag-5'>Flash</b>

    云C500/C550 GPU產(chǎn)品適配PaddleOCR-VL-1.5模型

    PaddleOCR-VL 系列的全新迭代版本PaddleOCR-VL-1.5今天正式上線,云C500/C550 Day 0
    的頭像 發(fā)表于 01-30 10:19 ?1344次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>曦</b>云C500/C550 GPU產(chǎn)品<b class='flag-5'>適配</b>PaddleOCR-VL-1.5<b class='flag-5'>模型</b>

    股份云C系列GPU Day 0適配智譜GLM-4.6V多模態(tài)大模型

    12月8日智譜AI發(fā)布并開源 GLM-4.6V 系列多模態(tài)大模型,股份云C系列GPU完成
    的頭像 發(fā)表于 12-17 14:28 ?840次閱讀
    <b class='flag-5'>沐</b><b class='flag-5'>曦</b><b class='flag-5'>股份</b><b class='flag-5'>曦</b>云C系列GPU <b class='flag-5'>Day</b> <b class='flag-5'>0</b><b class='flag-5'>適配</b>智譜GLM-4.6<b class='flag-5'>V</b>多模態(tài)大<b class='flag-5'>模型</b>