chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

摩爾線程發(fā)布SimuMax v1.1:從仿真工具升級(jí)為全棧工作流平臺(tái),助力大模型訓(xùn)練提效

摩爾線程 ? 來源:廠商供稿 ? 作者:摩爾線程 ? 2026-01-09 09:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,摩爾線程正式發(fā)布開源大模型分布式訓(xùn)練仿真工具SimuMax的1.1版本。該版本在完整繼承v1.0高精度仿真能力的基礎(chǔ)上,實(shí)現(xiàn)了從單一工具到一體化全棧工作流平臺(tái)的重要升級(jí),為大模型訓(xùn)練的仿真與調(diào)優(yōu)提供系統(tǒng)化支持。


本次更新聚焦三大核心創(chuàng)新:用戶友好的可視化配置界面、智能并行策略搜索,以及融合計(jì)算與通信效率建模的System-Config生成流水線。新版本同時(shí)提升了對(duì)主流訓(xùn)練框架Megatron-LM的兼容性,并增強(qiáng)了對(duì)混合并行訓(xùn)練中復(fù)雜通信行為的建模精度,使仿真環(huán)境更貼近真實(shí)生產(chǎn)場(chǎng)景。

SimuMax是一款專為大語言模型(LLM)分布式訓(xùn)練負(fù)載設(shè)計(jì)的仿真模擬工具,可為單卡到萬卡集群提供仿真支持。它無需實(shí)際執(zhí)行完整訓(xùn)練過程,即可高精度模擬訓(xùn)練中的顯存使用和性能表現(xiàn),幫助用戶深入洞察訓(xùn)練效率,探索提升計(jì)算效能的優(yōu)化途徑。

平臺(tái)升級(jí):從精準(zhǔn)仿真到智能工作流

SimuMax v1.1在高精度仿真能力的基礎(chǔ)上,通過以下多項(xiàng)功能構(gòu)建了更完整、更智能的工作流:
·智能并行策略搜索:引入策略搜索支持,自動(dòng)探索并識(shí)別更優(yōu)的并行化及執(zhí)行策略,降低調(diào)參成本,提升訓(xùn)練效率;
·系統(tǒng)配置生成流水線:新增系統(tǒng)配置文件生成流水線,包含計(jì)算效率與通信效率的刻畫,以實(shí)現(xiàn)更真實(shí)的系統(tǒng)級(jí)建模;
·增強(qiáng)的框架兼容性與優(yōu)化:新增對(duì)Megatron-LM v0.14的支持,主要適配了新版本Moe Router的顯存優(yōu)化特性;
·精細(xì)化帶寬爭(zhēng)用建模:專門優(yōu)化了在專家并行(EP)/張量并行(TP)與數(shù)據(jù)并行(DP)混合場(chǎng)景下的節(jié)點(diǎn)間網(wǎng)絡(luò)帶寬競(jìng)爭(zhēng)模擬,提升大規(guī)模集群仿真的準(zhǔn)確性。

體驗(yàn)革新:可視化界面,賦能極簡(jiǎn)操作

SimuMax v1.1引入了直觀的可視化配置界面。用戶通過簡(jiǎn)單交互,即可快速完成從單卡到萬卡集群的訓(xùn)練任務(wù)定義,極大簡(jiǎn)化工作流,使工程師更專注于訓(xùn)練策略設(shè)計(jì)與深層性能優(yōu)化,提升模型研發(fā)與調(diào)優(yōu)效率。a79f3e32-ec82-11f0-92de-92fbcf53809c.png

圖示:SimuMax v1.1的可視化配置界面

快速開始:四步啟動(dòng)高效仿真
開發(fā)者可通過以下步驟,快速體驗(yàn)SimuMax:

克隆倉(cāng)庫(kù):
·gitclonegit@github.com:MooreThreads/SimuMax.git
·cdSimuMax

安裝Python包:
·pip install -rrequirements.txt
·pip install -v -e .

運(yùn)行示例:
參考項(xiàng)目中的教程和示例(如examples/perf_llama3_8b_tp1_pp2.py),即可開始使用SimuMax進(jìn)行訓(xùn)練仿真。

啟動(dòng)SimuMax應(yīng)用:
開發(fā)者可以選擇啟動(dòng)SimuMax應(yīng)用,訪問交互式配置界面。
·cdapp
·bash install.sh
·streamlit run streamlit_app.py

持續(xù)優(yōu)化與生態(tài)共建

SimuMax已在GitHub全面開源,開發(fā)者可訪問倉(cāng)庫(kù)獲取源代碼、詳細(xì)文檔和示例。摩爾線程鼓勵(lì)開發(fā)者通過提交Issue報(bào)告問題或通過Pull Request貢獻(xiàn)代碼,共同促進(jìn)SimuMax功能的完善和軟件生態(tài)的繁榮。

·SimuMax GitHub開源地址:https://github.com/MooreThreads/SimuMax
·SimuMax v1.1版本:https://github.com/MooreThreads/SimuMax/releases/tag/v1.1

摩爾線程始終致力于為開發(fā)者提供高效、創(chuàng)新的軟件工具鏈。SimuMax的發(fā)布,為大模型分布式訓(xùn)練提供了從可視化配置、自動(dòng)化策略推薦到高精度仿真的完整工作流,助力AI產(chǎn)業(yè)提升算力利用率,探索更高效、更智能的訓(xùn)練范式。

未來,SimuMax團(tuán)隊(duì)將持續(xù)迭代,計(jì)劃進(jìn)一步擴(kuò)展平臺(tái)能力,包括支持ViT模型、引入大規(guī)模訓(xùn)練的數(shù)據(jù)并行(DP)衰減估計(jì),以及支持計(jì)算通信重疊(TP/EP Overlap)模擬等功能,不斷突破訓(xùn)練仿真優(yōu)化的技術(shù)邊界。

關(guān)于摩爾線程
摩爾線程以全功能GPU為核心,致力于向全球提供加速計(jì)算的基礎(chǔ)設(shè)施和一站式解決方案,為各行各業(yè)的數(shù)智化轉(zhuǎn)型提供強(qiáng)大的AI計(jì)算支持。我們的目標(biāo)是成為具備國(guó)際競(jìng)爭(zhēng)力的GPU領(lǐng)軍企業(yè),為融合人工智能和數(shù)字孿生的數(shù)智世界打造先進(jìn)的加速計(jì)算平臺(tái)。我們的愿景是為美好世界加速。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 摩爾線程
    +關(guān)注

    關(guān)注

    2

    文章

    279

    瀏覽量

    6456
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3650

    瀏覽量

    5189
  • LLM
    LLM
    +關(guān)注

    關(guān)注

    1

    文章

    346

    瀏覽量

    1332

原文標(biāo)題:摩爾線程發(fā)布SimuMax v1.1:從仿真工具升級(jí)為全棧工作流平臺(tái),助力大模型訓(xùn)練提效

文章出處:【微信號(hào):moorethreads,微信公眾號(hào):摩爾線程】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    摩爾線程 × 五一視界|共建國(guó)產(chǎn)化的物理AI仿真體系

    線程以旗艦級(jí)AI訓(xùn)推一體全功能GPU MTT S5000的強(qiáng)勁算力,深度賦能五一視界下一代智駕仿真平臺(tái) SimOne 4.0,雙方已高效完成系統(tǒng)性適配與深度優(yōu)化。 通過打通模型感知
    的頭像 發(fā)表于 02-24 10:18 ?577次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b> × 五一視界|共建<b class='flag-5'>全</b><b class='flag-5'>棧</b>國(guó)產(chǎn)化的物理AI<b class='flag-5'>仿真</b>體系

    國(guó)產(chǎn)AI Coding上線:摩爾線程+硅基流動(dòng)+智譜,強(qiáng)強(qiáng)聯(lián)合!

    摩爾線程今日正式推出AI Coding Plan 智能編程服務(wù)。作為首個(gè)基于國(guó)產(chǎn)全功能 GPU 算力底座構(gòu)建的智能開發(fā)解決方案,該服務(wù)以 MTT S5000 強(qiáng)勁的精度計(jì)算能力核心
    的頭像 發(fā)表于 02-03 17:07 ?1466次閱讀
    <b class='flag-5'>全</b><b class='flag-5'>棧</b>國(guó)產(chǎn)AI Coding上線:<b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>+硅基流動(dòng)+智譜,強(qiáng)強(qiáng)聯(lián)合!

    《電子發(fā)燒友電子設(shè)計(jì)周報(bào)》聚焦硬科技領(lǐng)域核心價(jià)值 26年第1期:2026.1.4--2025.1.16

    的 Isaac Lab-Arena,以及邊緣到云端計(jì)算框架 OSMO,以簡(jiǎn)化機(jī)器人訓(xùn)練工作流。 29、摩爾線程發(fā)布
    發(fā)表于 01-16 20:20

    國(guó)產(chǎn)算力首證具身大腦模型訓(xùn)練實(shí)力:摩爾線程聯(lián)合智源研究院完成RoboBrain 2.5流程訓(xùn)練

    智算集群 ,成功完成智源自研具身大腦模型 RoboBrain 2.5 的 流程訓(xùn)練 。 這是行業(yè)內(nèi)首次驗(yàn)證國(guó)產(chǎn)算力集群在具身智能大模型訓(xùn)練
    的頭像 發(fā)表于 01-14 09:05 ?511次閱讀
    國(guó)產(chǎn)算力首證具身大腦<b class='flag-5'>模型</b><b class='flag-5'>訓(xùn)練</b>實(shí)力:<b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>聯(lián)合智源研究院完成RoboBrain 2.5<b class='flag-5'>全</b>流程<b class='flag-5'>訓(xùn)練</b>

    摩爾線程在MDC 2025重磅發(fā)布創(chuàng)新成果

    12月20日,在首屆MUSA開發(fā)者大會(huì)上,摩爾線程創(chuàng)始人、董事長(zhǎng)兼CEO張建中發(fā)表主題演講,系統(tǒng)展示了以自主MUSA統(tǒng)一架構(gòu)核心的創(chuàng)新
    的頭像 發(fā)表于 12-22 18:04 ?1455次閱讀

    摩爾線程新一代大語言模型對(duì)齊框架URPO入選AAAI 2026

    近日,摩爾線程在人工智能前沿領(lǐng)域取得重要突破,其提出的新一代大語言模型對(duì)齊框架——URPO統(tǒng)一獎(jiǎng)勵(lì)與策略優(yōu)化,相關(guān)研究論文已被人工智能領(lǐng)域的國(guó)際頂級(jí)學(xué)術(shù)會(huì)議AAAI 2026收錄。這一成果標(biāo)志著
    的頭像 發(fā)表于 11-17 16:03 ?498次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>新一代大語言<b class='flag-5'>模型</b>對(duì)齊框架URPO入選AAAI 2026

    摩爾線程發(fā)布模型訓(xùn)練仿真工具SimuMax v1.0

    近日,摩爾線程正式發(fā)布并開源大模型分布式訓(xùn)練仿真工具
    的頭像 發(fā)表于 09-11 18:19 ?3717次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b><b class='flag-5'>發(fā)布</b>大<b class='flag-5'>模型</b><b class='flag-5'>訓(xùn)練</b><b class='flag-5'>仿真</b><b class='flag-5'>工具</b><b class='flag-5'>SimuMax</b> <b class='flag-5'>v</b>1.0

    摩爾線程發(fā)布Torch-MUSA v2.1.1版本

    近日,摩爾線程發(fā)布其面向PyTorch深度學(xué)習(xí)框架的MUSA擴(kuò)展庫(kù)——Torch-MUSA v2.1.1。該版本在v2.1.0的基礎(chǔ)上,進(jìn)一
    的頭像 發(fā)表于 09-10 11:02 ?1039次閱讀

    摩爾線程發(fā)布圖形顯卡驅(qū)動(dòng)程序v310.120

    8月20日,摩爾線程發(fā)布版本號(hào)為v310.120的圖形顯卡驅(qū)動(dòng)程序。本次更新帶來多項(xiàng)重大技術(shù)升級(jí):新增對(duì)Windows 11 24H2版本的
    的頭像 發(fā)表于 08-21 16:07 ?1390次閱讀

    摩爾線程吳慶詳解 MUSA 軟件:以技術(shù)創(chuàng)新釋放 KUAE 集群潛能,引領(lǐng) GPU 計(jì)算新高度?

    的分享。GPU 計(jì)算軟件開發(fā)總監(jiān)吳慶登上講臺(tái),發(fā)表了題為《摩爾線程 MUSA 軟件助力 KUAE 集群釋放無限潛能》的演講。他專業(yè)視角出
    的頭像 發(fā)表于 07-28 13:47 ?6085次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>吳慶詳解 MUSA 軟件<b class='flag-5'>棧</b>:以技術(shù)創(chuàng)新釋放 KUAE 集群潛能,引領(lǐng) GPU 計(jì)算新高度?

    摩爾線程亮相WAIC 2025:以“AI工廠”理念驅(qū)動(dòng)算力進(jìn)化,AI應(yīng)用賦能千行百業(yè)

    模型的“超級(jí)工廠”。此次參會(huì)不僅彰顯了摩爾線程在AI基礎(chǔ)設(shè)施領(lǐng)域的系統(tǒng)性創(chuàng)新,更通過多行業(yè)案例展現(xiàn)了國(guó)產(chǎn)GPU技術(shù)的廣泛應(yīng)用前景。 ? ? 首“AI工廠”理念:系統(tǒng)性創(chuàng)新突破大
    的頭像 發(fā)表于 07-28 11:34 ?2123次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>亮相WAIC 2025:以“AI工廠”理念驅(qū)動(dòng)算力進(jìn)化,<b class='flag-5'>全</b><b class='flag-5'>棧</b>AI應(yīng)用賦能千行百業(yè)

    摩爾線程“AI工廠”:五大核心技術(shù)支撐,打造大模型訓(xùn)練超級(jí)工廠

    演講中表示,應(yīng)對(duì)生成式AI爆發(fā)式增長(zhǎng)下的大模型訓(xùn)練效率瓶頸,摩爾線程將通過系統(tǒng)級(jí)工程創(chuàng)新,構(gòu)建新一代AI
    的頭像 發(fā)表于 07-28 11:28 ?4551次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>“AI工廠”:五大核心技術(shù)支撐,打造大<b class='flag-5'>模型</b><b class='flag-5'>訓(xùn)練</b>超級(jí)工廠

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+Agent開發(fā)平臺(tái)

    開發(fā)平臺(tái)有4大特點(diǎn) 1)技術(shù)集成性 Agent開發(fā)平臺(tái)集成了大模型調(diào)用、提示詞工程、插件、線上編程運(yùn)行環(huán)境、知識(shí)庫(kù)、工作流、數(shù)據(jù)庫(kù)等多種功能模塊,
    發(fā)表于 05-13 12:24

    摩爾線程GPU成功適配Deepseek-V3-0324大模型

    架構(gòu)和全功能GPU的強(qiáng)大技術(shù)實(shí)力,摩爾線程迅速響應(yīng)并完成了對(duì)DeepSeek-V3的無縫升級(jí),實(shí)現(xiàn)了零報(bào)錯(cuò)、零兼容性問題的光速部署,充分展現(xiàn)了摩爾
    的頭像 發(fā)表于 03-31 11:34 ?1282次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU成功適配Deepseek-<b class='flag-5'>V</b>3-0324大<b class='flag-5'>模型</b>

    摩爾線程GPU原生FP8計(jì)算助力AI訓(xùn)練

    并行訓(xùn)練和推理,顯著提升了訓(xùn)練效率與穩(wěn)定性。摩爾線程是國(guó)內(nèi)率先原生支持FP8計(jì)算精度的國(guó)產(chǎn)GPU企業(yè),此次開源不僅為AI訓(xùn)練和推理提供了全新
    的頭像 發(fā)表于 03-17 17:05 ?1528次閱讀
    <b class='flag-5'>摩爾</b><b class='flag-5'>線程</b>GPU原生FP8計(jì)算<b class='flag-5'>助力</b>AI<b class='flag-5'>訓(xùn)練</b>