chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

浪潮信息發(fā)布"元腦SD200"超節(jié)點(diǎn),面向萬億參數(shù)大模型創(chuàng)新設(shè)計(jì)

全球TMT ? 來源:全球TMT ? 作者:全球TMT ? 2025-08-08 22:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群


北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數(shù)大模型的超節(jié)點(diǎn)AI服務(wù)器"元腦SD200"。該產(chǎn)品基于浪潮信息創(chuàng)新研發(fā)的多主機(jī)低延遲內(nèi)存語義通信架構(gòu),以開放系統(tǒng)設(shè)計(jì)向上擴(kuò)展支持64路本土GPU芯片。元腦SD200可實(shí)現(xiàn)單機(jī)內(nèi)運(yùn)行超萬億參數(shù)大模型,并支持多個(gè)領(lǐng)先大模型機(jī)內(nèi)同時(shí)運(yùn)行及多智能體實(shí)時(shí)協(xié)作與按需調(diào)用,目前已率先實(shí)現(xiàn)商用。在實(shí)際評(píng)測中,元腦SD200運(yùn)行DeepSeek R1和Kimi K2等全參模型的64卡整機(jī)推理性能實(shí)現(xiàn)超線性擴(kuò)展。

wKgZO2iWBvSAWSl0AAD6jZAs1Wk311.jpg


當(dāng)前,混合專家模型(MoE)的高效架構(gòu)正在驅(qū)動(dòng)大模型參數(shù)規(guī)模持續(xù)擴(kuò)展,國內(nèi)外前沿大模型的參數(shù)量快速突破萬億規(guī)模,這給算力系統(tǒng)架構(gòu)提出新的挑戰(zhàn)。一方面,模型參數(shù)量增加和序列長度增加帶來的鍵值緩存(KV cache)激增,需要智能計(jì)算系統(tǒng)具有超大顯存空間承載,依靠單芯片或節(jié)點(diǎn)的性能提升已難以為繼;且其推理過程作為通信敏感型計(jì)算,對分布式計(jì)算通信延時(shí)要求極高,需要構(gòu)建更大向上擴(kuò)展(Scale up)高速互連域。另一方面,智能體AI開啟多模型協(xié)作的新范式,其推理過程需要生成比傳統(tǒng)模型多近百倍的數(shù)據(jù)詞元(token),導(dǎo)致計(jì)算量激增。

元腦SD200超節(jié)點(diǎn)AI服務(wù)器是浪潮信息面向萬億參數(shù)大模型AI時(shí)代而設(shè)計(jì),創(chuàng)新研發(fā)多主機(jī)低延遲內(nèi)存語義通信架構(gòu),基于開放總線交換技術(shù)構(gòu)建,在單機(jī)內(nèi)實(shí)現(xiàn)了64路GPU芯片的高速統(tǒng)一互連,成功解決萬億大模型對超大顯存空間和超低通信延時(shí)的核心需求。在開放架構(gòu)之上,元腦SD200通過智能總線管理和開放的預(yù)填充-解碼(Prefill-Decoder)分離推理框架實(shí)現(xiàn)軟硬件深度協(xié)同,智能化管理復(fù)雜AI計(jì)算任務(wù)。

- 在架構(gòu)層面,元腦SD200基于自主研發(fā)的開放總線交換技術(shù)首創(chuàng)多主機(jī)三維網(wǎng)格系統(tǒng)架構(gòu),實(shí)現(xiàn)64路本土GPU芯片高速互連;通過創(chuàng)新遠(yuǎn)端GPU虛擬映射技術(shù),突破多主機(jī)交換域統(tǒng)一編址難題,實(shí)現(xiàn)顯存統(tǒng)一地址空間擴(kuò)增8倍,單機(jī)可以提供最大4TB顯存和64TB內(nèi)存,為萬億參數(shù)、超長序列大模型提供充足鍵值緩存空間。同時(shí),依托百納秒級(jí)超低延遲鏈路,構(gòu)建64卡大高速互連域統(tǒng)一原生內(nèi)存語義通信,實(shí)測結(jié)果表明,在推理過程常見的小數(shù)據(jù)包通信場景中,全規(guī)約(All Reduce)性能表現(xiàn)優(yōu)異,顯著提升計(jì)算與通信效率。

- 在系統(tǒng)層面,根據(jù)萬億參數(shù)大模型計(jì)算、通信需求特征,浪潮信息開發(fā)智能總線管理系統(tǒng),實(shí)現(xiàn)超節(jié)點(diǎn)64卡全局最優(yōu)路由的自動(dòng)創(chuàng)建,支持不同拓?fù)淝袚Q,資源按需切分。對于全規(guī)約、全聚集(All Gather)等典型通信算子,開展不同數(shù)據(jù)量大小的細(xì)粒度通信策略設(shè)計(jì),如多層級(jí)通信機(jī)制等,實(shí)現(xiàn)通信延時(shí)進(jìn)一步降低。同時(shí)依托開放的PD分離框架,支持異步KV Cache高效傳輸與差異化并行策略,在提升業(yè)務(wù)服務(wù)級(jí)別目標(biāo)的同時(shí)保持對多元算力的兼容性,實(shí)現(xiàn)計(jì)算與通信架構(gòu)的深度協(xié)同優(yōu)化。

元腦SD200超節(jié)點(diǎn)AI服務(wù)器通過軟硬協(xié)同系統(tǒng)創(chuàng)新,成功向上擴(kuò)展突破芯片性能邊界,在大模型場景中展示出優(yōu)異的性能表現(xiàn)。結(jié)合優(yōu)化的PD分離框架,SD200超節(jié)點(diǎn)滿機(jī)運(yùn)行DeepSeek R1全參模型推理性能超線性提升比為3.7倍,滿機(jī)運(yùn)行Kimi K2全參模型推理性能超線性提升比為1.7倍。

wKgZPGiWBvWAcd4gAADlyNPyP2o769.jpg


當(dāng)前,開源模型的飛躍式進(jìn)步正在加速智能時(shí)代的到來,推動(dòng)研發(fā)范式從封閉走向開放協(xié)作。同時(shí),隨著大模型參數(shù)量的持續(xù)提升,對算力基礎(chǔ)設(shè)施的建設(shè)提出了更高要求。浪潮信息通過開放系統(tǒng)架構(gòu)創(chuàng)新,為開源大模型的規(guī)模化落地和應(yīng)用創(chuàng)新提供關(guān)鍵支撐。

審核編輯 黃宇

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • 半導(dǎo)體
    +關(guān)注

    關(guān)注

    339

    文章

    31204

    瀏覽量

    266372
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3755

    瀏覽量

    5268
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    從"替代人力"到"智能協(xié)同":履帶式巡檢機(jī)器人的產(chǎn)業(yè)躍遷

    2026年的工業(yè)智能化轉(zhuǎn)型浪潮中,一個(gè)顯著的趨勢正在形成——工業(yè)巡檢機(jī)器人正從單純的"人力替代工具"升級(jí)為具備感知、決策與協(xié)同能力的"智能體&
    的頭像 發(fā)表于 02-05 10:42 ?415次閱讀

    選EtherCAT模塊,別只看價(jià)格,先看"體檢報(bào)告"

    ±8kV靜電、±2kV浪涌、-42℃極寒、1500V高壓—這不是極限運(yùn)動(dòng),而是DPort-ECT模塊的出廠"必修課"。本文詳解工業(yè)級(jí)EtherCAT從站如何通過嚴(yán)苛測試關(guān)
    的頭像 發(fā)表于 02-04 11:46 ?447次閱讀
    選EtherCAT模塊,別只看價(jià)格,先看&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;體檢報(bào)告&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    中國信通院:SD200首個(gè)通過《節(jié)點(diǎn)測試大綱》評(píng)測,Token速度快至8.73ms!

    當(dāng)前,面對千億乃至萬億參數(shù)模型訓(xùn)練與推理日益增長的應(yīng)用需求,傳統(tǒng)一機(jī)八卡服務(wù)器已難以滿足性能要求,節(jié)點(diǎn)新型計(jì)算產(chǎn)品應(yīng)運(yùn)而生。中國
    的頭像 發(fā)表于 01-15 17:19 ?738次閱讀

    DeepSeek開源Engram:讓大模型擁有&amp;quot;過目不忘&amp;quot;的類記憶

    Transformer效率瓶頸的關(guān)鍵鑰匙。 傳統(tǒng)Transformer的"記憶困境" 當(dāng)前大語言模型面臨三大結(jié)構(gòu)性問題:注意力計(jì)算的O(n2)復(fù)雜度在長序列下成為瓶頸;所有知識(shí)隱式存儲(chǔ)在參數(shù)中,檢索常識(shí)需激活
    的頭像 發(fā)表于 01-14 16:07 ?453次閱讀
    DeepSeek開源Engram:讓大<b class='flag-5'>模型</b>擁有&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;過目不忘&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;的類<b class='flag-5'>腦</b>記憶

    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&amp;amp;quot;隱形守護(hù)者&amp;amp;quot;?

    當(dāng)長安汽車與北汽極狐拿到中國首批L3級(jí)自動(dòng)駕駛準(zhǔn)入許可的那一刻,整個(gè)產(chǎn)業(yè)鏈等待多年的&quot;靴子&quot;終于落地。在這個(gè)責(zé)任主體從駕駛員轉(zhuǎn)向車企的關(guān)鍵轉(zhuǎn)折下,系統(tǒng)可靠性成為真正的&quot
    的頭像 發(fā)表于 01-04 12:03 ?739次閱讀
    L3試點(diǎn)落地,和芯星通如何成為車企突圍的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;隱形守護(hù)者&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    &amp;quot;Access violation&amp;quot; 錯(cuò)誤,復(fù)位位置,重新打印

    &quot;Access violation&quot; 錯(cuò)誤
    的頭像 發(fā)表于 11-08 07:16 ?739次閱讀

    開源大模型算力革命下:電子谷連接技術(shù)的堅(jiān)守與未來

    推動(dòng)算力系統(tǒng)向節(jié)點(diǎn)架構(gòu)轉(zhuǎn)型。&quot;SD200";等新一代服務(wù)器通過開放總線技
    的頭像 發(fā)表于 09-19 08:03 ?619次閱讀
    開源大<b class='flag-5'>模型</b>算力革命下:電子谷連接技術(shù)的堅(jiān)守與未來

    光耦合器:電子世界的 &amp;quot;光橋梁&amp;quot;

    在現(xiàn)代電子設(shè)備的復(fù)雜電路中,信號(hào)的傳輸與隔離至關(guān)重要。就像城市交通中需要橋梁來跨越障礙、連接不同區(qū)域一樣,電子電路里也需要一座 &quot;橋梁&quot; 來實(shí)現(xiàn)信號(hào)的安全、高效傳輸,同時(shí)避免
    的頭像 發(fā)表于 08-22 16:58 ?1155次閱讀

    面向萬億級(jí)參數(shù)模型,“節(jié)點(diǎn)”涌現(xiàn)

    UniPoD系列節(jié)點(diǎn)產(chǎn)品,旨在為萬億級(jí)參數(shù)模型的訓(xùn)練與推理提供更強(qiáng)勁、更智能且更綠色的算力支持。 ? H3C UniPoD系列
    的頭像 發(fā)表于 08-03 02:37 ?9105次閱讀
    <b class='flag-5'>面向</b><b class='flag-5'>萬億</b>級(jí)<b class='flag-5'>參數(shù)</b>大<b class='flag-5'>模型</b>,“<b class='flag-5'>超</b><b class='flag-5'>節(jié)點(diǎn)</b>”涌現(xiàn)

    精密設(shè)備的&amp;amp;quot;電力保鏢&amp;amp;quot;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    一、用戶痛點(diǎn):精密設(shè)備的&quot;斷電恐懼癥&quot;在數(shù)據(jù)中心、醫(yī)療實(shí)驗(yàn)室、工業(yè)控制等場景中,精密電子設(shè)備對電源的依賴已達(dá)到&quot;零容忍&quot;級(jí)別:數(shù)據(jù)安全危機(jī):服務(wù)
    的頭像 發(fā)表于 07-25 09:00 ?1079次閱讀
    精密設(shè)備的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;電力保鏢&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;:優(yōu)比施UPS如何守護(hù)數(shù)據(jù)與硬件安全?

    萬億參數(shù)!企智一體機(jī)率先支持Kimi K2大模型

    北京2025年7月21日 /美通社/ --?浪潮信息宣布企智一體機(jī)已率先完成對Kimi K2 萬億參數(shù)
    的頭像 發(fā)表于 07-22 09:27 ?671次閱讀
    <b class='flag-5'>萬億</b><b class='flag-5'>參數(shù)</b>!<b class='flag-5'>元</b><b class='flag-5'>腦</b>企智一體機(jī)率先支持Kimi K2大<b class='flag-5'>模型</b>

    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測設(shè)備:清潔能源電網(wǎng)的&amp;amp;quot;安全衛(wèi)士&amp;amp;quot;

    文章由山東華科信息技術(shù)有限公司提供在&quot;雙碳&quot;目標(biāo)驅(qū)動(dòng)下,地?zé)岚l(fā)電作為穩(wěn)定基荷電源,其電網(wǎng)接入設(shè)備的可靠性至關(guān)重要。環(huán)網(wǎng)柜作為地?zé)犭娬九c主網(wǎng)連接的關(guān)鍵節(jié)點(diǎn),其內(nèi)部絕緣
    的頭像 發(fā)表于 07-16 10:15 ?688次閱讀
    地?zé)岚l(fā)電環(huán)網(wǎng)柜局放監(jiān)測設(shè)備:清潔能源電網(wǎng)的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;安全衛(wèi)士&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&amp;amp;quot;黃金搭檔&amp;amp;quot;?

    在導(dǎo)航技術(shù)領(lǐng)域,GNSS(全球?qū)Ш叫l(wèi)星系統(tǒng))和INS(慣性導(dǎo)航系統(tǒng))的結(jié)合,一直被業(yè)界譽(yù)為&quot;黃金搭檔&quot;。它們優(yōu)勢互補(bǔ),克服了單一系統(tǒng)的局限性,為高精度、高可靠性的導(dǎo)航提供了完美
    的頭像 發(fā)表于 07-09 17:12 ?1136次閱讀
    為什么GNSS/INS組合被譽(yù)為導(dǎo)航界的&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;黃金搭檔&<b class='flag-5'>amp</b>;<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;?

    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場景的&amp;quot;千面需求&amp;quot;

    核心洞察:標(biāo)準(zhǔn)化機(jī)器人難以破解工業(yè)場景的&quot;需求碎片化&quot;困局。富唯智能通過?&quot;五大模塊柔性架構(gòu)+零代碼中樞&quot;?,為?人形機(jī)器人為什么要定制?提供了
    的頭像 發(fā)表于 06-10 17:19 ?1488次閱讀
    人形機(jī)器人為什么要定制? ——揭秘工業(yè)場景的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;千面需求&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;

    倉儲(chǔ)界的&amp;quot;速效救心丸&amp;quot;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例

    實(shí)戰(zhàn)案例,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān),倉儲(chǔ)界的&quot;速效救心丸&quot;
    的頭像 發(fā)表于 05-11 10:32 ?893次閱讀
    倉儲(chǔ)界的&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;速效救心丸&<b class='flag-5'>amp</b>;<b class='flag-5'>quot</b>;,Ethercat轉(zhuǎn)PROFINET網(wǎng)關(guān)實(shí)戰(zhàn)案例