chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

潤和軟件StackRUNS異構(gòu)分布式推理框架的應用案例

潤和軟件 ? 來源:潤和軟件 ? 2025-06-13 09:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)自主研發(fā)的StackRUNS異構(gòu)分布式推理框架已在實際場景中取得顯著成效,成功應用于大型園區(qū)多模態(tài)模型演練及高校滿血版DeepSeek-MoE 671B的運行,有效推動了大模型技術的快速落地。

案例一:大型園區(qū)多模態(tài)模型演練

案例背景:

由于建設分期不同及承建單位多樣,該智慧園區(qū)的AI基礎設施呈現(xiàn)出高度異構(gòu)特征,包括NVIDIA T4、NVIDIA 3090、Atlas 300I DUO等多種AI加速設備,并在不同場景下協(xié)同運行。這些設備承擔著包括人流密度監(jiān)測、人臉識別、車牌抓拍等計算機視覺任務,系統(tǒng)負載、資源調(diào)度與運維策略已形成穩(wěn)定運行機制。

近期,該園區(qū)在安防升級過程中面臨一項臨時但復雜的智能分析挑戰(zhàn):在突發(fā)事件響應、演練預警或夜間非業(yè)務時段,需臨時部署并運行多模態(tài)大模型,實現(xiàn)圖文聯(lián)合理解、行為鏈條分析、場景異常檢測等復雜推理任務。該需求需在不增加硬件投入、不影響現(xiàn)有業(yè)務運行的前提下完成。

應對方案:

為應對這一挑戰(zhàn),潤和軟件自研的StackRUNS異構(gòu)分布式推理框架成為關鍵解決方案。該框架具備以下核心能力:

1. 異構(gòu)算力識別與建模:自動識別各設備的計算能力、顯存規(guī)格與精度支持能力,為模型切片和任務分配提供實時依據(jù);

2. 模型智能切分與并行執(zhí)行:支持基于專家路由與自動切分策略,將超大模型按需劃分為多個計算子任務,分布式調(diào)度到可用節(jié)點;

3. 輕量級調(diào)度與動態(tài)推理通路編排:在不干擾現(xiàn)有CV業(yè)務的前提下,構(gòu)建獨立推理通路,臨時占用空閑資源執(zhí)行推理任務,任務完成后自動回收;

4. 混合精度與量化模型支持:支持INT8、INT4等低精度模型快速加載,提升內(nèi)存利用率與執(zhí)行效率;

5. 統(tǒng)一通信與高效協(xié)同機制:通過通信適配層封裝多協(xié)議通信接口,實現(xiàn)多設備間高效數(shù)據(jù)傳輸與協(xié)同執(zhí)行。

60eaf6f6-45df-11f0-b715-92fbcf53809c.png

StackRUNS多模態(tài)模型場景圖

應用效果:

StackRUNS幫助超大模型在資源受限、基礎設施異構(gòu)的環(huán)境中,實現(xiàn)“即需即調(diào)、彈性運行、無感部署”的能力,顯著提升園區(qū)對突發(fā)安防場景的智能響應水平,為大模型在城市級AI基礎設施中的靈活應用提供了可復制范式。

案例二:高校運行滿血版DeepSeek-MoE 671B

案例背景:

某高校在人工智能教學與科研實踐中,面臨運行超大規(guī)模模型的現(xiàn)實挑戰(zhàn)。一方面,教學樓、實驗樓與計算中心分布著多種異構(gòu)計算資源,包括GPU、NPU設備及部分高性能CPU節(jié)點;另一方面,受限于經(jīng)費與硬件條件,難以通過集中式部署滿足超大模型推理需求。

為此,該高校引入潤和軟件自研的StackRUNS異構(gòu)分布式推理框架,成功在現(xiàn)有資源基礎上部署并運行了DeepSeek-MoE 671B級別的多模態(tài)大模型。

攻克難點:

1. 通信開銷高,跨設備、節(jié)點推理效率受限:傳統(tǒng)通信架構(gòu)難以適配異構(gòu)環(huán)境,頻繁阻塞;

2. 模型規(guī)模大、結(jié)構(gòu)復雜度高:單個子模型或路由后激活路徑仍需百GB級顯存支撐,傳統(tǒng)GPU、NPU單卡難以支撐模型加載與中間態(tài)存儲;

3. 切片并行策略自動生成難:模型需劃分為跨卡跨節(jié)點子圖,兼顧通信代價、算子依賴與硬件負載能力,自動化策略生成復雜;

4. 模型運行狀態(tài)監(jiān)控與可視化困難:推理過程中需監(jiān)控路由結(jié)果、設備負載、通信代價、緩存命中率等。

6105b7de-45df-11f0-b715-92fbcf53809c.png

通過StackRUNS部署滿血版DeepSeek示例圖

最終效果:

借助StackRUNS,高校成功打通了異構(gòu)設備之間的算力協(xié)同壁壘,實現(xiàn)了超大模型的低門檻部署與高效推理,廣泛應用于圖文語義理解、跨模態(tài)知識挖掘、學生AI實驗等場景。該方案不僅顯著提升了設備利用率與推理任務執(zhí)行效率,也加速了人工智能專業(yè)課程與科研課題向真實算力環(huán)境的落地驗證,真正實現(xiàn)了“在資源有限條件下,用分布式智能拼出超級算力”,為高校人工智能教學與科研提供了強有力的技術支撐。

江蘇潤和軟件股份有限公司(簡稱“潤和軟件”)成立于2006年,2012年在深圳證券交易所創(chuàng)業(yè)板上市(證券代碼:300339),是國家重點規(guī)劃布局內(nèi)的大型軟件企業(yè)。公司總部位于南京,在北京、上海、深圳、香港等22個國內(nèi)主要城市設有研發(fā)中心或分子公司,在日本、美國、新加坡等國設有海外分支機構(gòu),全球員工約13000人,擁有全球化的技術整合、客戶響應與服務到達能力。

秉承“做民族軟件脊梁,擔世界進步責任”的使命,潤和軟件致力成為“中國數(shù)智技術與服務創(chuàng)新的引領者”,通過國產(chǎn)化、數(shù)字化、智能化創(chuàng)新技術,軟硬件一體化解決方案能力及全生命周期軟件服務體系,激活行業(yè)新動能、發(fā)展新質(zhì)生產(chǎn)力,助力廣大客戶數(shù)字化轉(zhuǎn)型和智能化升級。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關注

    關注

    89

    文章

    37959

    瀏覽量

    295761
  • 潤和軟件
    +關注

    關注

    1

    文章

    375

    瀏覽量

    1936
  • 大模型
    +關注

    關注

    2

    文章

    3432

    瀏覽量

    4951

原文標題:潤和軟件StackRUNS異構(gòu)分布式推理框架行業(yè)應用案例

文章出處:【微信號:hoperun300339,微信公眾號:潤和軟件】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何解決分布式光伏計量難題?

    分布式光伏成增長主力 據(jù)《2025-2030年中國分布式光伏行業(yè)市場前景預測及未來發(fā)展趨勢研究報告》顯示,2024年中國分布式光伏新增裝機118.18GW,同比增長23%,占光伏新增裝機總量的43
    的頭像 發(fā)表于 11-07 14:55 ?143次閱讀
    如何解決<b class='flag-5'>分布式</b>光伏計量難題?

    【節(jié)能學院】Acrel-1000DP分布式光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW 分布式光伏中應用

    摘要:在“雙碳”和新型電力系統(tǒng)建設背景下,分布式光伏接入比例不斷提高,對配電網(wǎng)電壓、調(diào)度運行及調(diào)峰等環(huán)節(jié)造成強烈沖擊。本文設計包含平臺層、設備層二層架構(gòu)體系的分布式光伏管控平臺,以及小容量工商業(yè)
    的頭像 發(fā)表于 08-23 08:04 ?3290次閱讀
    【節(jié)能學院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏監(jiān)控系統(tǒng)在奉賢平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中應用

    分布式光伏發(fā)電監(jiān)測系統(tǒng)技術方案

    分布式光伏發(fā)電監(jiān)測系統(tǒng)技術方案 柏峰【BF-GFQX】一、系統(tǒng)目標 :分布式光伏發(fā)電監(jiān)測系統(tǒng)旨在通過智能化的監(jiān)測手段,實現(xiàn)對分布式光伏電站的全方位、高精度、實時化管理。該系統(tǒng)能
    的頭像 發(fā)表于 08-22 10:51 ?2868次閱讀
    <b class='flag-5'>分布式</b>光伏發(fā)電監(jiān)測系統(tǒng)技術方案

    雙電機分布式驅(qū)動汽車高速穩(wěn)定性機電耦合控制

    摘要:為了利用所設計的雙電機防滑差速驅(qū)動系統(tǒng)來提高分布式驅(qū)動汽車的動力學性能,在前期同軸耦合驅(qū)動控制理論研究的基礎上,開展該車的高速穩(wěn)定性機電耦合控制研究。建立并驗證包含所設計驅(qū)動系統(tǒng)在內(nèi)的分布式
    發(fā)表于 06-18 16:37

    軟件發(fā)布StackRUNS異構(gòu)分布式推理框架

    當下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應用場景日益復雜,企業(yè)正面臨異構(gòu)算力資源碎片化帶來的嚴峻挑戰(zhàn)。為應對行業(yè)痛點,江蘇軟件股份有限公司(以下簡稱“
    的頭像 發(fā)表于 06-13 09:10 ?1174次閱讀
    <b class='flag-5'>潤</b>和<b class='flag-5'>軟件</b>發(fā)布<b class='flag-5'>StackRUNS</b><b class='flag-5'>異構(gòu)</b><b class='flag-5'>分布式</b><b class='flag-5'>推理</b><b class='flag-5'>框架</b>

    曙光存儲領跑中國分布式存儲市場

    近日,賽迪顧問發(fā)布《中國分布式存儲市場研究報告(2025)》,指出2024 年中國分布式存儲市場首次超過集中式存儲,規(guī)模達 198.2 億元,增速 43.7%。
    的頭像 發(fā)表于 05-19 16:50 ?988次閱讀

    分布式光伏發(fā)運維系統(tǒng)實際應用案例分享

    安科瑞劉鴻鵬 摘?要 分布式光伏發(fā)電系統(tǒng)其核心特點是發(fā)電設備靠近用電負荷中心,通常安裝在屋頂、建筑立面或閑置空地上,截至2025年,分布式光伏發(fā)電系統(tǒng)在全球和中國范圍內(nèi)取得了顯著發(fā)展,成為能源轉(zhuǎn)型
    的頭像 發(fā)表于 04-09 14:46 ?961次閱讀
    <b class='flag-5'>分布式</b>光伏發(fā)運維系統(tǒng)實際應用案例分享

    淺談工商企業(yè)用電管理的分布式儲能設計

    文章設計了一種新的用于工商業(yè)用電管理的分布式儲能系統(tǒng)。由于儲能系統(tǒng)硬件置換成本高,選擇在傳統(tǒng)儲能系統(tǒng)的硬件框架基礎上,對控制軟件進行優(yōu)化設計,建立分布式儲能系統(tǒng)模型,分析發(fā)電量、儲電量
    的頭像 發(fā)表于 03-24 15:43 ?3256次閱讀
    淺談工商企業(yè)用電管理的<b class='flag-5'>分布式</b>儲能設計

    分布式光伏如何實現(xiàn)防逆流?

    分布式光伏如何實現(xiàn)防逆流
    的頭像 發(fā)表于 03-24 13:31 ?580次閱讀
    <b class='flag-5'>分布式</b>光伏如何實現(xiàn)防逆流?

    在采用異構(gòu)模式推理時,如何檢查每層使用的設備是什么?

    異構(gòu)模式推理時,無法檢查每層使用的設備是什么
    發(fā)表于 03-06 06:49

    軟件AIRUNS智能中樞平臺接入DeepSeek大模型

    近日,江蘇軟件股份有限公司(以下簡稱“軟件”)自主研發(fā)的AIRUNS智能中樞平臺已全面接入國內(nèi)領先的大模型DeepSeek,為企業(yè)提供從模型訓練、
    的頭像 發(fā)表于 02-07 11:06 ?1761次閱讀
    <b class='flag-5'>潤</b>和<b class='flag-5'>軟件</b>AIRUNS智能中樞平臺接入DeepSeek大模型

    分布式云化數(shù)據(jù)庫有哪些類型

    分布式云化數(shù)據(jù)庫有哪些類型?分布式云化數(shù)據(jù)庫主要類型包括:關系型分布式數(shù)據(jù)庫、非關系型分布式數(shù)據(jù)庫、新SQL分布式數(shù)據(jù)庫、以列方式存儲數(shù)據(jù)、
    的頭像 發(fā)表于 01-15 09:43 ?847次閱讀

    基于ptp的分布式系統(tǒng)設計

    在現(xiàn)代分布式系統(tǒng)中,精確的時間同步對于確保數(shù)據(jù)一致性、系統(tǒng)穩(wěn)定性和性能至關重要。PTP(Precision Time Protocol)是一種網(wǎng)絡協(xié)議,用于在分布式系統(tǒng)中實現(xiàn)高精度的時間同步
    的頭像 發(fā)表于 12-29 10:09 ?945次閱讀

    HarmonyOS Next 應用元服務開發(fā)-分布式數(shù)據(jù)對象遷移數(shù)據(jù)文件資產(chǎn)遷移

    使用分布式數(shù)據(jù)對象遷移數(shù)據(jù),當需要遷移的數(shù)據(jù)較大(100KB以上)或需要遷移文件時,可以使用分布式數(shù)據(jù)對象。原理與接口說明詳見分布式數(shù)據(jù)對象跨設備數(shù)據(jù)同步。 說明:自API 12起,由于直接使用跨
    發(fā)表于 12-24 10:11

    HarmonyOS Next 應用元服務開發(fā)-分布式數(shù)據(jù)對象遷移數(shù)據(jù)權(quán)限與基礎數(shù)據(jù)

    使用分布式數(shù)據(jù)對象遷移數(shù)據(jù),當需要遷移的數(shù)據(jù)較大(100KB以上)或需要遷移文件時,可以使用分布式數(shù)據(jù)對象。原理與接口說明詳見分布式數(shù)據(jù)對象跨設備數(shù)據(jù)同步。 說明:自API 12起,由于直接使用跨
    發(fā)表于 12-24 09:40