chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列

浪潮存儲 ? 來源:浪潮存儲 ? 2024-05-08 09:38 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

近日,浪潮信息發(fā)布為大模型專門優(yōu)化的分布式全閃存儲AS13000G7-N系列。該系列依托浪潮信息自研分布式文件系統,搭載新一代數據加速引擎DataTurbo,通過盤控協同、GPU直訪存儲、全局一致性緩存等技術為AI大模型數據歸集、訓練、數據歸檔與管理等階段提供強大存儲支撐能力,助力用戶加速大模型系統的創(chuàng)新及應用落地。

化解大模型時代的存儲挑戰(zhàn)

構建堅實的數據存儲底座

大模型已經成為驅動數字經濟深度創(chuàng)新、引領企業(yè)業(yè)務變革、加速形成新質生產力的重要動能,隨著大模型參數量和數據量的極速膨脹,多源異構數據的傳、用、管、存,正在成為制約生成式AI落地的瓶頸之一,用戶亟需構建更加高效的存儲底座。在數據準備階段,在規(guī)模大、來源廣泛、格式多樣的原始數據中,篩選和清洗出利用于訓練的高質量數據常會耗費大量時間;在模型訓練階段,海量小文件數據加載、Checkpoint數據調用對IO處理效率提出嚴苛要求;模型訓練之后,多個數據資源池無法互通、海量冷數據歸檔帶來較高的數據管理復雜度。

作為率先在業(yè)界提出分布式融合存儲的廠商,浪潮信息聚焦行業(yè)客戶的大模型落地需求與核心痛點,基于NVMe SSD研發(fā)出高效適配和優(yōu)化的分布式全閃存儲AS13000G7-N系列。硬件方面,AS13000G7-N是一款2U24盤位的全閃存儲機型,搭載英特爾至強第四、第五代可擴展處理器,支持400 Gb 網卡,同時每盤位可配置15.36TB 大容量NVMe SSD。軟件方面,通過集群控制服務將N個節(jié)點聯成一套具有高擴展性的文件系統;通過分布式元數據服務提升海量小文件讀寫性能;通過數控分離架構,實現東西向網絡優(yōu)化,降低IO訪問時延,提升單節(jié)點帶寬。在軟硬件協同創(chuàng)新下,AS13000G7-N充分滿足大模型應用在存儲性能和存儲容量方面的嚴苛需求。

1a34deda-0c6e-11ef-a297-92fbcf53809c.jpg

具體來說,在數據準備階段,通過多協議融合互通技術,面對多份、多種協議的數據,存儲底層僅保留一份數據,實現數據共享免搬遷;在模型訓練階段,通過大小IO智能識別和緩存預讀技術快速保存和恢復checkpoint(檢查點)文件,實現TB級訓練數據Checkpoint讀取耗時從10分鐘縮短至10秒內,大幅提升訓練過程中數據加載速度;RDMA/RoCE網絡連接技術和數控分離架構的設計,實現東西向數據免轉發(fā),極限發(fā)揮大模型訓練中硬件網絡帶寬性能;基于盤控協同架構,網絡數據直通NVMe SSD,進一步提升單盤帶寬;在數據歸檔與管理階段,AS13000G7-N提供了多元異構存儲的統一納管能力,保障數據資產高效存儲與管理,大幅提升存儲資源的利用率且最大化數據基礎設施投資回報比。

DataTurbo數據加速引擎

全力保障大模型高效訓練

在大模型的數據應用全流程中,要想使訓練效率達到極致,減少不必要的資源浪費,訓練階段的數據讀寫性能成為重中之重。而想要提升算力利用率、降低模型訓練成本,必須要在數據存儲性能上進行創(chuàng)新。

AS13000G7-N系列具備強大的端到端性能優(yōu)化能力,這也是模型訓練階段最為核心的考量因素。浪潮信息基于計算和存儲協同的理念,依托自研分布式文件系統構建了新一代數據加速引擎DataTurbo,在緩存優(yōu)化、空間均衡、縮短GPU與存儲讀取路徑等方面進行了全面升級?!?/p>

■ 智能緩存優(yōu)化,保障大模型訓練速度與質量

AS13000G7-N能夠通過對大小IO的智能識別,進行分類治理,小文件采取聚合的操作,大文件采取切片的操作,所有數據以大小均衡的模式保存到全局緩存中,實現小文件性能提升5倍,大文件性能提升10倍。在模型訓練中斷后,從Checkpoint恢復數據過程中,AS13000G7-N通過緩存預讀技術,提前識別數據的冷熱程度,加速了重復樣本數據的讀取,訓練加載速度提升10倍。無論是讀操作還是寫操作,AS13000G7-N采取了字節(jié)級(Byte)分布式鎖機制,粒度是主流并行文件系統鎖機制粒度的幾十分之一,確保多個節(jié)點訪問共享資源時能夠安全、有序地進行操作,從而保持訓練數據的強一致性和訓練質量。

■ 智能空間均衡,高水位下性能無衰減

AS13000G7-N搭載了浪潮信息自主研發(fā)的分布式并行客戶端技術,相比通用私有客戶端,卸載了獨立的元數據,實現了元數據和數據節(jié)點的高效統一部署,有效提升存儲的并發(fā)能力,充分利用訓練節(jié)點網卡的帶寬,讓GPU算力得到完全釋放。同時在存儲端,相較于業(yè)界主流的文件系統需要在磁盤之上構筑一層文件協議,AS13000G7-N能夠直接對裸盤的空間進行均衡排布,并在管理層面設計了智能空間預分技術,能夠結合用戶前端算力節(jié)點數量、訓練模型的數量,對存儲空間分配進一步進行智能策略預埋。這套組合拳能夠使AS13000G7-N在空間利用率達到95%高水位時,依然可以平穩(wěn)輸出強大的性能。在模型訓練的空間損耗上,AS13000G7-N相較傳統方案,將損耗率降低了85%左右,充分保護了客戶在大模型存儲上的投資。

■ GPU直通存儲,服務萬億參數大模型

當大模型參數在百億級別,GPU對存儲資源的調用效率往往差別不大。但隨著大模型從單模態(tài)走向多模態(tài),數據量指數型增長,訓練效率隨之要求更高。從數據層面來看,AS13000G7-N具備和GPU直通的能力,數據流不經過客戶端緩存,直接到達存儲底層文件系統,縮短GPU與存儲的讀取路徑,這項技術能夠使存儲讀寫帶寬翻倍,大模型訓練加載時間縮短50%。隨著萬卡萬億參數模型時代的到來,GPU直通存儲高效提升數據讀寫訪問的能力將是大模型訓練的標配。

通過上述技術創(chuàng)新,分布式全閃存儲AS13000G7-N憑借領先的性能和管理優(yōu)勢,能夠幫助用戶加速大模型的數據歸集、提升模型訓練效率、簡化海量異構數據的管理,從而推動業(yè)務智能化變革。浪潮信息將借助AS13000G7-N等存儲產品,與合作伙伴加快在場景化方案定制、市場拓展等方面的創(chuàng)新,助力用戶構筑人工智能時代最佳數據存儲底座。



審核編輯:劉清

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20261

    瀏覽量

    252601
  • gpu
    gpu
    +關注

    關注

    28

    文章

    5200

    瀏覽量

    135534
  • SSD
    SSD
    +關注

    關注

    21

    文章

    3113

    瀏覽量

    122268
  • 大模型
    +關注

    關注

    2

    文章

    3662

    瀏覽量

    5197

原文標題:為大模型專門優(yōu)化!浪潮信息發(fā)布分布式全閃存儲AS13000G7-N系列

文章出處:【微信號:inspurstorage,微信公眾號:浪潮存儲】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    分布式光伏“四可”裝置:可觀、可測、可控、可調的技術內核解析

    分布式光伏“可觀、可測、可控、可調”四可裝置,精準切中并網核心痛點,通過維度功能構建,成為推動分布式光伏從“被動并網”向“主動協同”轉型的關鍵支撐。
    的頭像 發(fā)表于 11-24 11:20 ?542次閱讀
    <b class='flag-5'>分布式</b>光伏“四可”裝置:可觀、可測、可控、可調的技術內核<b class='flag-5'>全</b>解析

    戴爾科技閃存存儲PowerStore有何獨特之處

    近日,在IDC最新發(fā)布的全球企業(yè)存儲系統季度跟蹤報告中,戴爾科技集團再度蟬聯閃存存儲供應商收入榜首!
    的頭像 發(fā)表于 10-15 14:19 ?1725次閱讀

    【節(jié)能學院】Acrel-1000DP分布式光伏監(jiān)控系統在奉賢平高食品 4.4MW 分布式光伏中應用

    分布式光伏本地和遠程通信方案,并研究分布式光伏采集模型的構建、多源數據融合估計、面向分布式光伏的有功、無功功率優(yōu)化控制等關鍵技術,實現了對小
    的頭像 發(fā)表于 08-23 08:04 ?3520次閱讀
    【節(jié)能學院】Acrel-1000DP<b class='flag-5'>分布式</b>光伏監(jiān)控系統在奉賢平高食品 4.4MW <b class='flag-5'>分布式</b>光伏中應用

    浪潮信息發(fā)布&quot;元腦SD200&quot;超節(jié)點,面向萬億參數大模型創(chuàng)新設計

    北京2025年8月8日 /美通社/ -- 8月7日,浪潮信息發(fā)布面向萬億參數大模型的超節(jié)點AI服務器"元腦SD200"。該產品基于浪潮信息創(chuàng)
    的頭像 發(fā)表于 08-08 22:17 ?692次閱讀
    <b class='flag-5'>浪潮信息</b><b class='flag-5'>發(fā)布</b>&quot;元腦SD200&quot;超節(jié)點,面向萬億參數大<b class='flag-5'>模型</b>創(chuàng)新設計

    一鍵部署無損網絡:EasyRoCE助力分布式存儲效能革命

    分布式存儲的性能瓶頸往往在于網絡。如何構建一個高帶寬、超低時延、零丟包的無損網絡,是釋放分布式存儲全部潛力、賦能企業(yè)關鍵業(yè)務(如實時數據庫、AI訓練、高性能計算)的關鍵挑戰(zhàn)。
    的頭像 發(fā)表于 08-04 11:34 ?1642次閱讀
    一鍵部署無損網絡:EasyRoCE助力<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>效能革命

    Ceph分布式存儲系統解析

    在當今數據爆炸的時代,企業(yè)對存儲系統的需求日益增長,傳統的集中式存儲已經無法滿足大規(guī)模數據處理的要求。分布式存儲系統應運而生,而Ceph作為開源分布
    的頭像 發(fā)表于 07-14 11:15 ?1030次閱讀

    飛利信與浪潮信息達成戰(zhàn)略合作

    近日,2025年浪潮信息北京ISP戰(zhàn)略伙伴簽約授牌儀式成功舉辦。浪潮信息與北京飛利信電子技術有限公司等22家戰(zhàn)略合作伙伴達成簽約,其中將面向北京人工智能應用大市場,在產品技術共創(chuàng)、行業(yè)場景深化及區(qū)域
    的頭像 發(fā)表于 06-24 17:37 ?1118次閱讀

    雙電機分布式驅動汽車高速穩(wěn)定性機電耦合控制

    摘要:為了利用所設計的雙電機防滑差速驅動系統來提高分布式驅動汽車的動力學性能,在前期同軸耦合驅動控制理論研究的基礎上,開展該車的高速穩(wěn)定性機電耦合控制研究。建立并驗證包含所設計驅動系統在內的分布式
    發(fā)表于 06-18 16:37

    潤和軟件發(fā)布StackRUNS異構分布式推理框架

    當下,AI模型規(guī)模持續(xù)膨脹、多模態(tài)應用場景日益復雜,企業(yè)正面臨異構算力資源碎片化帶來的嚴峻挑戰(zhàn)。應對行業(yè)痛點,江蘇潤和軟件股份有限公司(以下簡稱“潤和軟件”)正式發(fā)布自主研發(fā)的StackRUNS異構
    的頭像 發(fā)表于 06-13 09:10 ?1489次閱讀
    潤和軟件<b class='flag-5'>發(fā)布</b>StackRUNS異構<b class='flag-5'>分布式</b>推理框架

    華為分布式存儲榮膺2025年Gartner“客戶之選”

    近日,全球權威咨詢與分析機構Gartner發(fā)布《2025年Gartner Peer Insights文件與對象存儲平臺“客戶之聲”》報告,華為OceanStor分布式存儲再次登頂,連續(xù)
    的頭像 發(fā)表于 06-07 09:13 ?1404次閱讀

    曙光存儲領跑中國分布式存儲市場

    近日,賽迪顧問發(fā)布《中國分布式存儲市場研究報告(2025)》,指出2024 年中國分布式存儲市場首次超過集中式
    的頭像 發(fā)表于 05-19 16:50 ?1282次閱讀

    多通道電源管理芯片在分布式能源系統中的優(yōu)化策略

    摘要: 隨著分布式能源系統的廣泛應用,對電源管理芯片的性能要求日益提升。本文深入探討了多通道電源管理芯片在分布式能源系統中的優(yōu)化策略,以國科安芯的ASP4644芯片例,從電氣特性、工
    的頭像 發(fā)表于 05-16 15:22 ?921次閱讀

    兆芯+圖云創(chuàng)智—可信分布式存儲系統解決方案

    圖云創(chuàng)智分布式存儲系統采用分布式設計與先進的存儲虛擬化技術相結合,由多個獨立的兆芯 x86 服務器作為
    的頭像 發(fā)表于 04-23 10:29 ?982次閱讀
    兆芯+圖云創(chuàng)智—可信<b class='flag-5'>分布式</b><b class='flag-5'>存儲</b>系統解決方案

    分布式存儲數據恢復—虛擬機上hbase和hive數據庫數據恢復案例

    分布式存儲數據恢復環(huán)境: 16臺某品牌R730xd服務器節(jié)點,每臺服務器節(jié)點上有數臺虛擬機。 虛擬機上部署Hbase和Hive數據庫。 分布式存儲故障: 數據庫底層文件被誤
    的頭像 發(fā)表于 04-17 11:05 ?739次閱讀

    天瞳威視與浪潮信息達成戰(zhàn)略合作,推進高階智駕車載計算系統創(chuàng)新

    北京2025年3月22日?/美通社/ -- 近日,蘇州天瞳威視電子科技有限公司與浪潮信息旗下蘇州元腦智能科技有限公司達成戰(zhàn)略合作協議。此次合作依托浪潮信息提供的車載算力平臺硬件系統、底層軟件環(huán)境
    的頭像 發(fā)表于 03-27 16:55 ?650次閱讀
    天瞳威視與<b class='flag-5'>浪潮信息</b>達成戰(zhàn)略合作,推進高階智駕車載計算系統創(chuàng)新