?通過模擬真實(shí)工作負(fù)載驗(yàn)證AI基礎(chǔ)設(shè)施的性能
?通過評(píng)估新算法、組件或協(xié)議提高AI訓(xùn)練的性能
?在不投資昂貴的大規(guī)模部署的情況下,調(diào)整和優(yōu)化AI工作負(fù)載和系統(tǒng)基礎(chǔ)設(shè)施的參數(shù)
是德科技(NYSE:KEYS)推出Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器,這是一款先進(jìn)的軟件套件,通過模擬真實(shí)工作負(fù)載來評(píng)估新算法、組件和協(xié)議對(duì)AI訓(xùn)練性能的影響。KAI數(shù)據(jù)中心構(gòu)建器的工作負(fù)載模擬功能將大型語言模型(LLM)和其他人工智能(AI)模型訓(xùn)練工作負(fù)載集成到AI基礎(chǔ)設(shè)施組件的設(shè)計(jì)和驗(yàn)證中——包括網(wǎng)絡(luò)、主機(jī)和加速器。該解決方案實(shí)現(xiàn)了硬件設(shè)計(jì)、協(xié)議、架構(gòu)和AI訓(xùn)練算法之間的更緊密協(xié)同,提升系統(tǒng)性能。
Keysight AI (KAI)數(shù)據(jù)中心構(gòu)建器是一款先進(jìn)的軟件套件,通過模擬真實(shí)工作負(fù)載來評(píng)估新算法、組件和協(xié)議對(duì)AI訓(xùn)練性能的影響。
AI服務(wù)提供商使用各種并行處理策略(也稱為數(shù)據(jù)或模型并行)來加速AI模型訓(xùn)練。將模型并行與AI集群拓?fù)浜团渲脤?duì)齊可以提高訓(xùn)練性能。在AI集群設(shè)計(jì)階段,關(guān)鍵問題最好通過實(shí)驗(yàn)來回答。許多問題集中在圖形處理單元(GPU)之間的數(shù)據(jù)傳輸效率上。關(guān)鍵考慮因素包括:
?AI主機(jī)或機(jī)架內(nèi)GPU互連的scale up設(shè)計(jì)
?Scale out網(wǎng)絡(luò)設(shè)計(jì),包括每個(gè)GPU的帶寬和拓?fù)?/p>
?網(wǎng)絡(luò)負(fù)載均衡和擁塞控制的配置
?訓(xùn)練框架參數(shù)的調(diào)整
KAI數(shù)據(jù)中心構(gòu)建器的工作負(fù)載模擬解決方案再現(xiàn)了真實(shí)AI訓(xùn)練任務(wù)的網(wǎng)絡(luò)通信模式,加速實(shí)驗(yàn),降低達(dá)到熟練程度所需的學(xué)習(xí)曲線,并更深入洞察性能下降的原因,這些是通過真實(shí)AI訓(xùn)練任務(wù)實(shí)驗(yàn)難以獲得的。是德科技客戶可以訪問包括GPT和Llama在內(nèi)的LLM工作負(fù)載庫(kù),以及數(shù)據(jù)并行(DP)、全分片數(shù)據(jù)并行(FSDP)和三維(3D)并行等流行的模型分區(qū)方案。
使用KAI數(shù)據(jù)中心構(gòu)建器中的工作負(fù)載模擬應(yīng)用程序,AI服務(wù)提供商可以:
?實(shí)驗(yàn)并行參數(shù),包括并行數(shù)據(jù)大小及其在可用AI基礎(chǔ)設(shè)施上的分布(調(diào)度)
?了解并行內(nèi)和并行間通信對(duì)整體任務(wù)完成時(shí)間(JCT)的影響
?識(shí)別低性能的集合通信操作并深入識(shí)別瓶頸
?分析網(wǎng)絡(luò)利用率、尾部延遲和擁塞,了解它們對(duì)JCT的影響
KAI數(shù)據(jù)中心構(gòu)建器的新工作負(fù)載模擬功能使AI服務(wù)提供商、GPU云提供商和基礎(chǔ)設(shè)施供應(yīng)商能夠?qū)⒄鎸?shí)的AI工作負(fù)載引入其實(shí)驗(yàn)室環(huán)境,以驗(yàn)證AI集群和新組件的不斷演變的設(shè)計(jì)。他們還可以通過實(shí)驗(yàn)微調(diào)模型并行方案、參數(shù)和算法,以優(yōu)化基礎(chǔ)設(shè)施并提高AI工作負(fù)載性能。
是德科技網(wǎng)絡(luò)測(cè)試與安全解決方案副總裁兼總經(jīng)理Ram Periakaruppan表示:“隨著AI基礎(chǔ)設(shè)施規(guī)模和復(fù)雜性的增長(zhǎng),對(duì)全棧驗(yàn)證和優(yōu)化的需求變得至關(guān)重要。為了避免昂貴的延誤和返工,必須將驗(yàn)證轉(zhuǎn)移到設(shè)計(jì)和制造周期的早期階段。KAI數(shù)據(jù)中心構(gòu)建器的工作負(fù)載模擬為AI組件和系統(tǒng)設(shè)計(jì)提供了非常高的真實(shí)性,優(yōu)化工作負(fù)載以實(shí)現(xiàn)最佳性能。”
KAI數(shù)據(jù)中心構(gòu)建器是是德科技人工智能(KAI)架構(gòu)的基礎(chǔ),這是一系列端到端解決方案,旨在通過使用真實(shí)AI工作負(fù)載模擬驗(yàn)證AI集群組件,幫助客戶在數(shù)據(jù)中心擴(kuò)展人工智能(AI)處理能力。
是德科技在2025年4月1日至3日于舊金山Moscone中心舉行的OFC 2025會(huì)議上展示KAI數(shù)據(jù)中心構(gòu)建器及其工作負(fù)載模擬功能,展位號(hào)1301。
關(guān)于是德科技
是德科技(NYSE:KEYS)啟迪并賦能創(chuàng)新者,助力他們將改變世界的技術(shù)帶入生活。作為一家標(biāo)準(zhǔn)普爾 500 指數(shù)公司,我們提供先進(jìn)的設(shè)計(jì)、仿真和測(cè)試解決方案,旨在幫助工程師在整個(gè)產(chǎn)品生命周期中更快地完成開發(fā)和部署,同時(shí)控制好風(fēng)險(xiǎn)。我們的客戶遍及全球通信、工業(yè)自動(dòng)化、航空航天與國(guó)防、汽車、半導(dǎo)體和通用電子等市場(chǎng)。我們與客戶攜手,加速創(chuàng)新,創(chuàng)造一個(gè)安全互聯(lián)的世界。
-
數(shù)據(jù)中心
+關(guān)注
關(guān)注
16文章
5505瀏覽量
74621 -
AI
+關(guān)注
關(guān)注
89文章
38007瀏覽量
295983 -
是德科技
+關(guān)注
關(guān)注
21文章
1032瀏覽量
85159
原文標(biāo)題:是德科技推出AI數(shù)據(jù)中心構(gòu)建器以驗(yàn)證和優(yōu)化網(wǎng)絡(luò)架構(gòu)和主機(jī)設(shè)計(jì)
文章出處:【微信號(hào):KeysightGCFM,微信公眾號(hào):是德科技快訊】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
德明利推出企業(yè)級(jí)存儲(chǔ)解決方案,為AI數(shù)據(jù)中心提供國(guó)產(chǎn)化可靠支撐
是德科技如何提升AI數(shù)據(jù)中心集群的可擴(kuò)展性
睿海光電以高效交付與廣泛兼容助力AI數(shù)據(jù)中心800G光模塊升級(jí)
加速AI未來,睿海光電800G OSFP光模塊重構(gòu)數(shù)據(jù)中心互聯(lián)標(biāo)準(zhǔn)
簡(jiǎn)單認(rèn)識(shí)安森美AI數(shù)據(jù)中心電源解決方案
中型數(shù)據(jù)中心中的差分晶體振蕩器應(yīng)用與匹配方案
納微半導(dǎo)體推出12kW超大規(guī)模AI數(shù)據(jù)中心電源
華為面向中東中亞地區(qū)發(fā)布全新星河AI數(shù)據(jù)中心網(wǎng)絡(luò)
是德科技推出用于大規(guī)模AI數(shù)據(jù)中心的系列解決方案

是德科技推出AI數(shù)據(jù)中心構(gòu)建器
評(píng)論