chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

關(guān)于AI網(wǎng)絡(luò)的五個(gè)基本要點(diǎn)

是德科技KEYSIGHT ? 來源:是德科技KEYSIGHT ? 2024-12-18 15:48 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

隨著大模型的興起,為了應(yīng)對新的AI應(yīng)用,AI或算力數(shù)據(jù)中心建設(shè)如火如荼。

無論是作為聊天機(jī)器人,推薦系統(tǒng)還是在各個(gè)領(lǐng)域中實(shí)現(xiàn)流程自動化,比如無人駕駛、人臉識別;AI技術(shù)都有望提升并加速眾多企業(yè)和公共設(shè)施的運(yùn)營,甚至改變?nèi)藗兊纳罘绞健?/p>

然而,AI網(wǎng)絡(luò)或算力網(wǎng)絡(luò)作為一個(gè)概念,常常讓人感到困惑且被誤解,AI和算力需要網(wǎng)絡(luò)么?

在本文中,我們將探討關(guān)于AI網(wǎng)絡(luò)的五個(gè)基本要點(diǎn),以及隨著AI的發(fā)展,網(wǎng)絡(luò)所面臨的獨(dú)特挑戰(zhàn)。

GPU是AI的核心

簡單來說,AI的核心是圖形處理單元(GPU)或神經(jīng)處理單元(NPU)。

過去,我們通常認(rèn)為中央處理單元(CPU)是計(jì)算機(jī)的核心。但GPU的優(yōu)勢在于,它在執(zhí)行數(shù)學(xué)計(jì)算特別是矩陣計(jì)算方面非常出色,從某種角度來說,與人腦神經(jīng)元更接近。

CPU時(shí)代的數(shù)據(jù)中心網(wǎng)絡(luò)處理的大多是供人閱讀的文字或多媒體,典型的就是網(wǎng)站的瀏覽、文件傳輸以及觀看視頻,數(shù)據(jù)中心往往能夠同時(shí)支持?jǐn)?shù)億人的同時(shí)在線及高速的視頻碼流傳輸。

而在構(gòu)建大語言模型或深度學(xué)習(xí)模型時(shí),需要讓GPU進(jìn)行“訓(xùn)練”,這涉及到解決可能包含數(shù)十億參數(shù)的矩陣和梯度運(yùn)算。GPU的計(jì)算非常的快,整個(gè)“訓(xùn)練”過程異常嚴(yán)苛,不允許有任何的錯(cuò)誤發(fā)生,一旦發(fā)生錯(cuò)誤或延遲,整個(gè)“訓(xùn)練”的周期就會被拉長。這樣的運(yùn)算量,以及對無損和低延時(shí)的要求,對于傳統(tǒng)的數(shù)據(jù)中心而言,突然就變得捉襟見肘了。

AI訓(xùn)練任務(wù)由多GPU協(xié)同完成

大語言模型在訓(xùn)練的參數(shù)和模型復(fù)雜度上有非常明顯的提升,完成這些計(jì)算必須讓多達(dá)上千個(gè)GPU共同處理訓(xùn)練任務(wù),即便如此,訓(xùn)練或微調(diào)大模型也可能需要數(shù)周甚至數(shù)月的時(shí)間。

一般的多GPU互聯(lián)的架構(gòu)是將一組GPU服務(wù)器放置在機(jī)架中,并通過機(jī)架頂部的交換機(jī)相互連接。機(jī)架與機(jī)架通過CLOS網(wǎng)絡(luò)結(jié)構(gòu)將它們?nèi)窟B接起來。隨著解決問題復(fù)雜性的提升,對GPU的需求也會增加,有些情況下單個(gè)數(shù)據(jù)中心的電力不足以支持的時(shí)候,甚至需要跨數(shù)據(jù)中心連接通信來完成更大型的訓(xùn)練任務(wù)。

AI集群是一臺超級計(jì)算機(jī)

在構(gòu)建AI集群時(shí),不僅僅要將GPU相互連接,更需要把它作為一個(gè)系統(tǒng),解決很多錯(cuò)誤和優(yōu)化的問題。正因?yàn)锳I集群的規(guī)模不斷的上升,其中任何單點(diǎn)錯(cuò)誤會導(dǎo)致整體訓(xùn)練任務(wù)的失敗或效率低下,整個(gè)系統(tǒng)的組成部件比如模塊、線纜、交換機(jī)、網(wǎng)卡、服務(wù)器、存儲甚至電源,冷卻系統(tǒng)等,都會影響整個(gè)系統(tǒng)的執(zhí)行和維護(hù)。AI集群已經(jīng)慢慢由一個(gè)組網(wǎng)變成為一臺超級計(jì)算機(jī),越來越多的工作將會圍繞在部件之間的協(xié)同而不僅是部件內(nèi)部的單點(diǎn)優(yōu)化展開。

網(wǎng)絡(luò)成為了訓(xùn)練效率的關(guān)鍵瓶頸

在去年秋天的開放計(jì)算項(xiàng)目(OCP)全球峰會上,Marvell Technology的Loi Nguyen指出,網(wǎng)絡(luò)成為了AI部署的新瓶頸。GPU在解決計(jì)算問題或處理訓(xùn)練負(fù)載方面非常有效。然而,進(jìn)行并行計(jì)算的GPU在完成本身處理的信息之外需要獲取其他GPU處理完成的信息,彼此之間需要相互通信和同步。

如果一個(gè)GPU無法獲取所需信息,或者同步需要較長時(shí)間,其他所有GPU都必須等待,直到協(xié)作任務(wù)完成。在技術(shù)層面上,由網(wǎng)絡(luò)擁塞導(dǎo)致的數(shù)據(jù)包延遲或丟失可能會引發(fā)數(shù)據(jù)包重傳,顯著增加任務(wù)完成時(shí)間(JCT)。

這意味著價(jià)值數(shù)百萬甚至數(shù)千萬美元的GPU長時(shí)間處于閑置狀態(tài),從而導(dǎo)致AI產(chǎn)品的上市時(shí)間延遲并影響公司的財(cái)務(wù)成果。

測試對于AI網(wǎng)絡(luò)至關(guān)重要

為了確保AI集群的高效運(yùn)行,需要網(wǎng)絡(luò)對GPU協(xié)同作業(yè)可能存在的擁塞和錯(cuò)誤有提前的感知以及良好的應(yīng)對。

這要求對網(wǎng)絡(luò)處理AI負(fù)載的性能進(jìn)行詳盡的測試和基準(zhǔn)評估。但這并非易事,因?yàn)镚PU協(xié)同作業(yè)的負(fù)載區(qū)別于傳統(tǒng)網(wǎng)絡(luò)的流量負(fù)載,微突發(fā)、大象流、低熵是比較典型的特征。

因此,在測試AI網(wǎng)絡(luò)時(shí),我們會面臨諸多挑戰(zhàn):

? GPU短缺,無法復(fù)刻生產(chǎn)網(wǎng)絡(luò)環(huán)境或無法長時(shí)間復(fù)現(xiàn)問題。

?在生產(chǎn)系統(tǒng)上進(jìn)行測試可能會降低系統(tǒng)的處理能力。

?系統(tǒng)內(nèi)的部件不能提供足夠的日志及調(diào)試能力,無法準(zhǔn)確定位問題。

?此外,獲取GPU之間集合通信更細(xì)節(jié)的信息,比如 Queue-Pair 的信息是一個(gè)挑戰(zhàn)。

為了應(yīng)對這些挑戰(zhàn),可以首先在實(shí)驗(yàn)室環(huán)境中對建議配置的一個(gè)子集或小的組網(wǎng)進(jìn)行測試,對關(guān)鍵參數(shù)進(jìn)行基準(zhǔn)測試,比如任務(wù)完成時(shí)間(JCT)、AI集群可達(dá)到的帶寬,以及這些參數(shù)與網(wǎng)絡(luò)利用率和交換機(jī)緩存消耗的比較。

這種基準(zhǔn)測試有助于找到GPU/工作負(fù)載與網(wǎng)絡(luò)設(shè)計(jì)/參數(shù)設(shè)置之間的平衡。當(dāng)計(jì)算架構(gòu)師和網(wǎng)絡(luò)工程師對結(jié)果滿意時(shí),他們可以將這些設(shè)置應(yīng)用于生產(chǎn)環(huán)境,并測量新的結(jié)果。

結(jié)論

為了充分利用AI算力,必須對AI網(wǎng)絡(luò)的設(shè)備和基礎(chǔ)設(shè)施進(jìn)行優(yōu)化。

企業(yè)和學(xué)術(shù)界正在提出更多好的架構(gòu)和算法來優(yōu)化AI系統(tǒng)的各個(gè)部件及部件間協(xié)同,以應(yīng)對未來更多AI應(yīng)用給大型網(wǎng)絡(luò)帶來的挑戰(zhàn)。

測試對AI系統(tǒng)非常關(guān)鍵,只有通過確定可重復(fù)的測試,行業(yè)才能實(shí)現(xiàn)從探索性實(shí)驗(yàn)到可交付的迭代,這會是優(yōu)化AI這臺超級計(jì)算機(jī)的基礎(chǔ)。

關(guān)于是德科技

是德科技(NYSE:KEYS)啟迪并賦能創(chuàng)新者,助力他們將改變世界的技術(shù)帶入生活。作為一家標(biāo)準(zhǔn)普爾 500 指數(shù)公司,我們提供先進(jìn)的設(shè)計(jì)、仿真和測試解決方案,旨在幫助工程師在整個(gè)產(chǎn)品生命周期中更快地完成開發(fā)和部署,同時(shí)控制好風(fēng)險(xiǎn)。我們的客戶遍及全球通信、工業(yè)自動化、航空航天與國防、汽車、半導(dǎo)體和通用電子等市場。我們與客戶攜手,加速創(chuàng)新,創(chuàng)造一個(gè)安全互聯(lián)的世界。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5035

    瀏覽量

    133686
  • 網(wǎng)絡(luò)
    +關(guān)注

    關(guān)注

    14

    文章

    8019

    瀏覽量

    92177
  • AI
    AI
    +關(guān)注

    關(guān)注

    88

    文章

    36980

    瀏覽量

    289813
  • 是德科技
    +關(guān)注

    關(guān)注

    21

    文章

    1018

    瀏覽量

    84719

原文標(biāo)題:關(guān)于AI網(wǎng)絡(luò)你應(yīng)該知道的五件事

文章出處:【微信號:是德科技KEYSIGHT,微信公眾號:是德科技KEYSIGHT】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點(diǎn)推薦

    AI賦能6G與衛(wèi)星通信:開啟智能天網(wǎng)新時(shí)代

    國際電信聯(lián)盟(ITU)的報(bào)告,AI預(yù)測性維護(hù)技術(shù)已使衛(wèi)星通信的平均無故障時(shí)間延長了25%,為用戶提供更加穩(wěn)定的服務(wù)。 AI+6G+衛(wèi)星:構(gòu)建無縫全球網(wǎng)絡(luò) AI、6G和衛(wèi)星通信的融合,正
    發(fā)表于 10-11 16:01

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    復(fù)制人類智能的AI---AGI。 走向AGI的個(gè)層次發(fā)現(xiàn)階段: ①L1,聊天機(jī)器人:具備基礎(chǔ)的對話能力,能夠理解和回應(yīng)簡單的文本輸入 ②L2,推理者:具備基本的邏輯推理能力,能夠分析復(fù)雜信息并進(jìn)行推斷
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI的科學(xué)應(yīng)用

    AI被賦予了人的智能,科學(xué)家們希望在沒有人類的引導(dǎo)下,AI自主的提出科學(xué)假設(shè),諾貝爾獎級別的假設(shè)哦。 AI驅(qū)動科學(xué)被認(rèn)為是科學(xué)發(fā)現(xiàn)的第五個(gè)范式了,與實(shí)驗(yàn)科學(xué)、理論科學(xué)、計(jì)算科學(xué)、數(shù)據(jù)驅(qū)
    發(fā)表于 09-17 11:45

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+可期之變:從AI硬件到AI濕件

    的不同。隨著AI熱潮的興起,大腦的抽象模型已被提煉成各種的AI算法,并使用半導(dǎo)體芯片技術(shù)加以實(shí)現(xiàn)。 而大腦是一個(gè)由無數(shù)神經(jīng)元通過突觸連接而成的復(fù)雜網(wǎng)絡(luò),是極其復(fù)雜和精密的。大腦在本質(zhì)上
    發(fā)表于 09-06 19:12

    時(shí)間同步設(shè)備在復(fù)雜網(wǎng)絡(luò)環(huán)境中的調(diào)試要點(diǎn)

    時(shí)間同步設(shè)備是保障網(wǎng)絡(luò)系統(tǒng)協(xié)同運(yùn)行的基礎(chǔ)設(shè)施,尤其在金融、電力、通信等領(lǐng)域?qū)纫筝^高的場景中,其穩(wěn)定性直接影響業(yè)務(wù)連續(xù)性。在實(shí)際部署中,網(wǎng)絡(luò)環(huán)境的復(fù)雜性常給同步精度帶來挑戰(zhàn)。本文將分享幾個(gè)調(diào)試過程中的經(jīng)驗(yàn)要點(diǎn)。
    的頭像 發(fā)表于 08-13 15:48 ?195次閱讀
    時(shí)間同步設(shè)備在復(fù)雜<b class='flag-5'>網(wǎng)絡(luò)</b>環(huán)境中的調(diào)試<b class='flag-5'>要點(diǎn)</b>

    關(guān)于NanoEdge AI用于n-Class的問題求解

    我想請教一下關(guān)于NanoEdge AI用于n-Class的問題。我使用NanoEdge AI的n-Class模式,訓(xùn)練好模型,設(shè)計(jì)了3個(gè)分類,使用PC端的模擬工具測試過,模型可以正常對
    發(fā)表于 08-11 06:44

    三大核心網(wǎng)絡(luò)設(shè)備的運(yùn)維要點(diǎn)

    作為運(yùn)維工程師,熟練掌握網(wǎng)絡(luò)設(shè)備的管理和維護(hù)是構(gòu)建穩(wěn)定IT基礎(chǔ)架構(gòu)的關(guān)鍵。本文將深入探討交換機(jī)、路由器和防火墻這三大核心網(wǎng)絡(luò)設(shè)備的運(yùn)維要點(diǎn),從基礎(chǔ)配置到高級故障排除,為您提供全面的技術(shù)指導(dǎo)。
    的頭像 發(fā)表于 07-22 16:35 ?465次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時(shí)代

    模態(tài)的技術(shù)特性,DeepSeek正加速推動AI在金融、政務(wù)、科研及網(wǎng)絡(luò)智能化等關(guān)鍵領(lǐng)域的深度應(yīng)用。 信而泰:AI推理引擎賦能網(wǎng)絡(luò)智能診斷新范式信而泰深度整合DeepSeek-R1大模型
    發(fā)表于 07-16 15:29

    Nordic收購 Neuton.AI 關(guān)于產(chǎn)品技術(shù)的分析

    Nordic Semiconductor 于 2025 年收購了 Neuton.AI,這是一家專注于超小型機(jī)器學(xué)習(xí)(TinyML)解決方案的公司。 Neuton 開發(fā)了一種獨(dú)特的神經(jīng)網(wǎng)絡(luò)框架,能夠
    發(fā)表于 06-28 14:18

    解鎖CAN接口開發(fā)高效路徑!個(gè)核心要點(diǎn)一次講透

    高效開發(fā)CAN接口,關(guān)鍵在于把握協(xié)議基礎(chǔ)、硬件適配、錯(cuò)誤管理、性能優(yōu)化與調(diào)試大核心要點(diǎn)。下面將逐一剖析每個(gè)環(huán)節(jié)的技術(shù)細(xì)節(jié)與實(shí)踐方法,助力開發(fā)者快速突破難點(diǎn),實(shí)現(xiàn)可靠通信。 在Air780EPM上
    的頭像 發(fā)表于 06-23 16:08 ?692次閱讀
    解鎖CAN接口開發(fā)高效路徑!<b class='flag-5'>五</b><b class='flag-5'>個(gè)</b>核心<b class='flag-5'>要點(diǎn)</b>一次講透

    網(wǎng)絡(luò)配線架打線操作的技術(shù)要點(diǎn)

    網(wǎng)絡(luò)配線架打線操作是網(wǎng)絡(luò)布線工程中的關(guān)鍵環(huán)節(jié),直接影響網(wǎng)絡(luò)的穩(wěn)定性和傳輸質(zhì)量。以下是打線操作的技術(shù)要點(diǎn),涵蓋前期準(zhǔn)備、打線流程、質(zhì)量檢查及維護(hù)注意事項(xiàng),以邏輯清晰、重點(diǎn)突出的方式呈現(xiàn):
    的頭像 發(fā)表于 06-06 10:28 ?811次閱讀
    <b class='flag-5'>網(wǎng)絡(luò)</b>配線架打線操作的技術(shù)<b class='flag-5'>要點(diǎn)</b>

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+讀《零基礎(chǔ)開發(fā)AI Agent》掌握扣子平臺開發(fā)智能體方法

    收到發(fā)燒友網(wǎng)站寄來的《零基礎(chǔ)開發(fā)AI Agent》這本書已經(jīng)有好些天了,這段時(shí)間有幸拜讀了一下全書,掌握了一個(gè)開發(fā)智能體的方法。 該書充分從零基礎(chǔ)入手,先闡述了Agent是什么,它的基本概念和知識
    發(fā)表于 05-14 19:51

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+關(guān)于AI Agent開發(fā)入門的第一印象與相關(guān)官方文檔和社區(qū)資料的內(nèi)容補(bǔ)充

    今天有幸收到了電子發(fā)燒友寄來的由中國工信出版集團(tuán)和電子工業(yè)出版社聯(lián)合出版的關(guān)于AI Agent開發(fā)的《零基礎(chǔ)開發(fā)AI Agent》的新書,不禁高興雀躍,以下是我拍下的書的頁封和背面: 大家可以看到
    發(fā)表于 04-22 18:16

    【「零基礎(chǔ)開發(fā)AI Agent」閱讀體驗(yàn)】+初品Agent

    期待中的《零基礎(chǔ)開發(fā)AI Agent——手把手教你用扣子做智能體》終于寄到了,該書由葉濤、 管鍇、張心雨完成,并由電子工業(yè)出版社出版發(fā)行。 全書分為三個(gè)部分,即入門篇、工具篇及實(shí)踐篇。由此可見這是
    發(fā)表于 04-22 11:51

    適用于數(shù)據(jù)中心和AI時(shí)代的800G網(wǎng)絡(luò)

    數(shù)據(jù)中心依賴數(shù)千甚至上萬個(gè)GPU集群進(jìn)行高性能計(jì)算,對帶寬、延遲和數(shù)據(jù)交換效率提出極高要求。 AI云:以生成式AI為核心的云平臺,為多租戶環(huán)境提供推理服務(wù)。這類數(shù)據(jù)中心要求網(wǎng)絡(luò)
    發(fā)表于 03-25 17:35