chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

解決AIGC大模型對(duì)網(wǎng)絡(luò)的5大需求

芯啟源 ? 來(lái)源:芯啟源 ? 2024-03-22 16:40 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

從Transformer問(wèn)世至2023年ChatGPT爆火到2024年Sora吸睛,人們逐漸意識(shí)到隨著模型參數(shù)規(guī)模增加,模型的效果越來(lái)越好,且兩者之間符合Scalinglaw規(guī)律,且當(dāng)模型的參數(shù)規(guī)模超過(guò)數(shù)百億后,AI大模型的語(yǔ)言理解能力、邏輯推理能力以及問(wèn)題分析能力迅速提升。同時(shí),隨著模型參數(shù)規(guī)模與性能提升后,AI大模型訓(xùn)練對(duì)于網(wǎng)絡(luò)的需求相比于傳統(tǒng)模型也隨之產(chǎn)生變化。

為滿足大規(guī)模訓(xùn)練集群高效的分布式計(jì)算,AI大模型訓(xùn)練流程中通常會(huì)包含數(shù)據(jù)并行、流水線并行及張量并行等多種并行計(jì)算模式,不同并行模式下均需要多個(gè)計(jì)算設(shè)備間進(jìn)行集合通信操作。另外,訓(xùn)練過(guò)程中通常采用同步模式,需多機(jī)多卡間完成集合通信操作后才可進(jìn)行訓(xùn)練的下一輪迭代或計(jì)算。

因此,在AI大模型的大規(guī)模訓(xùn)練集群中,如何設(shè)計(jì)高效的集群組網(wǎng)方案,滿足低時(shí)延、高吞吐的機(jī)間通信,從而降低多機(jī)多卡間數(shù)據(jù)同步的通信耗時(shí),提升GPU有效計(jì)算時(shí)間占比(GPU計(jì)算時(shí)間/整體訓(xùn)練時(shí)間),對(duì)于AI分布式訓(xùn)練集群的效率提升至關(guān)重要。以下將從規(guī)模、帶寬、時(shí)延、穩(wěn)定性及網(wǎng)絡(luò)部署角度分析AI大模型對(duì)于網(wǎng)絡(luò)的需求。

1

超大規(guī)模組網(wǎng)需求

AI 應(yīng)用計(jì)算量呈幾何級(jí)數(shù)增長(zhǎng),算法模型向巨量化發(fā)展,人工智能模型參數(shù)在過(guò)去十年增長(zhǎng)了十萬(wàn)倍,當(dāng)前AI超大模型的參數(shù)目前已經(jīng)達(dá)到了千億~萬(wàn)億的級(jí)別。訓(xùn)練這樣的模型,毫無(wú)疑問(wèn)需要超高算力。此外,超大模型對(duì)于顯存的需求也很高。以1T參數(shù)模型為例,使用16bit精度存儲(chǔ),首先需要消耗2TB的存儲(chǔ)空間。

除此之外,在訓(xùn)練過(guò)程中,前向計(jì)算產(chǎn)生的激活值、反向計(jì)算產(chǎn)生的梯度、參數(shù)更新需要的優(yōu)化器狀態(tài)等中間變量均需要存儲(chǔ),且中間變量在單次迭代中也會(huì)不斷增加。一個(gè)使用Adam優(yōu)化器的訓(xùn)練過(guò)程,峰值會(huì)產(chǎn)生7倍于模型參數(shù)量的中間變量。如此高的顯存消耗,意味著需要幾十上百個(gè)GPU才能完整存儲(chǔ)一個(gè)模型的訓(xùn)練過(guò)程。

可是,僅僅有了大量GPU,仍然無(wú)法訓(xùn)練出有效的大模型。合適的并行方式才是提升訓(xùn)練效率的關(guān)鍵。目前超大模型主要有三種并行方式:數(shù)據(jù)并行、流水線并行、張量并行。在千億~萬(wàn)億級(jí)別的大模型訓(xùn)練時(shí),以上三種并行都會(huì)存在。訓(xùn)練超大模型需要數(shù)千GPU組成的集群。表面上看,這和云數(shù)據(jù)中心當(dāng)前已經(jīng)達(dá)到數(shù)萬(wàn)服務(wù)器的互聯(lián)規(guī)模相比,還處于下風(fēng)。但實(shí)際上,幾千節(jié)點(diǎn)的GPU互聯(lián),比數(shù)萬(wàn)服務(wù)器的互聯(lián)更具有挑戰(zhàn),因?yàn)榫W(wǎng)絡(luò)能力和計(jì)算能力需要高度匹配。

云數(shù)據(jù)中心使用CPU計(jì)算,網(wǎng)絡(luò)需求一般在10Gbps~100Gbps,并且使用傳統(tǒng)TCP/IP傳輸層協(xié)議。但AI超大模型訓(xùn)練使用GPU訓(xùn)練,算力比CPU高好幾個(gè)數(shù)量級(jí),互聯(lián)網(wǎng)絡(luò)需求在100Gbps~400Gbps,此外使用了RDMA協(xié)議來(lái)減少傳輸時(shí)延,提升網(wǎng)絡(luò)吞吐。

具體來(lái)說(shuō),數(shù)千GPU的高性能組網(wǎng),在網(wǎng)絡(luò)規(guī)模上有以下問(wèn)題需要考慮

·大規(guī)模RDMA網(wǎng)絡(luò)遇到的問(wèn)題,例如鏈路頭阻、PFC死鎖風(fēng)暴

·網(wǎng)絡(luò)性能優(yōu)化,包括更高效的擁塞控制、負(fù)載均衡技術(shù)

·網(wǎng)卡連接性能問(wèn)題,單主機(jī)受到硬件性能限制,如何構(gòu)建數(shù)千RDMA的QP連接

·網(wǎng)絡(luò)拓?fù)溥x擇,是傳統(tǒng)Fat Tree結(jié)構(gòu)更好,還是可以參考高性能計(jì)算的Torus,Dragonfly等組網(wǎng)

2

超高帶寬需求

在AI大模型訓(xùn)練場(chǎng)景下,機(jī)內(nèi)與機(jī)外的集合通信操作將產(chǎn)生大量的通信數(shù)據(jù)量。從機(jī)內(nèi)GPU通信角度看,以千億參數(shù)規(guī)模的AI模型為例,模型并行產(chǎn)生的AllReduce集合通信數(shù)據(jù)量將達(dá)到百GB級(jí)別,因此機(jī)內(nèi)GPU間的通信帶寬及方式對(duì)于流完成時(shí)間十分重要。服務(wù)器內(nèi)GPU應(yīng)支持高速互聯(lián)協(xié)議,且其進(jìn)一步避免了GPU通信過(guò)程中依靠CPU內(nèi)存緩存數(shù)據(jù)的多次拷貝操作。

從機(jī)間GPU通信角度看,流水線并行、數(shù)據(jù)并行及張量并行模式需要不同的通信操作,部分集合通信數(shù)據(jù)將達(dá)到百GB級(jí)別,且復(fù)雜的集合通信模式將在同一時(shí)刻產(chǎn)生多對(duì)一與一對(duì)多的通信。因此機(jī)間GPU的高速互聯(lián)對(duì)于網(wǎng)絡(luò)的單端口帶寬、節(jié)點(diǎn)間的可用鏈路數(shù)量及網(wǎng)絡(luò)總帶寬提出了高要求。另外,GPU與網(wǎng)卡間通常通過(guò)PCIe總線互聯(lián),PCIe總線的通信帶寬決定網(wǎng)卡單端口帶寬能否完全發(fā)揮。以PCIe3.0總線(16lane對(duì)應(yīng)單向16GB/秒帶寬)為例,當(dāng)機(jī)間通信配備200Gbps的單端口帶寬時(shí),機(jī)間的網(wǎng)絡(luò)性能將無(wú)法完全被使用。

3

超低時(shí)延及抖動(dòng)需求

在數(shù)據(jù)通信傳輸過(guò)程中產(chǎn)生的網(wǎng)絡(luò)時(shí)延由靜態(tài)時(shí)延和動(dòng)態(tài)時(shí)延兩個(gè)部分構(gòu)成。靜態(tài)時(shí)延包含數(shù)據(jù)串行時(shí)延、設(shè)備轉(zhuǎn)發(fā)時(shí)延和光電傳輸時(shí)延,靜態(tài)時(shí)延由轉(zhuǎn)發(fā)芯片的能力和傳輸?shù)木嚯x決定,當(dāng)網(wǎng)絡(luò)拓?fù)渑c通信數(shù)據(jù)量確定時(shí),此部分時(shí)延通常為固定值,而真正對(duì)網(wǎng)絡(luò)性能影響比較大的是動(dòng)態(tài)時(shí)延。動(dòng)態(tài)時(shí)延包含了交換機(jī)內(nèi)部排隊(duì)時(shí)延和丟包重傳時(shí)延,通常由網(wǎng)絡(luò)擁塞和丟包引起。

以1750億參數(shù)規(guī)模的GPT-3模型訓(xùn)練為例,從理論估算模型分析,當(dāng)動(dòng)態(tài)時(shí)延從10us提升至1000us時(shí),GPU有效計(jì)算時(shí)間占比將降低接近10%,當(dāng)網(wǎng)絡(luò)丟包率為千分之一時(shí),GPU 有效計(jì)算時(shí)間占比將下降13%,當(dāng)網(wǎng)絡(luò)丟包率達(dá)到1%時(shí),GPU有效計(jì)算時(shí)間占比將低于5%。如何降低計(jì)算通信時(shí)延、提升網(wǎng)絡(luò)吞吐是AI大模型智算中心能夠充分釋放算力的核心問(wèn)題。

除時(shí)延外,網(wǎng)絡(luò)變化因素引入的時(shí)延抖動(dòng)也對(duì)訓(xùn)練效率產(chǎn)生影響。訓(xùn)練過(guò)程中計(jì)算節(jié)點(diǎn)的集合通信過(guò)程一般可以拆解成多個(gè)節(jié)點(diǎn)間并行執(zhí)行P2P通信,例如N個(gè)節(jié)點(diǎn)間Ring AllReduce 集合通信包含2*(N-1)次的數(shù)據(jù)通信子流程,每個(gè)子流程中所有節(jié)點(diǎn)均完成P2P通信(并行執(zhí)行)才可結(jié)束這個(gè)子流程。當(dāng)網(wǎng)絡(luò)出現(xiàn)波動(dòng)時(shí),某兩個(gè)節(jié)點(diǎn)間的P2P的流完成時(shí)間(FCT)將明顯變長(zhǎng)。因網(wǎng)絡(luò)抖動(dòng)引入的P2P通信時(shí)間變化可理解為木桶效率的最弱一環(huán),將會(huì)導(dǎo)致其所屬的子流程的完成時(shí)間也隨之變長(zhǎng)。因此,網(wǎng)絡(luò)抖動(dòng)導(dǎo)致集合通信的效率變低,從而影響到AI大模型的訓(xùn)練效率。

4

超高穩(wěn)定性需求

Transformer 誕生以后,開啟了大模型快速演進(jìn)的序章。過(guò)去5年時(shí)間,模型從61M,增長(zhǎng)到540B,翻了近1萬(wàn)倍!集群算力決定了AI模型訓(xùn)練速度的快慢,單塊V100訓(xùn)練GTP-3 需要335年,10000張V100的集群,集群系統(tǒng)完美線性擴(kuò)展需要12天左右時(shí)間。

網(wǎng)絡(luò)系統(tǒng)的可用性是作為基礎(chǔ)來(lái)決定整個(gè)集群的計(jì)算穩(wěn)定性。一方面,網(wǎng)絡(luò)故障域大,集群中一個(gè)網(wǎng)絡(luò)節(jié)點(diǎn)的故障可能會(huì)影響數(shù)十個(gè)甚至更多的計(jì)算節(jié)點(diǎn)的連通性,降低系統(tǒng)算力的完整性;另一方面,網(wǎng)絡(luò)性能波動(dòng)影響大,網(wǎng)絡(luò)作為集群共享資源相較于單個(gè)計(jì)算節(jié)點(diǎn)不容易被隔離,性能波動(dòng)會(huì)導(dǎo)致所有計(jì)算資源的利用率都受影響。因此在AI大模型訓(xùn)練任務(wù)周期中,維持網(wǎng)絡(luò)的穩(wěn)定高效是極其重要的目標(biāo),對(duì)網(wǎng)絡(luò)運(yùn)維帶來(lái)了新的挑戰(zhàn)。

在訓(xùn)練任務(wù)期間一旦發(fā)生故障,可能需要容錯(cuò)替換或者彈性擴(kuò)縮容的方式來(lái)處理故障節(jié)點(diǎn)。一旦參與計(jì)算的節(jié)點(diǎn)位置發(fā)生了變化,導(dǎo)致當(dāng)前的通信模式或許就不是最優(yōu)的,需要通過(guò)作業(yè)重新排布和調(diào)度,以此來(lái)提升整體訓(xùn)練的效率。另外,一些網(wǎng)絡(luò)故障(例如靜默丟包)的發(fā)生是不可被預(yù)期的,一旦發(fā)生不僅會(huì)導(dǎo)致集合通信效率降低,同時(shí)還會(huì)引發(fā)通信庫(kù)超時(shí),造成訓(xùn)練業(yè)務(wù)長(zhǎng)時(shí)間卡死,很大程度上影響訓(xùn)練效率。因此需要通過(guò)獲取細(xì)粒度的業(yè)務(wù)流吞吐、丟包等信息,可避障自愈的耗時(shí)控制在秒級(jí)別內(nèi)。

5

網(wǎng)絡(luò)自動(dòng)化部署需求

智能無(wú)損網(wǎng)絡(luò)的構(gòu)建往往基于RDMA協(xié)議及擁塞控制機(jī)制,但與之相伴隨的是一系列復(fù)雜多樣化的配置。其中任一個(gè)參數(shù)配置錯(cuò)誤都可能會(huì)影響到業(yè)務(wù)的性能,還有可能會(huì)引出些許不符合預(yù)期的問(wèn)題。據(jù)統(tǒng)計(jì),超過(guò)90%的高性能網(wǎng)絡(luò)故障是由配置錯(cuò)誤導(dǎo)致的問(wèn)題,出現(xiàn)這一問(wèn)題的主要原因是網(wǎng)卡配置參數(shù)多,其中參數(shù)量取決于架構(gòu)版本、業(yè)務(wù)類型和網(wǎng)卡類型。由于AI大模型訓(xùn)練中集群規(guī)模大,進(jìn)一步增大配置的復(fù)雜度。因此,高效或自動(dòng)化部署配置能夠有效的提升大模型集群系統(tǒng)的可靠性和效率。自動(dòng)化部署配置需要能夠做到多臺(tái)并行部署配置的能力,自動(dòng)選擇擁塞控制機(jī)制相關(guān)參數(shù)以及根據(jù)網(wǎng)卡類型和業(yè)務(wù)類型選擇相關(guān)配置。

同樣的,在復(fù)雜的架構(gòu)和配置條件下,在業(yè)務(wù)運(yùn)行過(guò)程中可快速準(zhǔn)確地故障定位,能夠有效保障整體業(yè)務(wù)效率。自動(dòng)化的故障檢測(cè)一方面可以快速定界問(wèn)題,精準(zhǔn)推送問(wèn)題至管理人員,另一方面可以減少問(wèn)題定位成本,快速定位問(wèn)題根因并給出解決方案。

芯啟源不但在各大開源社區(qū)持續(xù)貢獻(xiàn),參與和引領(lǐng)行業(yè)發(fā)展,在國(guó)內(nèi)率先支持RDMA、GPU Direct等技術(shù),成為旁路CPU和主機(jī)內(nèi)存的最佳AI/HPC解決方案。每個(gè)GPU可配置一個(gè)DPU進(jìn)行高速互聯(lián),解決傳輸瓶頸。進(jìn)一步地,芯啟源下一代DPU采用Chiplet方式進(jìn)行GPU和DPU的互聯(lián)將帶來(lái)更高靈活性。

芯啟源DPU從芯片、硬件到軟件都實(shí)現(xiàn)了國(guó)產(chǎn)自主可控,并率先在國(guó)內(nèi)取得大量商業(yè)訂單,其中在一些運(yùn)營(yíng)商的省級(jí)規(guī)模部署場(chǎng)景實(shí)現(xiàn)了上線超兩年、且穩(wěn)定運(yùn)行無(wú)任何異常。從傳統(tǒng)業(yè)務(wù)場(chǎng)景到AI/HPC場(chǎng)景,芯啟源DPU均提供可靠穩(wěn)定的解決方案,幫助客戶實(shí)現(xiàn)業(yè)務(wù)平滑升級(jí)和AI/HPC等新業(yè)務(wù)的快速部署。

DPU是AIGC大模型算力網(wǎng)絡(luò)的關(guān)鍵設(shè)施,芯啟源作為國(guó)產(chǎn)DPU的領(lǐng)跑者,將持續(xù)推進(jìn)“人工智能+”行動(dòng),賦能中國(guó)千行百業(yè)的數(shù)智化革新,助力新質(zhì)生產(chǎn)力。

本文轉(zhuǎn)載自微信公眾號(hào)“牛逼的IT”,小編略作修改



審核編輯:劉清

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • PFC
    PFC
    +關(guān)注

    關(guān)注

    49

    文章

    1064

    瀏覽量

    111324
  • 數(shù)據(jù)通信
    +關(guān)注

    關(guān)注

    2

    文章

    528

    瀏覽量

    35113
  • RDMA
    +關(guān)注

    關(guān)注

    0

    文章

    99

    瀏覽量

    9626
  • GPU芯片
    +關(guān)注

    關(guān)注

    1

    文章

    307

    瀏覽量

    6521
  • AI大模型
    +關(guān)注

    關(guān)注

    0

    文章

    399

    瀏覽量

    1009

原文標(biāo)題:芯啟源DPU | 解決AIGC大模型對(duì)網(wǎng)絡(luò)的5大需求

文章出處:【微信號(hào):corigine,微信公眾號(hào):芯啟源】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    模型賦能物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)系統(tǒng)軟件平臺(tái)

    ? ? 北京五木恒潤(rùn)大模型賦能物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)平臺(tái)系統(tǒng)軟件,深度融合多源數(shù)據(jù)與智能算法,大幅提升需求預(yù)測(cè)準(zhǔn)確性與采購(gòu)決策科學(xué)性,成為企業(yè)優(yōu)化供應(yīng)鏈管理、降低運(yùn)營(yíng)成本的核心工具。以下從系統(tǒng)目標(biāo)
    的頭像 發(fā)表于 12-17 16:37 ?296次閱讀

    模型賦能物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)系統(tǒng):功能特點(diǎn)與平臺(tái)架構(gòu)解析

    ? ? 大模型賦能物資需求預(yù)測(cè)與采購(gòu)智能化:核心功能與價(jià)值解析 ? ?大模型賦能物資需求精準(zhǔn)預(yù)測(cè)與采購(gòu)系統(tǒng)通過(guò)深度整合多源數(shù)據(jù)、構(gòu)建動(dòng)態(tài)預(yù)測(cè)模型
    的頭像 發(fā)表于 12-16 11:54 ?325次閱讀

    5g雙模路由器如何滿足現(xiàn)代企業(yè)的敏捷網(wǎng)絡(luò)需求

    ? 在數(shù)字化轉(zhuǎn)型浪潮中,網(wǎng)絡(luò)連接的穩(wěn)定性和可靠性成為企業(yè)運(yùn)營(yíng)的關(guān)鍵基礎(chǔ)設(shè)施。SR800-02系列雙模路由器憑借其獨(dú)特的4G/5G雙網(wǎng)融合技術(shù),為各類應(yīng)用場(chǎng)景提供了高可用性的網(wǎng)絡(luò)接入方案。 產(chǎn)品
    的頭像 發(fā)表于 12-03 16:58 ?1418次閱讀
    <b class='flag-5'>5</b>g雙模路由器如何滿足現(xiàn)代企業(yè)的敏捷<b class='flag-5'>網(wǎng)絡(luò)</b><b class='flag-5'>需求</b>

    5G網(wǎng)絡(luò)通信有哪些技術(shù)痛點(diǎn)?

    ,這些技術(shù)使得5G網(wǎng)絡(luò)能夠滿足未來(lái)物聯(lián)網(wǎng)、智能制造、自動(dòng)駕駛等領(lǐng)域?qū)Ω咚?、低時(shí)延、高可靠性的通信需求。 5G網(wǎng)絡(luò)通信有哪些技術(shù)痛點(diǎn)?
    發(fā)表于 12-02 06:05

    構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議

    通過(guò)實(shí)踐,本文總結(jié)了構(gòu)建CNN網(wǎng)絡(luò)模型并優(yōu)化的一般化建議,這些建議將會(huì)在構(gòu)建高準(zhǔn)確率輕量級(jí)CNN神經(jīng)網(wǎng)絡(luò)模型方面提供幫助。 1)避免單層神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 10-28 08:02

    在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)

    本帖欲分享在Ubuntu20.04系統(tǒng)中訓(xùn)練神經(jīng)網(wǎng)絡(luò)模型的一些經(jīng)驗(yàn)。我們采用jupyter notebook作為開發(fā)IDE,以TensorFlow2為訓(xùn)練框架,目標(biāo)是訓(xùn)練一個(gè)手寫數(shù)字識(shí)別的神經(jīng)網(wǎng)絡(luò)
    發(fā)表于 10-22 07:03

    “出發(fā)吧!新疆”AIGC宣傳片創(chuàng)作大賽全球征片中

    升級(jí)的創(chuàng)新突破。 「出發(fā)吧!新疆」2025新疆文旅AIGC宣傳片創(chuàng)作大賽線下沙龍會(huì)。 ? 7月6日當(dāng)天,在北京舉辦了一場(chǎng)AIGC宣傳片創(chuàng)作大賽線下沙龍,大賽評(píng)審團(tuán)專家、資深AIGC創(chuàng)作者陳家偉表示:“AI已具備從
    的頭像 發(fā)表于 07-14 10:38 ?695次閱讀
    “出發(fā)吧!新疆”<b class='flag-5'>AIGC</b>宣傳片創(chuàng)作大賽全球征片中

    模型推理顯存和計(jì)算量估計(jì)方法研究

    (如全連接層、卷積層等)確定所需的顯存大小; (3)將各層顯存大小相加,得到模型總的顯存需求。 基于神經(jīng)網(wǎng)絡(luò)剪枝的顯存估計(jì) 神經(jīng)網(wǎng)絡(luò)剪枝是一種減少
    發(fā)表于 07-03 19:43

    AIGC算力基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實(shí)踐

    代提升1.5倍,內(nèi)存容量達(dá)288GB,適配千億參數(shù)模型訓(xùn)練需求。 國(guó)產(chǎn)突破?:國(guó)內(nèi)首款6nm高性能GPU芯片于2025年5月成功點(diǎn)亮,性能對(duì)標(biāo)國(guó)際中端產(chǎn)品,已獲億元級(jí)訂單;國(guó)產(chǎn)芯片廠商與高端制程工藝結(jié)合,推動(dòng)算力自主可控進(jìn)程。
    的頭像 發(fā)表于 05-29 07:44 ?980次閱讀
    <b class='flag-5'>AIGC</b>算力基礎(chǔ)設(shè)施技術(shù)架構(gòu)與行業(yè)實(shí)踐

    華為亮相第三屆中國(guó)AIGC產(chǎn)業(yè)峰會(huì)

    第三屆中國(guó)AIGC產(chǎn)業(yè)峰會(huì)在北京召開,峰會(huì)以“萬(wàn)物皆可AI”為主題,華為數(shù)據(jù)通信產(chǎn)品線NCE數(shù)據(jù)通信領(lǐng)域總裁王輝受邀參會(huì),并發(fā)表題為《當(dāng)AI成為網(wǎng)絡(luò)守護(hù)者:技術(shù)向善,守護(hù)共生》的演講,提出以AI之力應(yīng)對(duì)AI引發(fā)的網(wǎng)絡(luò)安全挑戰(zhàn),并
    的頭像 發(fā)表于 04-22 11:34 ?880次閱讀

    云知聲斬獲中國(guó)AIGC產(chǎn)業(yè)雙項(xiàng)大獎(jiǎng)

    企業(yè)」與「2025年值得關(guān)注的AIGC產(chǎn)品」雙項(xiàng)大獎(jiǎng)。 2025年,生成式人工智能(AIGC)正邁入大規(guī)模應(yīng)用的新階段。從大模型的技術(shù)突破到多模態(tài)的融合創(chuàng)新,AIGC已從實(shí)驗(yàn)室走向?qū)嶋H
    的頭像 發(fā)表于 04-21 14:13 ?891次閱讀

    榮獲雙料大獎(jiǎng)+白皮書發(fā)布:數(shù)勢(shì)科技領(lǐng)跑AIGC決策智能賽道

    4月16日,由量子位主辦的第三屆《中國(guó)AIGC產(chǎn)業(yè)峰會(huì)——萬(wàn)物皆可AI》在京成功舉辦。在基礎(chǔ)模型技術(shù)縱深突破、AI創(chuàng)新應(yīng)用集中爆發(fā)的產(chǎn)業(yè)背景下,本屆峰會(huì)聚焦前沿技術(shù)落地與行業(yè)深度融合,旨在推動(dòng)AI從
    的頭像 發(fā)表于 04-21 09:11 ?635次閱讀
    榮獲雙料大獎(jiǎng)+白皮書發(fā)布:數(shù)勢(shì)科技領(lǐng)跑<b class='flag-5'>AIGC</b>決策智能賽道

    格靈深瞳入選量子位2025年AIGC雙榜單

    4月16日,第三屆中國(guó)AIGC產(chǎn)業(yè)峰會(huì)在京召開。大會(huì)由量子位主辦,以“萬(wàn)物皆可AI”為主題,峰會(huì)C位焦點(diǎn)——“2025年值得關(guān)注的AIGC企業(yè)”與“2025年值得關(guān)注的AIGC產(chǎn)品”雙榜單正式發(fā)布!格靈深瞳入選量子位2025年
    的頭像 發(fā)表于 04-18 09:20 ?935次閱讀

    如何基于Kahn處理網(wǎng)絡(luò)定義AI引擎圖形編程模型

    本白皮書探討了如何基于 Kahn 處理網(wǎng)絡(luò)( KPN )定義 AI 引擎圖形編程模型。KPN 模型有助于實(shí)現(xiàn)數(shù)據(jù)流并行化,進(jìn)而提高系統(tǒng)的整體性能。
    的頭像 發(fā)表于 04-17 11:31 ?880次閱讀
    如何基于Kahn處理<b class='flag-5'>網(wǎng)絡(luò)</b>定義AI引擎圖形編程<b class='flag-5'>模型</b>

    RAKsmart服務(wù)器如何提升AIGC平臺(tái)的運(yùn)行效率

    AIGC(人工智能生成內(nèi)容)領(lǐng)域,高效運(yùn)行意味著更快的模型訓(xùn)練、更低的推理延遲和更流暢的用戶體驗(yàn)。RAKsmart服務(wù)器憑借其硬件配置、網(wǎng)絡(luò)優(yōu)化和生態(tài)支持,為AIGC平臺(tái)提供了從底層
    的頭像 發(fā)表于 04-01 10:40 ?670次閱讀
    RAKsmart服務(wù)器如何提升<b class='flag-5'>AIGC</b>平臺(tái)的運(yùn)行效率