chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

異構(gòu)混訓整合不同架構(gòu)芯片資源,提高算力利用率

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2024-07-18 00:11 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文/李彎彎)隨著AI技術(shù)的飛速發(fā)展,大模型的訓練和推理任務(wù)對算力的需求日益增長。然而,單一品牌的芯片往往難以滿足所有需求,且可能存在供應(yīng)鏈風險。因此,異構(gòu)芯片混訓成為了一種重要的解決方案。通過混合使用多種異構(gòu)芯片,可以充分利用不同芯片的優(yōu)勢,提高算力利用率,降低算力成本,并推動AI技術(shù)的廣泛應(yīng)用。

異構(gòu)混訓能夠整合不同架構(gòu)芯片資源

在2024年世界人工智能大會AI基礎(chǔ)設(shè)施論壇上,無問芯穹聯(lián)合創(chuàng)始人兼CEO夏立雪發(fā)布了全球首個千卡規(guī)模異構(gòu)芯片混訓平臺,千卡異構(gòu)混合訓練集群算力利用率最高達到了97.6%。

同時,無問芯穹Infini-AI云平臺已集成大模型異構(gòu)千卡混訓能力,是全球首個可進行單任務(wù)千卡規(guī)模異構(gòu)芯片混合訓練的平臺,具備萬卡擴展性,支持包括AMD、華為昇騰、天數(shù)智芯、沐曦、摩爾線程、NVIDIA六種異構(gòu)芯片在內(nèi)的大模型混合訓練。通過Infini-AI云平臺,用戶可以在異構(gòu)算力資源上實現(xiàn)高效的模型訓練和推理,從而加速AI應(yīng)用的開發(fā)和部署。

據(jù)稱,已有智譜AI、月之暗面、生數(shù)科技等大模型公司客戶在Infini-AI上穩(wěn)定使用異構(gòu)算力,還有20余家AI Native應(yīng)用創(chuàng)業(yè)公司在Infini-AI上持續(xù)調(diào)用各種預(yù)置模型。

異構(gòu)混訓平臺具有多樣化算力資源、高效算力分配、靈活性與可擴展性、降低總體擁有成本(TCO)、推動技術(shù)創(chuàng)新和生態(tài)整合等特點。

具體來看,異構(gòu)混訓平臺能夠整合來自不同廠商、不同架構(gòu)的芯片資源,這些芯片在各自擅長的領(lǐng)域具有不同的性能優(yōu)勢。通過智能的調(diào)度算法和任務(wù)分發(fā)機制,異構(gòu)混訓平臺能夠根據(jù)任務(wù)的特性和需求,將最適合的算力資源分配給相應(yīng)的芯片,從而實現(xiàn)算力資源的最大化利用。

異構(gòu)混訓平臺支持多種芯片和算法的組合使用,能夠靈活應(yīng)對不同規(guī)模、不同復(fù)雜度的訓練任務(wù)。同時,它也具備較高的可擴展性,能夠根據(jù)實際需求進行算力資源的動態(tài)擴展。通過整合不同架構(gòu)的芯片資源,避免對單一硬件平臺的過度依賴,異構(gòu)混訓平臺能夠降低供應(yīng)鏈風險,并通過提高算力利用率和訓練效率來降低總體擁有成本。

異構(gòu)混訓平臺為AI技術(shù)創(chuàng)新提供了更加廣闊的舞臺,通過整合不同芯片和算法的優(yōu)勢資源,可以激發(fā)更多的創(chuàng)新靈感和技術(shù)突破。同時,它也有助于打破不同硬件生態(tài)系統(tǒng)之間的壁壘,促進生態(tài)整合與協(xié)同發(fā)展。

異構(gòu)混訓在AI領(lǐng)域的需求日益凸顯

近年來,隨著人工智能技術(shù)的不斷發(fā)展,大模型的參數(shù)量急劇增加,從十億、百億到千億甚至萬億級別。以ChatGPT、LLama等為代表的大模型技術(shù)正持續(xù)推動社會變革,引發(fā)新一輪人工智能熱潮。這些大模型具有數(shù)千億甚至上萬億參數(shù)規(guī)模,單個計算節(jié)點無法滿足訓練需求,訓練過程耗時巨大。

面對如此龐大的模型,傳統(tǒng)的同構(gòu)算力集群已經(jīng)無法滿足訓練需求。即使采用分布式訓練框架,也需要充分整合可調(diào)動的算力資源進行分布式并行加速。然而,由于不同廠商的智算芯片之間存在計算架構(gòu)、緩存資源、互聯(lián)方式等諸多差異,以及AI計算框架與各廠商基礎(chǔ)軟件棧深度綁定,導(dǎo)致多種智算芯片難以協(xié)同工作,限制了算力資源的充分利用。

異構(gòu)芯片混訓成了解決算力限制的重要方式,目前已經(jīng)有諸多應(yīng)用案例。如,醫(yī)療機構(gòu)采用異構(gòu)芯片混訓平臺,將NVIDIA GPU、Intel CPU以及華為昇騰AI處理器等多種芯片混合使用。通過平臺的高效調(diào)度和算力分配,實現(xiàn)了對醫(yī)學影像數(shù)據(jù)的快速處理和分析。

異構(gòu)芯片混訓平臺能夠顯著提高了醫(yī)療影像分析系統(tǒng)的處理速度和精度,為醫(yī)生提供了更加準確和及時的診斷支持。

自動駕駛汽車研發(fā)公司采用異構(gòu)芯片混訓平臺,將AMD GPU、NVIDIA GPU以及專用AI加速器等多種芯片混合使用。通過平臺的異構(gòu)并行訓練能力,實現(xiàn)了對自動駕駛算法模型的高效訓練和優(yōu)化。

異構(gòu)芯片混訓平臺能顯著提高自動駕駛算法模型的訓練速度和精度,為自動駕駛汽車的研發(fā)提供了有力支持。同時,通過降低算力成本和提高資源利用率,也可以幫助公司加快自動駕駛技術(shù)的商業(yè)化進程。

寫在最后

當然,在異構(gòu)芯片混訓過程中,可能會面臨一些技術(shù)挑戰(zhàn),如不同芯片間的通信問題、性能差異等。為了解決這些問題,可以采取相應(yīng)的措施,如建立通用的集合通信庫,實現(xiàn)不同種芯片的高效通信,兼容多種硬件;提出基于流水線并行的非均勻拆分方案,解決不同硬件效率不一樣的問題,針對自身情況分配最適合的任務(wù)等。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38189

    瀏覽量

    297024
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1389

    瀏覽量

    16566
  • 大模型
    +關(guān)注

    關(guān)注

    2

    文章

    3455

    瀏覽量

    4974
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    華為發(fā)布AI容器技術(shù)Flex:ai,平均利用率提升30%

    決方案。 ? 當前,AI產(chǎn)業(yè)正處于高速發(fā)展的黃金時期,海量需求如潮水般涌來。然而,資源利用率
    的頭像 發(fā)表于 11-26 08:31 ?7198次閱讀

    湘軍,讓變成生產(chǎn)

    腦極體
    發(fā)布于 :2025年11月25日 22:56:58

    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)計算效能

    前言AI已成為數(shù)字經(jīng)濟時代的核心生產(chǎn),但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計,行業(yè)
    的頭像 發(fā)表于 11-21 16:05 ?772次閱讀
    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化<b class='flag-5'>異構(gòu)</b><b class='flag-5'>算</b><b class='flag-5'>力</b>計算效能

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細節(jié)?

    反而壓到了310W。更有意思的是它的異構(gòu)架構(gòu):NPU+CPU+DVPP的組合,居然能同時扛住訓練和推理場景,之前做自動駕駛算法時,用它跑模型時延直接降了20%。 但疑惑也有:這種密度下,散熱怎么解決?而且昇騰的生態(tài)適配速度能
    發(fā)表于 10-27 13:12

    中科曙光超智融合方案助力國產(chǎn)中心建設(shè)

    近期,位于魯中南地區(qū)的某大型中心正式啟動建設(shè),標志著國產(chǎn)技術(shù)在該區(qū)域數(shù)字經(jīng)濟中的重要突破。該中心采用中科曙光“超智融合”方案,實現(xiàn)
    的頭像 發(fā)表于 07-31 17:13 ?1323次閱讀

    立訊技術(shù)解讀ETH-X超節(jié)點高速互連技術(shù)的現(xiàn)狀與未來

    當前,人工智能技術(shù)驅(qū)動全球數(shù)據(jù)中心向智中心加速演進,傳統(tǒng)架構(gòu)在承載AI大模型訓練時暴露出顯著瓶頸--資源調(diào)度碎片化、異構(gòu)
    的頭像 發(fā)表于 07-03 09:44 ?2037次閱讀
    立訊技術(shù)解讀ETH-X超節(jié)點高速互連技術(shù)的現(xiàn)狀與未來

    海光DCU率先展開文心系列模型的深度技術(shù)合作 FLOPs利用率(MFU)達47%

    列模型的深度技術(shù)適配,預(yù)訓練模型FLOPs利用率(MFU)達到47%,在多個文本與多模態(tài)基準測試中取得SOTA水平。此次合作標志著國產(chǎn)基礎(chǔ)設(shè)施與大模型技術(shù)的協(xié)同創(chuàng)新進入新階段。 技術(shù)突破:
    的頭像 發(fā)表于 07-01 14:35 ?1939次閱讀

    壁仞科技擔任智集群異構(gòu)工作組組長

    參與了本次交流,分享智集群異構(gòu)的關(guān)鍵技術(shù)進展、成功落地案例,為突破大模型異構(gòu)
    的頭像 發(fā)表于 05-27 16:55 ?929次閱讀

    拼版怎么拼好,板廠經(jīng)常說利用率太低,多收費用?

    做板的時候,板廠經(jīng)常說我拼版利用率太低,要多收取費用,哪位大神知道怎么利用率
    發(fā)表于 05-14 13:42

    DeepSeek MoE架構(gòu)下的網(wǎng)絡(luò)負載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)利用率的關(guān)鍵策略

    、All-to-All等),網(wǎng)絡(luò)面臨高并發(fā)、低延遲、無損傳輸?shù)膰揽列枨?。然而,傳統(tǒng)以太網(wǎng)的網(wǎng)絡(luò)利用率長期徘徊在35%~40%,成為制約AI釋放的關(guān)鍵瓶頸。
    的頭像 發(fā)表于 04-28 12:04 ?698次閱讀
    DeepSeek MoE<b class='flag-5'>架構(gòu)</b>下的網(wǎng)絡(luò)負載如何優(yōu)化?解鎖90%網(wǎng)絡(luò)<b class='flag-5'>利用率</b>的關(guān)鍵策略

    梯度科技助力客戶破解調(diào)度難題

    在數(shù)字經(jīng)濟與人工智能深度融合的新階段,已成為支撐人工智能發(fā)展的核心生產(chǎn)。梯度科技基于云原生技術(shù)架構(gòu)研發(fā)的
    的頭像 發(fā)表于 04-27 16:32 ?1025次閱讀

    RAKsmart智能架構(gòu)異構(gòu)計算+低時延網(wǎng)絡(luò)驅(qū)動企業(yè)AI訓練范式升級

    在AI大模型參數(shù)量突破萬億、多模態(tài)應(yīng)用爆發(fā)的今天,企業(yè)AI訓練正面臨效率與成本的雙重挑戰(zhàn)。RAKsmart推出的智能架構(gòu),以
    的頭像 發(fā)表于 04-17 09:29 ?603次閱讀

    DeepSeek驅(qū)動AI市場升溫,智中心利用率望提升

    。 盡管目前這一需求尚未對供給造成直接影響,但卡價格已經(jīng)呈現(xiàn)出上漲趨勢。這一變化反映出市場對AI的強烈需求,以及DeepSeek等技術(shù)推動下的
    的頭像 發(fā)表于 02-19 14:00 ?718次閱讀

    DeepSeek對芯片的影響

    DeepSeek模型,尤其是其基于MOE(混合專家)架構(gòu)的DeepSeek-V3,對芯片的要求產(chǎn)生了深遠影響。為了更好地理解這一影響,我們可以從幾個方面進行分析。一.MOE
    的頭像 發(fā)表于 02-07 10:02 ?1630次閱讀
    DeepSeek對<b class='flag-5'>芯片</b><b class='flag-5'>算</b><b class='flag-5'>力</b>的影響