chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

華為發(fā)布AI容器技術(shù)Flex:ai,算力平均利用率提升30%

Carol Li ? 來源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-11-26 08:31 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報道 2025年11月21日,在上海舉辦的“2025 AI容器應(yīng)用落地與發(fā)展論壇”上,華為正式發(fā)布并開源了創(chuàng)新AI容器技術(shù)Flex:ai,為解決算力資源利用難題帶來了全新的思路和解決方案。

當(dāng)前,AI產(chǎn)業(yè)正處于高速發(fā)展的黃金時期,海量算力需求如潮水般涌來。然而,算力資源利用率偏低的問題卻成為了產(chǎn)業(yè)發(fā)展的關(guān)鍵桎梏。具體表現(xiàn)為,小模型任務(wù)常常獨(dú)占整卡,導(dǎo)致大量資源閑置;大模型任務(wù)又因單機(jī)算力不足而難以支撐;更有大量缺乏GPU/NPU的通用服務(wù)器處于算力“休眠”狀態(tài)。這種供需錯配的現(xiàn)象,造成了嚴(yán)重的資源浪費(fèi),使得企業(yè)在算力投入上既面臨高昂的成本,又無法獲得理想的算力使用效率。

Flex:ai是基于Kubernetes容器編排平臺構(gòu)建的XPU池化與調(diào)度軟件,它通過三大核心技術(shù)突破,實現(xiàn)了算力資源的精細(xì)化管理。

在算力資源切分方面,華為與上海交通大學(xué)聯(lián)合研發(fā)的XPU池化框架發(fā)揮了關(guān)鍵作用。該框架能夠?qū)螐圙PU/NPU算力卡精準(zhǔn)切分至10%的虛擬單元,實現(xiàn)了單卡同時承載多個AI工作負(fù)載。這種一卡變多卡的技術(shù),使得小模型訓(xùn)推場景下的整體算力平均利用率提升了30%,大大提高了單卡的服務(wù)能力。

跨節(jié)點算力資源聚合技術(shù)則是華為與廈門大學(xué)合作的成果。通過跨節(jié)點拉遠(yuǎn)虛擬化技術(shù),將集群內(nèi)各節(jié)點的空閑XPU算力聚合形成共享算力池。這一技術(shù)不僅為大模型任務(wù)提供了充足的資源支撐,還讓通用服務(wù)器能夠通過高速網(wǎng)絡(luò)轉(zhuǎn)發(fā)AI工作負(fù)載,實現(xiàn)了通用算力與智能算力資源的融合,打破了資源孤島。

多級智能調(diào)度技術(shù)由華為與西安交通大學(xué)共同打造。Hi Scheduler智能調(diào)度器能夠自動感知集群負(fù)載與資源狀態(tài),結(jié)合AI工作負(fù)載的優(yōu)先級、算力需求等多維參數(shù),對本地及遠(yuǎn)端的虛擬化GPU、NPU資源進(jìn)行全局最優(yōu)調(diào)度。即使在負(fù)載頻繁波動的場景下,也能保障AI工作負(fù)載的平穩(wěn)運(yùn)行,讓每一份算力都物盡其用。

Flex:ai對標(biāo)英偉達(dá)旗下Run:ai公司的核心技術(shù),但具有獨(dú)特的優(yōu)勢。Run:ai主要服務(wù)于英偉達(dá)GPU生態(tài),而Flex:ai沒有生態(tài)限制,英偉達(dá)的GPU和華為昇騰NPU等算力卡都可以使用。它通過軟件創(chuàng)新,實現(xiàn)了對英偉達(dá)、昇騰及其他第三方算力資源的統(tǒng)一管理和高效利用,有效屏蔽了不同算力硬件之間的差異,為AI應(yīng)用提供了更高效穩(wěn)定的資源支撐。

華為將Flex:ai開源在魔擎社區(qū)中,并與此前開源的多款A(yù)I工具共同組成完整的ModelEngine開源生態(tài)。

Flex:ai的能力已在真實產(chǎn)業(yè)場景中得到驗證。瑞金醫(yī)院與華為聯(lián)合打造的多模態(tài)病理大模型“RuiPath”,基于Flex:ai的技術(shù)支撐,將XPU資源可用度從40%提升至70%,破解了有限算力下的大規(guī)模訓(xùn)練難題。隨著AI與容器技術(shù)的深度融合,未來的應(yīng)用開發(fā)將更加智能化、自動化。Flex:ai的發(fā)布標(biāo)志著AI基礎(chǔ)設(shè)施競爭正從“拼硬件”轉(zhuǎn)向“拼系統(tǒng)”,當(dāng)軟件能真正駕馭硬件,當(dāng)開源平臺打破廠商藩籬,AI發(fā)展的主動權(quán)才真正回到應(yīng)用者手中。
聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 華為
    +關(guān)注

    關(guān)注

    217

    文章

    35748

    瀏覽量

    260565
  • 算力
    +關(guān)注

    關(guān)注

    2

    文章

    1379

    瀏覽量

    16550
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    MWC Doha 2025|美格智能全新發(fā)布60 Tops AI、支持Linux系統(tǒng)的SNM982高AI模組

    11月25日,在MWCDoha展會期間,美格智能全新發(fā)布基于高通QCS8650平臺研發(fā)設(shè)計的SNM982高AI模組。搭載Linux5.15系統(tǒng),
    的頭像 發(fā)表于 11-25 16:34 ?459次閱讀
    MWC Doha 2025|美格智能全新<b class='flag-5'>發(fā)布</b>60 Tops <b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>、支持Linux系統(tǒng)的SNM982高<b class='flag-5'>算</b><b class='flag-5'>力</b><b class='flag-5'>AI</b>模組

    華為發(fā)布并開源創(chuàng)新AI容器技術(shù)Flex:ai

    11月21日,2025AI容器應(yīng)用落地與發(fā)展論壇在上海舉行。華為公司副總裁、數(shù)據(jù)存儲產(chǎn)品線總裁周躍峰博士在論壇上正式發(fā)布AI
    的頭像 發(fā)表于 11-25 15:34 ?239次閱讀

    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)計算效能

    前言AI已成為數(shù)字經(jīng)濟(jì)時代的核心生產(chǎn),但全球AI產(chǎn)業(yè)正面臨“供給不足、成本高企、生態(tài)待建”三重挑戰(zhàn)。據(jù)行業(yè)統(tǒng)計,行業(yè)
    的頭像 發(fā)表于 11-21 16:05 ?649次閱讀
    從CPU、GPU到NPU,美格智能持續(xù)優(yōu)化異構(gòu)<b class='flag-5'>算</b><b class='flag-5'>力</b>計算效能

    今日看點:消息稱已有模組企業(yè)調(diào)整原定產(chǎn)品規(guī)劃;華為發(fā)布 AI 領(lǐng)域突破性技術(shù)

    提升 GPU(圖形處理器)和 NPU(神經(jīng)網(wǎng)絡(luò)處理器)等資源的利用率。目前,行業(yè)內(nèi)資源的
    發(fā)表于 11-17 10:47 ?1069次閱讀

    國產(chǎn)AI芯片真能扛住“內(nèi)卷”?海思昇騰的這波操作藏了多少細(xì)節(jié)?

    最近行業(yè)都在說“AI的命門”,但國產(chǎn)芯片真的能接住這波需求嗎? 前陣子接觸到海思昇騰910B,實測下來有點超出預(yù)期——7nm工藝下
    發(fā)表于 10-27 13:12

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:26 ?1105次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    什么是AI模組?

    未來,騰視科技將繼續(xù)深耕AI模組領(lǐng)域,全力推動AI邊緣計算行業(yè)的深度發(fā)展。隨著AI技術(shù)的不斷
    的頭像 發(fā)表于 09-19 15:25 ?391次閱讀
    什么是<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>模組?

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片到AGI芯片

    建立的基礎(chǔ): ①支柱②數(shù)據(jù)支柱③計算支柱 1)AI
    發(fā)表于 09-18 15:31

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI的未來:提升還是智力

    持續(xù)發(fā)展體現(xiàn)在: 1、收益遞減 大模型的基礎(chǔ)的需要極大的,這首先源于昂貴的高性能AI芯片,然后是寶貴的電力、水等與環(huán)境相關(guān)的資源。 收益遞減體現(xiàn)在: ①模型大小 ②訓(xùn)練數(shù)據(jù)量 ③訓(xùn)練算法的優(yōu)化 2
    發(fā)表于 09-14 14:04

    睿海光電800G光模塊助力全球AI基建升級

    18%。 智中心建設(shè):與國內(nèi)AI獨(dú)角獸合作,提供支持液冷散熱的800G模塊集群,助力其大模型訓(xùn)練效率提升30%。 邊緣計算網(wǎng)絡(luò):在北美某5G運(yùn)營商邊緣節(jié)點中,基于DML方案的SR8模
    發(fā)表于 08-13 19:05

    一文看懂AI集群

    ,可以給AI浪潮提供源源不斷的動力。那么,AI集群,到底是由哪些東西組成的呢?它為什么能夠提供澎湃的
    的頭像 發(fā)表于 07-23 12:18 ?909次閱讀
    一文看懂<b class='flag-5'>AI</b><b class='flag-5'>算</b><b class='flag-5'>力</b>集群

    拼版怎么拼好,板廠經(jīng)常說利用率太低,多收費(fèi)用?

    做板的時候,板廠經(jīng)常說我拼版利用率太低,要多收取費(fèi)用,哪位大神知道怎么利用率
    發(fā)表于 05-14 13:42

    DeepSeek推動AI需求:800G光模塊的關(guān)鍵作用

    隨著人工智能技術(shù)的飛速發(fā)展,AI需求正以前所未有的速度增長。DeepSeek等大模型的訓(xùn)練與推理任務(wù)對
    發(fā)表于 03-25 12:00

    DeepSeek驅(qū)動AI市場升溫,智中心利用率提升

    。 盡管目前這一需求尚未對供給造成直接影響,但卡價格已經(jīng)呈現(xiàn)出上漲趨勢。這一變化反映出市場對AI的強(qiáng)烈需求,以及DeepSeek等技術(shù)
    的頭像 發(fā)表于 02-19 14:00 ?692次閱讀

    企業(yè)AI租賃模式的好處

    構(gòu)建和維護(hù)一個高效、可擴(kuò)展的AI基礎(chǔ)設(shè)施,不僅需要巨額的初期投資,還涉及復(fù)雜的運(yùn)維管理和持續(xù)的技術(shù)升級。而AI
    的頭像 發(fā)表于 12-24 10:49 ?1647次閱讀