chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

阿里云計(jì)算池化方案:英偉達(dá)H20 GPU用量削減82%

Carol Li ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:李彎彎 ? 2025-10-23 09:14 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)綜合報(bào)道 在當(dāng)前人工智能AI)領(lǐng)域,算力資源的高效利用已成為各大科技公司爭(zhēng)相追逐的目標(biāo)。近日,阿里云提出的創(chuàng)新計(jì)算池化解決方案“Aegaeon”成功入選頂級(jí)學(xué)術(shù)會(huì)議SOSP2025。

SOSP(操作系統(tǒng)原理研討會(huì))是由ACM SIGOPS主辦的計(jì)算機(jī)系統(tǒng)領(lǐng)域頂級(jí)學(xué)術(shù)會(huì)議,每年僅收錄數(shù)十篇論文,被譽(yù)為計(jì)算機(jī)操作系統(tǒng)領(lǐng)域的“奧斯卡”。

在過(guò)去的幾個(gè)月里,阿里云對(duì)Aegaeon系統(tǒng)進(jìn)行了為期超過(guò)三個(gè)月的Beta測(cè)試,結(jié)果顯示,該系統(tǒng)在服務(wù)參數(shù)量高達(dá)720億的大型AI模型時(shí),所需的英偉達(dá)H20 GPU數(shù)量從1192個(gè)減少至213個(gè),削減比例高達(dá)82%。

這一顯著的減少不僅意味著阿里云可以大幅降低硬件采購(gòu)成本,更是為那些依賴成千上萬(wàn)張GPU進(jìn)行模型服務(wù)的大型企業(yè)提供了寶貴的經(jīng)驗(yàn)與借鑒。以服務(wù)數(shù)十個(gè)720億參數(shù)大模型為例,原本需要1192張GPU才能完成的任務(wù),現(xiàn)在僅需213張即可勝任,硬件成本銳減超80%。

通過(guò)數(shù)據(jù)分析,阿里云發(fā)現(xiàn),現(xiàn)有模型市場(chǎng)中,少數(shù)熱門模型(例如阿里的Qwen)承載了絕大多數(shù)用戶請(qǐng)求,而大量不常被調(diào)用的“長(zhǎng)尾”模型卻各自占用大量GPU資源。數(shù)據(jù)顯示,曾有17.7%的GPU算力僅用于處理1.35%的請(qǐng)求,資源閑置現(xiàn)象相當(dāng)嚴(yán)重。

Aegaeon系統(tǒng)通過(guò)GPU資源池化的方式,打破了傳統(tǒng)“一個(gè)模型綁定一個(gè)GPU”的低效模式,實(shí)現(xiàn)了更高效的資源配置。具體而言,Aegaeon將多個(gè)GPU的計(jì)算、內(nèi)存等抽象成一個(gè)資源池,按需分配給不同的任務(wù),避免了單個(gè)任務(wù)獨(dú)占資源導(dǎo)致的閑置。

Aegaeon系統(tǒng)的核心創(chuàng)新點(diǎn)在于Token級(jí)調(diào)度。該系統(tǒng)的多模型混合服務(wù)功能能夠在每次生成下一個(gè)token時(shí)動(dòng)態(tài)決定是否切換模型,從而實(shí)現(xiàn)精細(xì)化管理。通過(guò)組件復(fù)用、顯存精細(xì)化管理以及KV緩存同步優(yōu)化等全棧技術(shù),Aegaeon將模型切換的開(kāi)銷降低了97%。

這一技術(shù)確保了token級(jí)調(diào)度的實(shí)時(shí)性,使得模型切換響應(yīng)時(shí)間可支持亞秒級(jí)的快速反應(yīng)。據(jù)介紹,Aegaeon系統(tǒng)支持單個(gè)GPU同時(shí)服務(wù)多達(dá)7個(gè)不同模型,相比于現(xiàn)有主流方案,其有效吞吐量提升了1.5至9倍,處理能力提高了2至2.5倍。

Aegaeon的落地將推動(dòng)算力租賃行業(yè)從“按卡計(jì)費(fèi)”轉(zhuǎn)向“按實(shí)際使用量計(jì)費(fèi)”,企業(yè)可通過(guò)彈性調(diào)度降低閑置成本。據(jù)測(cè)算,采用該技術(shù)的云服務(wù)商可將算力租賃價(jià)格降低40%-60%,加速AI普惠化。

隨著AI技術(shù)的不斷進(jìn)步,對(duì)算力的需求將持續(xù)增長(zhǎng)。GPU資源的高效利用,是實(shí)現(xiàn)AI規(guī)模化應(yīng)用的關(guān)鍵。阿里云的Aegaeon方案,為AI算力效率提升提供了新的思路和解決方案,未來(lái)有望在更多云計(jì)算平臺(tái)和AI應(yīng)用場(chǎng)景中得到推廣和應(yīng)用。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5048

    瀏覽量

    133972
  • 阿里云
    +關(guān)注

    關(guān)注

    3

    文章

    1025

    瀏覽量

    45328
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    英偉達(dá)官宣H20恢復(fù)中國(guó)供應(yīng),新款GPU震撼來(lái)襲

    電子發(fā)燒友原創(chuàng) 章鷹 今天,命運(yùn)多舛的英偉達(dá)H20芯片迎來(lái)了新轉(zhuǎn)機(jī)。4月,美國(guó)政府決定禁止英偉達(dá)向中國(guó)市場(chǎng)銷售
    的頭像 發(fā)表于 07-16 02:01 ?8867次閱讀
    <b class='flag-5'>英偉</b>達(dá)官宣<b class='flag-5'>H20</b>恢復(fù)中國(guó)供應(yīng),新款<b class='flag-5'>GPU</b>震撼來(lái)襲

    算力租賃市場(chǎng)爆發(fā),H20遭瘋搶!小心掉坑

    電子發(fā)燒友網(wǎng)報(bào)道(文/黃山明)從2022年起,美國(guó)開(kāi)始持續(xù)收緊對(duì)華芯片的出口政策,而H20便是英偉達(dá)專為中國(guó)市場(chǎng)量身定制的AI芯片。今年以來(lái),市場(chǎng)中的英偉
    的頭像 發(fā)表于 04-04 00:13 ?3095次閱讀

    英偉達(dá)被傳暫停生產(chǎn)H20芯片 外交部回應(yīng)

    據(jù)外媒《the Information》在當(dāng)?shù)貢r(shí)間的8月21日下午爆料稱,英偉達(dá)可能已經(jīng)暫停生產(chǎn)H20芯片。據(jù)稱,英偉達(dá)已正式下達(dá)指示給到供
    的頭像 發(fā)表于 08-22 15:58 ?2296次閱讀

    今日看點(diǎn)丨傳英偉達(dá)暫停為中國(guó)市場(chǎng)定制H20;估值10億美元的Character.AI公司或?qū)⒊鍪?/a>

    英偉達(dá) 暫停為中國(guó)市場(chǎng)定制 H20 據(jù)《The Information》周四援引兩位直接了解情況的人士的話報(bào)道稱,英偉達(dá)已告知其部分零部件供
    發(fā)表于 08-22 10:08 ?2422次閱讀

    今日看點(diǎn)丨英偉達(dá)向臺(tái)積電訂購(gòu)30萬(wàn)片H20芯片;蘋果回應(yīng)首次在中國(guó)關(guān)停直營(yíng)店

    改變了僅依賴現(xiàn)有庫(kù)存的策略。 ? ? 特朗普政府本月允許英偉達(dá)恢復(fù)向中國(guó)銷售H20圖形處理器(GPU),推翻了4月份因國(guó)家安全擔(dān)憂而實(shí)施的一項(xiàng)有效禁令,該禁令旨在阻止中國(guó)獲得先進(jìn)的人工
    發(fā)表于 07-30 10:02 ?1874次閱讀
    今日看點(diǎn)丨<b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b>向臺(tái)積電訂購(gòu)30萬(wàn)片<b class='flag-5'>H20</b>芯片;蘋果回應(yīng)首次在中國(guó)關(guān)停直營(yíng)店

    H20中國(guó)區(qū)賣爆!英偉達(dá)緊急向臺(tái)積電加訂30萬(wàn)塊

    ,性能上相當(dāng)于英偉達(dá)另一款主流GPU芯片H100的20%左右。 ? 盡管如此,在美國(guó)解禁對(duì)H20
    的頭像 發(fā)表于 07-30 08:08 ?2824次閱讀

    英偉達(dá)獲美批準(zhǔn)恢復(fù)H20在華銷售,同步推出全新兼容GPU

    7月15日上午,央廣財(cái)經(jīng)記者從英偉達(dá)方面確認(rèn),英偉達(dá)已經(jīng)獲得美國(guó)批準(zhǔn),將恢復(fù) H20 在中國(guó)的銷售,并推出面向中國(guó)市場(chǎng)的全新且完全兼容的
    的頭像 發(fā)表于 07-16 17:49 ?560次閱讀

    中方回應(yīng)英偉達(dá)將對(duì)華銷售H20芯片 反對(duì)將科技和經(jīng)貿(mào)問(wèn)題政治

    一般不對(duì)企業(yè)的行為作出具體的評(píng)論。我要指出的是,中方反對(duì)將科技和經(jīng)貿(mào)問(wèn)題政治、工具、武器,對(duì)中國(guó)進(jìn)行惡意封鎖打壓的立場(chǎng)是一貫的、明確的。這種做法擾亂全球產(chǎn)供鏈的穩(wěn)定,也不符合任何一方的利益。
    的頭像 發(fā)表于 07-15 16:22 ?1890次閱讀

    英偉達(dá)黃仁勛:將向中國(guó)市場(chǎng)銷售H20芯片 中國(guó)市場(chǎng)至關(guān)重要

    ,英偉達(dá)CEO黃仁勛在北京訪問(wèn)期間發(fā)表聲明稱,將恢復(fù)在中國(guó)銷售其H20 GPU芯片,并根據(jù)美國(guó)出口限制為中國(guó)市場(chǎng)推出一款新的GPU
    的頭像 發(fā)表于 07-15 14:32 ?909次閱讀

    今日看點(diǎn)丨英偉達(dá)將為中國(guó)市場(chǎng)推出新AI芯片 售價(jià)大幅低于H20;中科曙光與海光信息宣布戰(zhàn)略重組

    1. 英偉達(dá)將為中國(guó)市場(chǎng)推出新AI 芯片 售價(jià)大幅低于H20 ? 近日,外媒報(bào)道稱,美國(guó)芯片巨頭英偉達(dá)據(jù)報(bào)將為中國(guó)市場(chǎng)推出一款基于Black
    發(fā)表于 05-26 11:06 ?1546次閱讀

    GPU 維修干貨 | 英偉達(dá) GPU H100 常見(jiàn)故障有哪些?

    上漲,英偉達(dá)H100GPU憑借其強(qiáng)大的算力,成為AI訓(xùn)練、高性能計(jì)算領(lǐng)域的核心硬件。然而,隨著使用場(chǎng)景的復(fù)雜
    的頭像 發(fā)表于 05-05 09:03 ?2064次閱讀
    <b class='flag-5'>GPU</b> 維修干貨 | <b class='flag-5'>英偉</b><b class='flag-5'>達(dá)</b> <b class='flag-5'>GPU</b> <b class='flag-5'>H</b>100 常見(jiàn)故障有哪些?

    美國(guó)限制英偉達(dá)向華出售H20芯片

    出口H20芯片,以及任何其他性能達(dá)到H20內(nèi)存帶寬、互連帶寬或其組合的芯片,都必須獲得出口許可。 公告披露,美國(guó)政府稱,這旨在解決相關(guān)產(chǎn)品可能被用于或被轉(zhuǎn)用于中國(guó)超級(jí)計(jì)算機(jī)的風(fēng)險(xiǎn)。4月14日,美國(guó)政府通知
    的頭像 發(fā)表于 04-16 17:28 ?769次閱讀

    特朗普要叫停英偉達(dá)對(duì)華特供版 英偉達(dá)H20出口限制 或損失55億美元

    據(jù)外媒報(bào)道,英偉達(dá)公司發(fā)布了一項(xiàng)通知稱,美國(guó)政府于9日告知英偉達(dá)公司;特供版的H20芯片出口到中國(guó)需要許可證,緊接著在14日又告知
    的頭像 發(fā)表于 04-16 16:59 ?1743次閱讀

    今日看點(diǎn)丨英偉達(dá)H20出口至中國(guó)需“無(wú)限期”申請(qǐng)?jiān)S可證;特斯拉即將實(shí)現(xiàn)純AI自動(dòng)駕駛

    而設(shè)計(jì)的產(chǎn)品線。英偉達(dá)周二在監(jiān)管文件中表示,美國(guó)政府已于周一通知公司,H20芯片未來(lái)在出口至中國(guó)時(shí)需要“無(wú)限期”申請(qǐng)?jiān)S可證。政府方面表示,新規(guī)旨在應(yīng)對(duì)芯片“可能被用于或轉(zhuǎn)用于中國(guó)超級(jí)計(jì)算
    發(fā)表于 04-16 11:18 ?709次閱讀

    突發(fā)!英偉達(dá)H20芯片在華訂單大增,買家曝光

    電子發(fā)燒友網(wǎng)報(bào)道(文 / 吳子鵬)據(jù)路透社最新報(bào)道,六名知情人士共同透露,由于對(duì) DeepSeek 低成本人工智能模型的需求激增,中國(guó)企業(yè)正在增加英偉達(dá) H20 人工智能芯片的訂單,這或許有助于緩解
    的頭像 發(fā)表于 02-26 00:10 ?3738次閱讀