chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

Arm攜手Google Cloud推進代理式AI基礎設施規(guī)模化落地

Arm社區(qū) ? 來源:Arm社區(qū) ? 2026-05-06 09:41 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

作者:ArmAI 事業(yè)部軟件生態(tài)系統(tǒng)總監(jiān) Yan Fisher

Google Cloud 正通過多項升級舉措,穩(wěn)步推進代理式人工智能 (Agentic AI) 的規(guī)?;涞?。此次更新包含全新 TPU 8t 和 TPU 8i 系統(tǒng),同時在 Google Kubernetes Engine (GKE) 上線 Agent Sandbox。作為定制化部署框架,它能夠高效、安全地運行復雜的多步驟 AI 系統(tǒng)。這套全新的代理式基礎設施,搭載Google 基于 Arm Neoverse 平臺打造的 Axion 處理器,充分體現出行業(yè)核心趨勢:新一代 AI 工作負載正加速轉向定制化 CPU 架構。

隨著代理式 AI 從技術試驗邁向商用部署,基礎設施的需求正在迭代變革。傳統(tǒng)推理僅依賴單次模型調用,而智能體系統(tǒng)需要持續(xù)編排調度邏輯推理鏈、工具調用和實時數據讀取。這大幅拉高了并發(fā)壓力、時延敏感度與整體算力消耗,讓 CPU 成為承載業(yè)務穩(wěn)定運行的核心關鍵。

這正是 Arm 架構基礎設施的核心優(yōu)勢所在。Arm Neoverse 平臺專為高吞吐、高能效計算場景打造,Google Axion 便是典型代表,已然成為規(guī)?;渴鸫硎?AI 的堅實底座。

規(guī)?;硎?AI:Axion 走在前沿

Google Cloud 正式發(fā)布第八代 TPU 系統(tǒng),延續(xù)了其長期深耕定制芯片設計的技術積淀。本次新品針對訓練與推理應用做出差異化劃分,推出 TPU 8t 與 TPU 8i 兩款型號;同時首次搭載 Google Axion CPU 作為計算頭節(jié)點 (header)。該設計有效降低數據預處理時延,保障 TPU 算力引擎滿載運行、杜絕算力閑置卡頓。

當然,TPU 并非全部布局。Google Cloud 正全力推進“AI Hypercomputer”協(xié)同設計愿景,另一項關鍵發(fā)布是 GKE Agent Sandbox。它提供可擴展、低時延的基礎設施,使智能體能夠在不犧牲性能的前提下,安全地執(zhí)行不受信任的代碼和工具調用。借助 Google Axion,用戶可以在領先的基礎設施之上構建智能體,同時兼顧成本效益與技術選擇的靈活性。

運行在 Google Axion 處理器之上、基于 gVisor 打造,且支持 Kata Containers 的 GKE Agent Sandbox,可實現以下性能指標:

每個集群每秒支持 300 個沙箱

首指令執(zhí)行時延低于 1 秒

要維持如此高的沙箱吞吐能力和低時延執(zhí)行表現,底層基礎設施始終承受著持續(xù)壓力。隨著代理式 AI 逐步成為主流部署范式,其所依賴的基礎設施必須在吞吐能力、響應速度與能效方面同步提升,才能在大規(guī)模場景下可靠運行智能體工作負載。Axion 正是為滿足這一需求而設計。

隨著智能體系統(tǒng)不斷擴張,推理效率的重要性愈發(fā)凸顯。低效的推理能力會直接導致智能體無法正常運轉;而缺少智能體編排,推理算力也將長期處于閑置狀態(tài)。將兩大核心任務部署到基于 CPU 的基礎設施之上,企業(yè)即可在嚴控成本的前提下,實現高性能智能體系的規(guī)模化擴展。

Axion 賦能 AI 推理:以極致性能重構成本效益

C4A 虛擬機搭載基于 Arm Neoverse V2 平臺的 Axion CPU,經過深度優(yōu)化,可與專用加速器形成能力互補。依托通用計算底座高效承載高并行、時延敏感型工作負載,實現高吞吐 AI 推理。

該優(yōu)勢已在實際部署環(huán)境中得到充分驗證。歐洲在線旅游平臺 loveholidays 需在 PB 級數據之上,穩(wěn)定運行大規(guī)模向量嵌入與推理工作負載;規(guī)?;渴饒鼍跋?,純加速器方案成本高昂,落地門檻極高。

loveholidays 工程負責人 Dimitri Lerko 表示:“業(yè)務高速發(fā)展下,我們的詞元 (token) 處理需求增速已遠超預算擴容節(jié)奏。面對現有海量數據規(guī)模,依靠 GPU 承載大規(guī)模向量嵌入與推理負載成本難以為繼,因此提升 CPU 能效成為核心訴求。依托 Axion 系列的 C4A 和 N4A 虛擬機,我們獲得了充足的性價比優(yōu)勢,得以基于 CPU 構建實時 AI 決策管線,運行定制化模型與開源模型推理。這一落地模式在以往完全不具備可行性?!?/p>

實測數據顯示,在多種 AI 推理工作負載中,C4A 始終優(yōu)于當前一代的 x86 實例:

0e3202a4-4054-11f1-90a1-92fbcf53809c.jpg

Axion 產品組合擴展

針對需要更高控制能力的工作負載,Axion 系列新增 C4A Metal 原生裸金屬實例(預覽版),將一致的 Arm 架構從云端延伸至邊緣側。該實例支持跨環(huán)境統(tǒng)一開發(fā)、驗證與部署,可直接訪問硬件資源,消除虛擬化層 (hypervisor) 性能損耗,提供穩(wěn)定可預期的運行表現。十分適用于需求嚴苛的用例,包括汽車 vHIL、原生安卓 CI/CD,以及對控制能力、性能表現與架構一致性有嚴苛要求的專用企業(yè)基礎設施。

松下汽車系統(tǒng)北美公司首席技術官 Andrew Poliak 表示:“松下正跨云端與車端,打造新一代車載體驗。在 C4A Metal 實例預覽階段,我們采用與邊緣側架構完全一致的 Arm 裸金屬環(huán)境,研發(fā)團隊可依托統(tǒng)一平臺,完成車載應用的全流程開發(fā)、測試與驗證。依托比特級一致性能力,我們可實現云端至車端的無縫遷移,在兩端運行完全相同的二進制程序,無需因架構不同而為遷移部署耗費資源。”

與此同時,作為 Axion 系列最新成員的 N4A,為 Web 服務、API 調用以及數據處理管線等橫向擴展型工作負載提供了高性價比的計算基礎。

C4A、C4A Metal 與 N4A 共同構成了一個統(tǒng)一、面向不同工作負載優(yōu)化的產品組合,既覆蓋 AI 推理,也支持橫向擴展型應用,并貫穿云端到邊緣環(huán)境,幫助團隊在 Arm 計算平臺上同時實現性能與成本的優(yōu)化。

Arm 優(yōu)先部署,構筑領先生態(tài)

Arm 已支撐起業(yè)內規(guī)模龐大、增速領先的軟件生態(tài)系統(tǒng),持續(xù)推動云端與邊緣側向以 Arm 架構優(yōu)先的計算轉型。Google 已在 Axion 處理器上運行包括 BigQuery、Spanner、Bigtable、Google Earth Engine、Google Compute Engine、GKE Dataflow、Cloud Batch 等多項生產級服務,并在其部署環(huán)境中完成超 30,000 款內部應用的架構遷移。

對于剛剛啟動遷移的企業(yè),Arm 的云遷移資源中心 (Arm Cloud Migration Resource Hub)[1]提供了 100 多條 Learning Path[2],覆蓋 Google Axion 上的常見工作負載模式。在整個 Neoverse 生態(tài)中,Arm Software Ecosystem Dashboard[3]可用于追蹤已驗證的軟件及其推薦版本;同時,遵循 SystemReady VE 標準,可確保軟件從部署第一天起即可實現無縫互操作。Elastic、MongoDB、Palo Alto Networks、Redis Labs 以及 Couchbase 等領先的獨立軟件開發(fā)商 (ISV) 均已在基于 Axion 的基礎設施上完成全面驗證。

開始使用 Google Axion

無論是通過 GKE Agent Sandbox 部署智能體工作負載,在 C4A 上優(yōu)化推理性能,還是借助 N4A 擴展通用計算能力,Axion 都為現代 AI 基礎設施提供了一個一致、基于 Arm 計算平臺的堅實基礎。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 處理器
    +關注

    關注

    68

    文章

    20345

    瀏覽量

    255384
  • ARM
    ARM
    +關注

    關注

    135

    文章

    9598

    瀏覽量

    393887
  • Google
    +關注

    關注

    5

    文章

    1817

    瀏覽量

    60658

原文標題:Arm 攜手 Google Cloud,依托 Axion 處理器重新定義代理式 AI 基礎設施

文章出處:【微信號:Arm社區(qū),微信公眾號:Arm社區(qū)】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    Arm計算平臺持續(xù)演進賦能AI邁入全新發(fā)展階段

    人工智能 (AI) 正邁入全新發(fā)展階段,從技術探索試驗轉向規(guī)模化地持續(xù)部署具備推理、規(guī)劃和執(zhí)行能力的系統(tǒng)。代理式 AI 系統(tǒng)的興起正在加速計算領域的這一變革,進一步提升
    的頭像 發(fā)表于 05-06 10:03 ?301次閱讀
    <b class='flag-5'>Arm</b>計算平臺持續(xù)演進賦能<b class='flag-5'>AI</b>邁入全新發(fā)展階段

    Infosys攜手OpenAI開啟企業(yè)AI轉型新紀元:技術融合驅動商業(yè)價值規(guī)?;?/b>釋放

    ;的雙輪驅動時代。雙方將通過OpenAI前沿AI模型與Infosys Topaz Fabric代理式AI套件的深度整合,幫助全球企業(yè)跨越AI實驗階段,實現從技術驗證到
    的頭像 發(fā)表于 05-06 09:55 ?465次閱讀

    NVIDIA與Google Cloud攜手推進代理式與物理AI發(fā)展

    NVIDIA Blackwell GPU 以及由 NVIDIA Nemotron 和 NeMo 提供支持、基于 Gemini Enterprise Agent Platform 的代理式 AI 來構建 AI 工廠。
    的頭像 發(fā)表于 04-27 15:35 ?435次閱讀

    NetApp與Google Cloud深化合作:重構分布式云數據基礎設施的“安全主權”新范式

    NetApp與Google Cloud簽署四年期企業(yè)級協(xié)議,通過NetApp存儲解決方案與Google Distributed Cloud(GDC)的深度集成,為全球企業(yè)構建“全棧物理
    的頭像 發(fā)表于 04-27 11:04 ?958次閱讀

    Cadence 與 Google 合作,利用 ChipStack AI Super Agent 在 Google Cloud 上擴展 AI 驅動的芯片設計

    合作,利用 Google Cloud 上的 Gemini 模型優(yōu)化 Cadence? ChipStack? AI Super Agent。此次合作使 Cadence 站在向代理式設計自
    的頭像 發(fā)表于 04-24 13:22 ?162次閱讀

    Cadence與Google合作,利用ChipStack AI Super Agent在Google Cloud上擴展AI驅動的芯片設計

    Cadence ChipStack AI Super Agent 集成 Google Gemini 模型,加速新一代代理驅動型設計自動 中國上海,2026 年 4 月 24 日 ——
    的頭像 發(fā)表于 04-24 10:36 ?1404次閱讀

    Arm AGI CPU加速新一代基礎設施建設

    近期,Arm 推出 Arm AGI CPU,一款由 Arm 自主設計、面向人工智能 (AI) 數據中心的 CPU,旨在滿足日益增長的代理式
    的頭像 發(fā)表于 04-09 15:55 ?373次閱讀

    精彩演講·不容錯過 | 智能規(guī)?;?/b>:平臺驅動,賦能半導體全生態(tài)AI分析規(guī)?;?/b>落地

    精彩演講不容錯過演講信息論壇:設計創(chuàng)新論壇:AI智能應用和汽車芯片時間:2026年3月26日1645地點:上海浦東嘉里大酒店,三樓,上海廳3演講主題:智能規(guī)?;?/b>:平臺驅動,賦能半導體全生態(tài)AI分析
    的頭像 發(fā)表于 03-26 13:03 ?417次閱讀
    精彩演講·不容錯過 | 智能<b class='flag-5'>規(guī)?;?/b>:平臺驅動,賦能半導體全生態(tài)<b class='flag-5'>AI</b>分析<b class='flag-5'>規(guī)?;?/b><b class='flag-5'>落地</b>

    泰芯半導體攜手生態(tài)伙伴助力AI硬件產業(yè)規(guī)模化落地

    當前,AI大模型加速滲透硬件產業(yè),AI硬件正從 “單點智能” 邁向 “系統(tǒng)級智能”,大模型已成為硬件產品的基礎能力之一。順應這一行業(yè)發(fā)展趨勢,珠海泰芯半導體有限公司(以下簡稱 “泰芯半導體”)積極攜手生態(tài)伙伴,以核心芯片技術賦能
    的頭像 發(fā)表于 01-05 17:18 ?1446次閱讀

    軟通動力攜手華為昇騰推進AI智能體規(guī)?;?/b>部署

    企業(yè)AI智能體規(guī)模化落地”主題演講,分享了軟通動力在AI智能體領域的前沿實踐與成熟解決方案,獲得行業(yè)高度關注。
    的頭像 發(fā)表于 09-28 17:50 ?1774次閱讀

    vivo攜手Google Cloud推動智能手機邁入AI新時代

    在人們期待更智能、更前瞻手機的時代,vivo 攜手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速創(chuàng)新,推動智能手機邁入智能、無縫、以人為本的
    的頭像 發(fā)表于 09-23 16:54 ?1765次閱讀

    軟通動力如何推動工業(yè)AI規(guī)?;?/b>落地

    近日,在2025世界人工智能大會(WAIC 2025)“AI數算 重構智造產鏈生態(tài)”2025智能趨勢論壇上,軟通動力集團咨詢與數字創(chuàng)新服務線聯席總裁李國亮受邀出席圓桌對話:《智造“最后一公里”》——工業(yè)AI
    的頭像 發(fā)表于 07-30 17:27 ?1269次閱讀

    代理式AIAI智能體在不同行業(yè)中的實際應用

    代理式 AI 的時代已經到來。如今,代理式 AI 已經驅動應用邁向深度場景融合與規(guī)?;?/b>落地。這波
    的頭像 發(fā)表于 07-28 14:28 ?1437次閱讀

    NVIDIA全棧加速代理式AI應用落地

    在近期舉辦的 AWS 中國峰會上,NVIDIA 聚焦于“NVIDIA 全棧加速代理式 AI 應用落地”,深入探討了代理式 AI (Agent
    的頭像 發(fā)表于 07-14 11:41 ?1490次閱讀

    NVIDIA攜手微軟加速代理式AI發(fā)展

    代理式 AI 正在重新定義科學探索,推動各行各業(yè)的研究突破和創(chuàng)新發(fā)展。NVIDIA 和微軟正通過深化合作提供先進的技術,從云到 PC 加速代理式 AI 應用的發(fā)展。
    的頭像 發(fā)表于 05-27 14:03 ?1264次閱讀