chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

從英偉達電話會看Agentic AI推理與FPGA價值

FPGA技術(shù)專欄 ? 來源:FPGA技術(shù)專欄 ? 2026-03-04 17:07 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

2026年2月,英偉達發(fā)布2026財年Q4財報:營收681億美元,同比增長73%,數(shù)據(jù)中心業(yè)務(wù)增長75%——預(yù)期中的超預(yù)期。更值得關(guān)注的,是電話會中反復(fù)出現(xiàn)的幾個關(guān)鍵詞:Agentic AI、推理需求、低延遲。英偉達明確判斷:Agentic AI 已達到實用拐點,算力已經(jīng)具備盈利性,推理延遲成為 AI 基礎(chǔ)設(shè)施的競爭焦點。

Agentic AI 改變了什么?

Agentic AI 的概念并不新鮮——讓 AI 像人類一樣自主規(guī)劃、調(diào)用工具、完成任務(wù),業(yè)界已經(jīng)期待了很多年。但期待是一回事,愿意付費是另一回事。企業(yè)一直有一個疑問:它到底能做到什么程度?有沒有用戶愿意付費?值不值得我花錢?

英偉達(黃仁勛)認(rèn)為 Agentic AI 已達到實用拐點,并且將年初火熱的可本地化部署 AI 代理工具 OpenClaw 與 Anthropic 的 Claude Cowork 一同作為該拐點到來的市場印證。

技術(shù)上,AI 已經(jīng)可以主動監(jiān)控任務(wù)狀態(tài),自己調(diào)用工具、完成任務(wù),無需人工催促。

業(yè)務(wù)上,付費模式也已經(jīng)跑通,美國 AI 客服獨角獸 Sierra 推行“按效果付費”——AI 成功解決問題才收費,轉(zhuǎn)人工則免費,成立 18 個月估值達 100 億美元。國內(nèi)也一樣,螞蟻數(shù)科、眾數(shù)信科等紛紛試點 RaaS(效果即服務(wù))模式。眾數(shù)信科與客戶在招采場景達成階梯式效果付費——按 AI 處理的案件數(shù)量及準(zhǔn)確率分段計費。IDC 預(yù)測,到 2028 年,70% 的軟件供應(yīng)商將轉(zhuǎn)向按業(yè)務(wù)結(jié)果、交易量或自動化成果計費。

技術(shù)突破和商業(yè)模式的跑通,將進一步加速企業(yè)競爭。

過去,推理延遲可能夠用就行。現(xiàn)在,推理延遲就是用戶體驗,就是用戶留存和訂單轉(zhuǎn)化。畢竟一個智能客服如果反應(yīng)遲緩,用戶可能直接掛斷;一個實時翻譯如果延遲波動,對話就會卡頓;一個自動駕駛決策如果慢了幾毫秒,可能就是事故。

這就引出了英偉達的第二個觀點,推理延遲成為AI基礎(chǔ)設(shè)施的競爭焦點。

Agentic AI 如何改變推理需求?

會議另一細節(jié)也引起了行業(yè)關(guān)注:英偉達收購了Groq。Groq 的核心技術(shù) LPU 最顯著的特點是確定性低延遲——通過靜態(tài)調(diào)度和軟件定義硬件,避免傳統(tǒng)GPU的指令調(diào)度開銷。這恰恰是 GPU 架構(gòu)的先天短板:為了通用性,GPU 必須保留復(fù)雜的調(diào)度邏輯,導(dǎo)致延遲存在波動。

這已經(jīng)不是英偉達第一次引入外部技術(shù)完善生態(tài),彌補延遲短板。早在 2023 年,英偉達就與 Lattice 合作將 FPGA 集成到 Jeston Orin 和 IGX Orin 平臺中。

FPGA 端到端推理延遲可穩(wěn)定在 1ms 以下,關(guān)鍵路徑甚至可達納秒級。對于高頻交易、工業(yè)控制、自動駕駛、電子醫(yī)療等場景,這是不可替代的優(yōu)勢。

(FPGA+GPU 醫(yī)療內(nèi)窺鏡解決方案 Z19-M)

與 LPU 不同,它還更加靈活,因為它能編程、可定制。如今算法迭代速度非常快,F(xiàn)PGA 可隨時重新配置硬件邏輯,升級算法,還能實現(xiàn)同一片 FPGA 驗證不同功能。

FPGA 的另一優(yōu)勢是低功耗,它能針對特定模型定制數(shù)據(jù)通路,消除冗余計算。同性能下,功耗可降至 GPU 的 1/3 到 1/2。在功耗受限的邊緣場景,這往往是能不能部署的決定性因素。同時,低功耗意味著更高的能效比,在規(guī)?;男袠I(yè)客戶面前,能效比的差異會被放大成真金白銀的競爭力。

總結(jié)

英偉達電話會釋放的信號是明確的,Agentic AI 正在引爆推理需求,算力投資將持續(xù)增長。

但同樣明確的是:推理需求是多樣化的,沒有一種架構(gòu)能通吃所有場景。GPU 在高吞吐場景中無可爭議地占據(jù)主導(dǎo),但低延遲、高能效、可定制的場景,正是 FPGA 的用武之地。

對行業(yè)客戶而言,不是二選一,而是如何組合。異構(gòu)計算——GPU+FPGA 協(xié)同工作,成為越來越多務(wù)實客戶的選擇。

ALINX 作為國內(nèi)領(lǐng)先的 FPGA 開發(fā)板和解決方案商,使命是讓行業(yè)客戶享受 FPGA 的優(yōu)勢,而不必承受 FPGA 的開發(fā)之重。

我們提供:

開箱即用的 FPGA 開發(fā)板:客戶即拿即用,無需從零設(shè)計硬件。

針對行業(yè)的參考設(shè)計:工業(yè)視覺、電子醫(yī)療、自動駕駛、航天通信等典型場景方案。

技術(shù)支持與方案評估:幫助客戶判斷“FPGA是否適合我的場景”,降低試錯成本。

如果您正在評估 AI 推理硬件選型,不確定 FPGA 是否適合您的場景,歡迎聯(lián)系我們。我們可以基于您的具體需求,提供方案評估。

我們愿與您一起,找到性能、延遲、成本的最優(yōu)平衡。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • FPGA
    +關(guān)注

    關(guān)注

    1660

    文章

    22406

    瀏覽量

    636141
  • AI
    AI
    +關(guān)注

    關(guān)注

    91

    文章

    39707

    瀏覽量

    301318
  • 人工智能
    +關(guān)注

    關(guān)注

    1817

    文章

    50091

    瀏覽量

    265236
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    高通挑戰(zhàn)英偉,發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI 推理
    的頭像 發(fā)表于 10-29 10:36 ?3637次閱讀
    高通挑戰(zhàn)<b class='flag-5'>英偉</b><b class='flag-5'>達</b>,發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    高通挑戰(zhàn)英偉!發(fā)布768GB內(nèi)存AI推理芯片,“出征”AI數(shù)據(jù)中心

    億美元的數(shù)據(jù)中心市場中搶占一席之地。 ? 就在10月28日,高通面向數(shù)據(jù)中心連發(fā)兩款AI芯片,AI200 和 AI250 芯片,打造下一代 AI
    的頭像 發(fā)表于 10-29 09:14 ?6450次閱讀
    高通挑戰(zhàn)<b class='flag-5'>英偉</b><b class='flag-5'>達</b>!發(fā)布768GB內(nèi)存<b class='flag-5'>AI</b><b class='flag-5'>推理</b>芯片,“出征”<b class='flag-5'>AI</b>數(shù)據(jù)中心

    堪稱史上最強推理芯片!英偉發(fā)布 Rubin CPX,實現(xiàn)50倍ROI

    電子發(fā)燒友網(wǎng)報道(文/梁浩斌)近日,英偉AI infra峰會上發(fā)布了專為大規(guī)模上下文推理設(shè)計的全新GPU系列Rubin CPX,性能堪稱炸裂! ?
    的頭像 發(fā)表于 09-11 08:25 ?1.1w次閱讀
    堪稱史上最強<b class='flag-5'>推理</b>芯片!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>發(fā)布 Rubin CPX,實現(xiàn)50倍ROI

    AI推理需求井噴!英偉Q1營收大漲,H20禁售難擋增長步伐

    電子發(fā)燒友原創(chuàng) 章鷹 在中美科技企業(yè)爭奪人工智能高地的競爭中,處于第一方陣的美國AI芯片公司英偉公司最新交出了讓市場滿意的答卷。 5月28日,英偉
    的頭像 發(fā)表于 05-31 01:13 ?8213次閱讀
    <b class='flag-5'>AI</b><b class='flag-5'>推理</b>需求井噴!<b class='flag-5'>英偉</b><b class='flag-5'>達</b>Q1營收大漲,H20禁售難擋增長步伐

    邁向吉瓦級AI工廠的能源變革:英偉Rubin平臺電源架構(gòu)解析

    隨著人工智能(AI)模型參數(shù)量突破萬億級別,大語言模型(LLM)的訓(xùn)練向推理、以及更高級的代理型AI(Agentic
    的頭像 發(fā)表于 01-15 17:42 ?767次閱讀
    邁向吉瓦級<b class='flag-5'>AI</b>工廠的能源變革:<b class='flag-5'>英偉</b><b class='flag-5'>達</b>Rubin平臺電源架構(gòu)解析

    恩智浦推出全新eIQ Agentic AI框架

    恩智浦半導(dǎo)體宣布推出全新eIQ Agentic AI框架,進一步鞏固其在安全實時邊緣AI領(lǐng)域的領(lǐng)導(dǎo)地位。該工具支持在邊緣設(shè)備上直接實現(xiàn)自主智能體功能,助力資深與新手設(shè)備開發(fā)人員簡化并加速智能體
    的頭像 發(fā)表于 01-13 11:15 ?1296次閱讀

    英偉重磅出手!AI 推理存儲全面覺醒

    許可合作,將采用Groq的推理技術(shù)。 ? 隨后,Groq公司宣布已與英偉就其推理技術(shù)達成非獨家許可協(xié)議。根據(jù)協(xié)議條款,Groq創(chuàng)始人喬納森·羅斯(Jonathan Ross)、總裁桑
    的頭像 發(fā)表于 12-26 08:44 ?1.1w次閱讀
    <b class='flag-5'>英偉</b><b class='flag-5'>達</b>重磅出手!<b class='flag-5'>AI</b> <b class='flag-5'>推理</b>存儲全面覺醒

    第四次工業(yè)革命AI將實現(xiàn)十億倍增長 | 中國AI芯片與英偉的角色

    內(nèi)容提要:黃仁勛BG2專訪:英偉、OpenAI、算力未來與美國夢AI規(guī)模定律與推理的革命:在傳統(tǒng)的AI規(guī)模定律(預(yù)訓(xùn)練、后訓(xùn)練)之上,引入
    的頭像 發(fā)表于 09-29 07:20 ?1144次閱讀
    第四次工業(yè)革命<b class='flag-5'>AI</b>將實現(xiàn)十億倍增長 | 中國<b class='flag-5'>AI</b>芯片與<b class='flag-5'>英偉</b><b class='flag-5'>達</b>的角色

    【「AI芯片:科技探索與AGI愿景」閱讀體驗】+AI芯片的需求和挑戰(zhàn)

    當(dāng)今社會,AI已經(jīng)發(fā)展很迅速了,但是你了解AI的發(fā)展歷程嗎?本章作者將為我們打開AI的發(fā)展歷程以及需求和挑戰(zhàn)的面紗。 2017年開始生成式AI
    發(fā)表于 09-12 16:07

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    ,以“全流量采集 + AI根因診斷 + 預(yù)測性運維”為核心支柱,推動企業(yè)網(wǎng)絡(luò)運維模式傳統(tǒng)的“被動響應(yīng)”向“主動防御”和“故障自愈”的智能化方向躍遷。 三大核心能力:AI推理引擎重塑網(wǎng)
    發(fā)表于 07-16 15:29

    英偉Cosmos-Reason1 模型深度解讀

    英偉近期發(fā)布的 Cosmos-Reason1 模型在物理常識推理領(lǐng)域引發(fā)廣泛關(guān)注。作為專為物理世界交互設(shè)計的多模態(tài)大語言模型,它通過融合視覺感知與復(fù)雜邏輯推理,重新定義了
    的頭像 發(fā)表于 03-29 23:29 ?2980次閱讀

    IBM攜手英偉AI數(shù)據(jù)平臺推動企業(yè)級AI創(chuàng)新

    近日,IBM(紐約證券交易所:IBM)宣布與英偉(納斯達克股票代碼:NVDA)開展全新合作,雙方將基于英偉 AI 數(shù)據(jù)平臺參考架構(gòu)(re
    發(fā)表于 03-24 19:20 ?508次閱讀

    AI Agent與Agentic AI的區(qū)別

    在人工智能技術(shù)快速演進的浪潮中,AI Agent與Agentic AI的差異認(rèn)知正成為企業(yè)智能化轉(zhuǎn)型的關(guān)鍵分水嶺。盡管二者都承載著自動化與智能化的使命,但其技術(shù)內(nèi)核與應(yīng)用價值存在本質(zhì)區(qū)
    的頭像 發(fā)表于 03-21 14:35 ?2383次閱讀

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代

    英偉GTC25亮點:NVIDIA Blackwell Ultra 開啟 AI 推理新時代
    的頭像 發(fā)表于 03-20 15:35 ?1542次閱讀