chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

Carol Li ? 來源:電子發(fā)燒友 ? 作者:李彎彎 ? 2025-04-12 00:57 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwood。據(jù)悉,該芯片預(yù)計于今年晚些時候面向 Google Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。


在核心亮點層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設(shè)計的 TPU 芯片,能夠有力支持大規(guī)模思考與推理 AI 模型。谷歌方面表示,它代表著 AI 發(fā)展從 “響應(yīng)式” 向 “主動式” 的范式轉(zhuǎn)變,未來 AI 代理將能夠主動檢索并生成數(shù)據(jù),進(jìn)而提供深度見解,而非僅僅輸出原始數(shù)據(jù)。

在性能與能效表現(xiàn)上,Ironwood 取得了重大突破。其每瓦性能達(dá)到上一代 TPU Trillium 的兩倍,能效近乎首款云 TPU 的 30 倍。單芯片配備 192GB 高帶寬內(nèi)存(HBM),容量為 Trillium 的 6 倍;HBM 帶寬高達(dá) 7.2TB/s,是 Trillium 的 4.5 倍。芯片間互連(ICI)帶寬提升至 1.2TB/s,為 Trillium 的 1.5 倍,這一提升有力地支持了大規(guī)模分布式訓(xùn)練與推理任務(wù)。

此外,Ironwood 還是谷歌首款支持 FP8 浮點格式的 TPU 芯片。在此之前,TPU 僅支持 INT8(用于推理)和 BF16(用于訓(xùn)練)。采用 FP8 計算可使 AI 訓(xùn)練吞吐量翻倍,性能相較于 BF16 提升 10 倍。

Ironwood 還配備了增強版 SparseCore 專用加速器,可用于處理高級排名和推薦任務(wù)中常見的超大嵌入。憑借這一增強版 SparseCore,其能夠加速更多領(lǐng)域的任務(wù),應(yīng)用范圍從傳統(tǒng)的 AI 任務(wù)拓展至金融和科學(xué)等領(lǐng)域。

在系統(tǒng)架構(gòu)與擴展性方面,Ironwood 可擴展至 9216 個液冷芯片,借助突破性的 ICI 網(wǎng)絡(luò)進(jìn)行連接,功率接近 10 兆瓦。它提供 256 芯片和 9216 芯片兩種 Pod 配置,其中 9216 芯片的 Pod 配置整體 AI 算力可達(dá) 42.5 Exaflops。谷歌先進(jìn)的液冷解決方案能夠確保芯片在持續(xù)繁重的 AI 工作負(fù)載下依然保持高性能。

谷歌的 TPU 作為專為機器學(xué)習(xí)設(shè)計的定制化加速芯片,自 2015 年首次亮相以來,已成為 AI 硬件領(lǐng)域的重要力量。TPU 主要應(yīng)用于訓(xùn)練和推理大規(guī)模 AI 模型(如 AlphaGo、PaLM、Gemini 等),并深度融入 Google Cloud 以及谷歌內(nèi)部 AI 服務(wù)之中。

截至目前,TPU 已歷經(jīng)多次版本迭代:TPU v1 支持 INT8 精度,主要用于谷歌內(nèi)部項目(如 AlphaGo、RankBrain);TPU v2/v3 面向訓(xùn)練與推理場景,支持浮點運算,v3 進(jìn)一步增加了內(nèi)存和互連帶寬;TPU v4 的算力達(dá)到 TPU v3 的 2.7 倍,采用液冷技術(shù),支持 4096 芯片互聯(lián)的 Pod 集群,適用于超大規(guī)模模型(如 PaLM)。

由此可見,谷歌 TPU 憑借其專用化設(shè)計、高能效比以及與 TensorFlow 的深度集成等優(yōu)勢,成為大規(guī)模 AI 模型訓(xùn)練與推理的核心硬件支撐。如今,Ironwood 的推出不僅將進(jìn)一步鞏固谷歌在 AI 硬件領(lǐng)域的領(lǐng)先地位,也勢必為生成式 AI 的下一階段發(fā)展提供強大的計算動力。?

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關(guān)注

    關(guān)注

    27

    文章

    6257

    瀏覽量

    111949
  • TPU
    TPU
    +關(guān)注

    關(guān)注

    0

    文章

    171

    瀏覽量

    21716
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    直擊英偉達(dá)腹地?谷歌TPU v7開放部署,催生OCS產(chǎn)業(yè)鏈紅利

    Processing Unit, TPU)構(gòu)建了套完整的AI算力基礎(chǔ)設(shè)施體系。 ? 11月,谷歌宣布第七
    的頭像 發(fā)表于 11-27 08:53 ?9688次閱讀
    直擊英偉達(dá)腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7開放部署,催生OCS產(chǎn)業(yè)鏈紅利

    谷歌新一代TPU,專用于推理

    行業(yè)芯事行業(yè)資訊
    電子發(fā)燒友網(wǎng)官方
    發(fā)布于 :2026年04月21日 11:19:52

    AI推理芯片需求爆發(fā),OpenAI欲尋求新合作伙伴

    領(lǐng)域占據(jù)主導(dǎo),其GPU憑借強大的海量數(shù)據(jù)處理能力,成為全球AI爆炸式增長的重要基石。但隨著AI不斷演進(jìn),重點正從大規(guī)模訓(xùn)練轉(zhuǎn)向?qū)σ延?xùn)練模型推理
    的頭像 發(fā)表于 02-03 17:15 ?3225次閱讀

    晶晨攜手谷歌,助力端側(cè)大模型Gemini的硬件落地

    電子發(fā)燒友網(wǎng)報道 在科技飛速發(fā)展的當(dāng)下,端側(cè)智能技術(shù)正以前所未有的速度滲透到各個領(lǐng)域。1月28日,晶晨股份透露,公司與谷歌有著長達(dá)十余年的深度合作基礎(chǔ)。作為谷歌新一代端側(cè)AI硬件(整合
    的頭像 發(fā)表于 01-29 10:44 ?2374次閱讀

    曦望發(fā)布新一代推理GPU芯片,單位Token推理成本降低90%

    電子發(fā)燒友網(wǎng)報道 1月27日,國產(chǎn)GPU廠商曦望(Sunrise)重磅發(fā)布新一代推理GPU芯片——啟望S3。這是曦望在近年累計完成約30億元戰(zhàn)略融資后的首次集中公開亮相。2025年,
    的頭像 發(fā)表于 01-28 17:38 ?9519次閱讀

    今日看點:消息稱 AMD、高通考慮導(dǎo)入 SOCAMM 內(nèi)存;曦望發(fā)布新一代推理GPU芯片啟望S3

    曦望發(fā)布新一代推理GPU芯片啟望S3 近日,浙江杭州GPU創(chuàng)企曦望(Sunrise)發(fā)布新一代推理GPU
    發(fā)表于 01-28 11:09 ?1306次閱讀

    云巨頭算力戰(zhàn)升級!微軟新一代3nm AI推理芯片性能提升30%,落地數(shù)據(jù)中心

    據(jù)外媒報道,微軟發(fā)布新一代人工智能芯片Maia 200,這款芯片有望成為英偉達(dá)旗艦處理器以及云服務(wù)競爭對手亞馬遜、谷歌同類產(chǎn)品的替代選擇。微軟稱,這款
    的頭像 發(fā)表于 01-27 12:29 ?9896次閱讀
    云巨頭算力戰(zhàn)升級!微軟<b class='flag-5'>新一代</b>3nm <b class='flag-5'>AI</b><b class='flag-5'>推理</b><b class='flag-5'>芯片</b>性能提升30%,落地數(shù)據(jù)中心

    谷歌云發(fā)布最強自研TPU,性能比前代提升4倍

    精心設(shè)計,能夠輕松處理從大型模型訓(xùn)練到實時聊天機器人運行以及AI智能體操作等各類復(fù)雜任務(wù)。 ? 谷歌在新聞稿中著重強調(diào),“Ironwood”是專為應(yīng)對最嚴(yán)苛的工作負(fù)載而打造的。無論是
    的頭像 發(fā)表于 11-13 07:49 ?8924次閱讀
    <b class='flag-5'>谷歌</b>云發(fā)布最強自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    【內(nèi)測活動同步開啟】這么???這么強?新一代模型MCP開發(fā)板來啦!

    【內(nèi)測活動同步開啟】這么?。窟@么強?新一代模型MCP開發(fā)板來啦! 聆思全新一代六合芯片「LS26系列」,搭載WIFI / BLE &a
    發(fā)表于 09-25 11:47

    新一代超大模型訓(xùn)練引擎XTuner V1開源

    9月8日,上海人工智能實驗室(上海AI實驗室)開源書生大模型新一代訓(xùn)練引擎XTuner V1。
    的頭像 發(fā)表于 09-10 10:55 ?1319次閱讀

    大規(guī)模專家并行模型在TensorRT-LLM的設(shè)計

    DeepSeek-V3 / R1 等模型采用大規(guī)模細(xì)粒度混合專家模型 (MoE) 架構(gòu),大幅提升了開源模型的質(zhì)量。Llama 4 和 Qwen3 等新發(fā)布的開源
    的頭像 發(fā)表于 09-06 15:21 ?1411次閱讀
    <b class='flag-5'>大規(guī)模</b>專家并行<b class='flag-5'>模型</b>在TensorRT-LLM的設(shè)計

    積算科技上線赤兔推理引擎服務(wù),創(chuàng)新解鎖FP8大模型算力

    模型輕量化部署方案。用戶通過遠(yuǎn)程算力平臺預(yù)置的模型鏡像與AI工具,僅需50%的GPU算力即可解鎖大模型推理、企業(yè)知識庫搭建、智能體開發(fā),加
    的頭像 發(fā)表于 07-30 21:44 ?1033次閱讀

    信而泰×DeepSeek:AI推理引擎驅(qū)動網(wǎng)絡(luò)智能診斷邁向 “自愈”時代

    DeepSeek-R1:強大的AI推理引擎底座DeepSeek是由杭州深度求索人工智能基礎(chǔ)技術(shù)研究有限公司開發(fā)的新一代AI
    發(fā)表于 07-16 15:29

    谷歌新一代生成式AI媒體模型登陸Vertex AI平臺

    我們在 Vertex AI 上推出新一代生成式 AI 媒體模型: Imagen 4、Veo 3 和 Lyria 2。
    的頭像 發(fā)表于 06-18 09:56 ?1294次閱讀

    廣和通發(fā)布新一代AI語音智能體FiboVista

    近日,2025火山引擎Force原動力大會正式開幕。廣和通發(fā)布新一代AI語音智能體FiboVista,并已率先應(yīng)用于車聯(lián)網(wǎng),成為智能駕駛的“用車伙伴”和“出行伴侶”。通過創(chuàng)新AI
    的頭像 發(fā)表于 06-17 09:22 ?1405次閱讀