chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

Google Cloud 推出 TPU v5p 和 AI Hypercomputer: 支持下一代 AI 工作負載

谷歌開發(fā)者 ? 來源:未知 ? 2023-12-13 16:05 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

以下文章來源于谷歌云服務,作者 Google Cloud

Amin Vahdat

ML、系統(tǒng)與 Cloud AI 副總裁/總經(jīng)理

Mark Lohmeyer

計算與 ML 基礎設施副總裁/總經(jīng)理

生成式 AI 模型正在迅速發(fā)展,提供了前所未有的精密性和功能。這項技術進展得以讓各行各業(yè)的企業(yè)和開發(fā)人員能夠解決復雜的問題,開啟新的機遇之門。然而,生成式 AI 模型的增長也導致訓練、調(diào)整和推理方面的要求變得更加嚴苛。過去五年來,生成式 AI 模型的參數(shù)每年增長十倍,如今的大模型具有數(shù)千億甚至上萬億項參數(shù),即使在最專業(yè)的系統(tǒng)上仍需要相當長的訓練時間,有時需持續(xù)數(shù)月才能完成。此外,高效的 AI 工作負載管理需要一個具備一致性能、優(yōu)化的計算、存儲、網(wǎng)絡、軟件和開發(fā)框架所組成的集成 AI 堆棧。

為了應對這些挑戰(zhàn),我們很高興宣布推出 Cloud TPU v5p,這是 Google 迄今為止功能、可擴展性、靈活性最為強大的 AI 加速器。長期以來,TPU 一直是訓練和服務 AI 支持的產(chǎn)品的基礎,例如 YouTube、Gmail、Google 地圖、Google Play 和 Android。事實上,Google 剛剛發(fā)布的功能最強大的通用 AI 模型 Gemini 就是使用 TPU 進行訓練和服務的。

此外,我們也宣布推出 Google Cloud AI Hypercomputer,這是一種突破性的超級計算機架構(gòu)采用集成系統(tǒng),并結(jié)合了性能優(yōu)化的硬件、開放軟件、領先的 ML 框架和靈活的消費模式。傳統(tǒng)方法通常是以零碎的組件級增強來解決要求嚴苛的 AI 工作負載,這可能會導致效率不佳和性能瓶頸。相比之下,AI Hypercomputer 采用系統(tǒng)級協(xié)同設計來提高 AI 訓練、調(diào)整和服務的效率和生產(chǎn)力。

01

探索 Cloud TPU v5p

Google Cloud 目前功能最強大

可擴展能力最佳的 TPU 加速器

上個月,我們宣布全面推出 Cloud TPU v5e。相較于上一代 TPU v41,TPU v5e 的性價比提高了 2.3 倍,是我們目前最具成本效益的 TPU。而 Cloud TPU v5p 則是我們目前功能最強大的 TPU。每個 TPU v5p pod 由 8,960 個芯片組成,采用了我們帶寬最高的芯片間互連 (Inter-chip Interconnect, ICI) 技術,以 3D 環(huán)形拓撲結(jié)構(gòu)實現(xiàn)每芯片 4,800 Gbps 的速率。與 TPU v4 相比,TPU v5p 的每秒浮點運算次數(shù) (FLOPS) 提高 2 倍以上,高帶寬內(nèi)存 (High-bandwidth Memory, HBM) 則增加 3 倍。

TPU v5p 專為性能、靈活性和可擴展性設計,相較于上一代 TPU v4,TPU v5p 訓練大型 LLM 的速度提升 2.8 倍。此外,若搭配第二代 SparseCores,TPU v5p 訓練嵌入密集模型的速度比 TPU v42 快 1.9 倍。

wKgZomV5ZtqAVxvIAADPSGWcyh0300.png

資料來源: Google 內(nèi)部數(shù)據(jù)。截至 2023 年 11 月,GPT-3 1750 億參數(shù)模型的所有數(shù)據(jù)均按每芯片 seq-len=2048 為單位完成標準化。

wKgZomV5ZtqAROtEAAEFUtrHUCw937.png

資料來源: TPU v5e 數(shù)據(jù)來自 MLPerf 3.1 Training Closed 的 v5e 結(jié)果;TPU v5p 和 v4 基于 Google 內(nèi)部訓練運行。截至 2023 年 11 月,GPT-3 1750 億參數(shù)模型的所有數(shù)據(jù)均按每芯片 seq-len=2048 為單位完成標準化。并以 TPU v4:3.22 美元/芯片/小時、TPU v5e:1.2 美元/芯片/小時和 TPU v5p:4.2 美元/芯片/小時的公開定價顯示每美元相對性能。

TPU v5p 不僅性能更佳,就每 Pod 的總可用 FLOPS 而言,TPU v5p 的可擴展能力比 TPU v4 高 4 倍,且 TPU v5p 的每秒浮點運算次數(shù) (FLOPS) 是 TPU v4 的兩倍,并在單一 Pod 中提供兩倍的芯片,可大幅提升訓練速度相關性能。

wKgZomV5ZtuAGEBhAARxTP6GyC0815.png

02

Google AI Hypercomputer

大規(guī)模提供頂尖性能和效率

實現(xiàn)規(guī)模和速度是必不可少的,但并不足以滿足現(xiàn)代 AI/ML 應用程序和服務的需求。軟硬組件必須組合相輔相成,組成一個易于使用、安全可靠的集成計算系統(tǒng)。Google 已針對此問題投入數(shù)十年的時間進行研發(fā),而 AI Hypercomputer 正是我們的心血結(jié)晶。此系統(tǒng)集結(jié)了多種能協(xié)調(diào)運作的技術,能以最佳方式來執(zhí)行現(xiàn)代 AI 工作負載。

wKgZomV5ZtuAZX9NAAIoSxnb8Jg775.png ? ? ?

性能優(yōu)化硬件: AI Hypercomputer 以超大規(guī)模數(shù)據(jù)中心基礎設施為基礎構(gòu)建,采用高密度足跡、水冷技術和我們的 Jupiter 數(shù)據(jù)中心網(wǎng)絡技術,在計算、存儲和網(wǎng)絡功能上均能提供最佳性能。所有這一切都基于以效率為核心的各項技術,利用清潔能源和對水資源管理的堅定承諾,助力我們邁向無碳未來。

開放軟件: AI Hypercomputer 使開發(fā)人員能夠通過使用開放軟件來訪問我們性能優(yōu)化的硬件,利用這些硬件調(diào)整、管理和動態(tài)編排 AI 訓練和推理工作負載。

  • 廣泛支持主流 ML 框架 (例如 JAX、TensorFlow 和 PyTorch) 且提供開箱即用。如要構(gòu)建復雜的 LLM,JAX 和 PyTorch 均由 OpenXLA 編譯器提供支持。XLA 作為基礎設施,支持創(chuàng)建復雜的多層模型。XLA 優(yōu)化了各種硬件平臺上的分布式架構(gòu),確保針對不同的 AI 場景高效開發(fā)易于使用的模型。

  • 提供開放且獨特的 Multislice Training 及 Multihost Inferencing 軟件,分別使擴展、訓練和提供模型的工作負載變得流暢又簡單。若要處理要求嚴苛的 AI 工作負載,開發(fā)人員可將芯片數(shù)量擴展至數(shù)萬個。

  • 與 Google Kubernetes Engine (GKE) 和 Google Compute Engine 深度集成,實現(xiàn)高效的資源管理、一致的操作環(huán)境、自動擴展、自動配置節(jié)點池、自動檢查點、自動恢復和及時的故障恢復。

靈活的消費模式: AI Hypercomputer 提供多種靈活動態(tài)的消費方案。除了承諾使用折扣 (Committed Used Discunts, CUD)、按需定價和現(xiàn)貨定價等經(jīng)典選項外,AI Hypercomputer 還通過 Dynamic Workload Scheduler 提供針對 AI 工作負載量身定制的消費模式。Dynamic Workload Scheduler 包含兩種消費模式: Flex Start 模式可實現(xiàn)更高的資源獲取能力和優(yōu)化的經(jīng)濟效益;Calendar 模式則針對作業(yè)啟動時間可預測性更高的工作負載。

03

利用 Google 的豐富經(jīng)驗

助力 AI 的未來發(fā)展

Salesforce 和 Lightricks 等客戶已在使用 Google Cloud 的 TPU v5p 以及 AI Hypercomputer 來訓練和服務大型 AI 模型——并發(fā)現(xiàn)了其中的差異:

G

C

"我們一直在使用 Google Cloud 的 TPU v5p 對 Salesforce 的基礎模型進行預訓練,這些模型將作為專業(yè)生產(chǎn)用例的核心引擎,我們看到訓練速度獲得了顯著提升。事實上,Cloud TPU v5p 的計算性能比上一代 TPU v4 高出至少 2 倍。我們還非常喜歡使用 JAX 順暢地從 Cloud TPU v4 過渡到 v5p。我們期待能通過 Accurate Quantized Training (AQT) 庫,運用 INT8 精度格式的原生支持來優(yōu)化我們的模型,進一步提升速度。"

——Salesforce 高級研究科學家

Erik Nijkamp

G

C

"憑借 Google Cloud TPU v5p 的卓越性能和充足內(nèi)存,我們成功地訓練了文本到視頻的生成模型,而無需將其拆分成單獨進程。這種出色的硬件利用率大大縮短了每個訓練周期,使我們能夠迅速開展一系列實驗。能在每次實驗中快速完成模型訓練的能力加快了迭代速度,為我們的研究團隊在生成式 AI 這個競爭激烈的領域帶來寶貴優(yōu)勢。"

——Lightricks 核心生成式 AI 研究團隊主管

Yoav HaCohen 博士

G

C

"在早期使用過程中,Google DeepMind 和 Google Research 團隊發(fā)現(xiàn),對于 LLM 訓練工作負載,TPU v5p 芯片的性能比 TPU v4 代提高了 2 倍。此外,AI Hypercomputer 能為 ML 框架 (JAX、PyTorch、TensorFlow) 提供強大的支持和自動編排工具,使我們能夠在 v5p 上更高效地擴展。搭配第二代 SparseCores,我們也發(fā)現(xiàn)嵌入密集型工作負載 (embeddings-heavy workloads) 的性能得到顯著提高。TPU 對于我們在 Gemini 等前沿模型上開展最大規(guī)模的研究和工程工作至關重要。"

—— Google DeepMind 和 Google Research

首席科學家 Jeff Dean

在 Google,我們一直堅信 AI 能夠幫助解決棘手問題。截至目前,大規(guī)模訓練與提供大型基礎模型對于許多企業(yè)來說都過于復雜且昂貴?,F(xiàn)在,通過 Cloud TPU v5p 和 AI Hypercomputer,我們很高興能將我們在 AI 和系統(tǒng)設計領域數(shù)十年的研究成果與我們的用戶分享,以便他們能夠更快、更高效、更具成本效益地運用 AI 加速創(chuàng)新。

wKgZomV5ZtuAX_DrAAAjqZVF__E690.gif ?

1: MLPerf v3.1 Training Closed 的結(jié)果多個基準如圖所示。資料日期:2023 年 11 月 8 日。資料來源:mlcommons.org。結(jié)果編號:3.1-2004。每美元性能并非 MLPerf 的評估標準。TPU v4 結(jié)果尚未經(jīng) MLCommons 協(xié)會驗證。MLPerf 名稱和標志是 MLCommons 協(xié)會在美國和其他國家的商標,并保留所有權利,嚴禁未經(jīng)授權的使用。更多信息,請參閱 www.mlcommons.org。

2: 截至 2023 年 11 月,Google TPU v5p 內(nèi)部資料:E2E 執(zhí)行時間 (steptime)、搜索廣告預估點擊率 (SearchAds pCTR)、每個 TPU 核心批次大小為 16,384、125 個 vp5 芯片。


wKgZomV5ZtuAYQ9-AAAafJIrrMk456.gif?點擊屏末||即刻查看詳細內(nèi)容

wKgZomV5ZtuAQLghAAATN9B0Fw0289.png

wKgZomV5ZtyAKESmAAMyGF3oQT4132.png

wKgZomV5ZtyAPigfAAAptPJQ2wE843.png


原文標題:Google Cloud 推出 TPU v5p 和 AI Hypercomputer: 支持下一代 AI 工作負載

文章出處:【微信公眾號:谷歌開發(fā)者】歡迎添加關注!文章轉(zhuǎn)載請注明出處。


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6245

    瀏覽量

    110266

原文標題:Google Cloud 推出 TPU v5p 和 AI Hypercomputer: 支持下一代 AI 工作負載

文章出處:【微信號:Google_Developers,微信公眾號:谷歌開發(fā)者】歡迎添加關注!文章轉(zhuǎn)載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    AI眼鏡或成為下一代手機?谷歌、蘋果等巨頭扎堆布局

    近年來,AI智能眼鏡賽道迎來爆發(fā)式增長。谷歌、蘋果、Meta、亞馬遜等科技巨頭紛紛加快布局,將AI眼鏡視為下一代人機交互的關鍵入口。從消費級產(chǎn)品到行業(yè)專用設備,多樣化的AI眼鏡正逐步走
    的頭像 發(fā)表于 11-05 17:44 ?478次閱讀

    安森美SiC器件賦能下一代AI數(shù)據(jù)中心變革

    電源解決方案。特別是近期,安森美攜手英偉達,共推下一代AI數(shù)據(jù)中心加速向800V直流供電方案轉(zhuǎn)型,這種技術能力的廣度和深度使安森美成為少數(shù)能以可擴展、可實際落地的設計滿足現(xiàn)代AI基礎設
    的頭像 發(fā)表于 10-31 13:47 ?391次閱讀

    Microchip推出下一代Switchtec Gen 6 PCIe交換芯片

    隨著人工智能(AI工作負載和高性能計算(HPC)應用對數(shù)據(jù)傳輸速度與低延遲的需求持續(xù)激增,Microchip Technology Inc.(微芯科技公司)宣布推出下一代Switch
    的頭像 發(fā)表于 10-18 11:12 ?1137次閱讀

    vivo攜手Google Cloud推動智能手機邁入AI新時代

    在人們期待更智能、更前瞻手機的時代,vivo 攜手 Google Cloud,迅速推出更安全、更前沿的 AI 功能,共同加速創(chuàng)新,推動智能手機邁入智能、無縫、以人為本的
    的頭像 發(fā)表于 09-23 16:54 ?1035次閱讀

    AI芯片:科技探索與AGI愿景》—— 深入硬件核心的AGI指南

    AI芯片:科技探索與AGI愿景》書如同張詳盡的“藏寶圖”,為讀者指明了通往下一代人工智能的硬件之路。作者沒有停留在空洞的概念層面,而是直擊核心,從馮·諾依曼架構(gòu)的“內(nèi)存墻”瓶頸切
    發(fā)表于 09-17 09:29

    傳音攜手Google Cloud打造下一代AI智能生態(tài)

    近日,在備受矚目的谷歌開發(fā)者大會上,傳音TEX AI總經(jīng)理史團委受邀發(fā)表主題演講,深入分享了傳音和谷歌在多場景AI模型和應用上的深度合作,以及公司在AI手機領域的持續(xù)探索和階段性成果。
    的頭像 發(fā)表于 09-02 10:47 ?840次閱讀

    是德科技與Heavy Reading合作發(fā)布2025年AI集群網(wǎng)絡報告

    是德科技(NYSE: KEYS )日前宣布其與Heavy Reading合作發(fā)布了《超越瓶頸:2025年AI集群網(wǎng)絡報告》。報告指出,人工智能(AI)的采用速度正不斷加快,基礎設施已難以跟上其發(fā)展步伐。這項全球研究強調(diào),電信和云服務提供商亟需從“擴張”轉(zhuǎn)向“優(yōu)化”,以
    的頭像 發(fā)表于 08-28 15:43 ?582次閱讀

    安森美攜手英偉達推動下一代AI數(shù)據(jù)中心發(fā)展

    安森美(onsemi,美國納斯達克股票代號:ON)宣布與英偉達(NVIDIA)合作,共同推動向800V直流(VDC)供電架構(gòu)轉(zhuǎn)型。這變革性解決方案將推動下一代人工智能(AI)數(shù)據(jù)中心
    的頭像 發(fā)表于 08-06 17:27 ?1169次閱讀

    NVIDIA 采用納微半導體開發(fā)新一代數(shù)據(jù)中心電源架構(gòu) 800V HVDC 方案,賦能下一代AI兆瓦級算力需求

    800V HVDC電源架構(gòu)開發(fā),旗下GaNFast?氮化鎵和GeneSiC?碳化硅技術將為Kyber機架級系統(tǒng)內(nèi)的Rubin Ultra等GPU提供電力支持。 ? NVIDIA推出下一代
    發(fā)表于 05-23 14:59 ?2592次閱讀
    NVIDIA 采用納微半導體開發(fā)新<b class='flag-5'>一代</b>數(shù)據(jù)中心電源架構(gòu) 800<b class='flag-5'>V</b> HVDC 方案,賦能<b class='flag-5'>下一代</b><b class='flag-5'>AI</b>兆瓦級算力需求

    光庭信息推出下一代整車操作系統(tǒng)A2OS

    ,正式推出面向中央計算架構(gòu)、支持人機協(xié)同開發(fā)的下一代整車操作系統(tǒng)A2OS(AI × Automotive OS),賦能下一代域控軟件解決方案
    的頭像 發(fā)表于 04-29 17:37 ?1118次閱讀
    光庭信息<b class='flag-5'>推出下一代</b>整車操作系統(tǒng)A2OS

    Google推出第七TPU芯片Ironwood

    Google Cloud Next 25 大會上,我們隆重推出第 7 Tensor Processing Unit (TPU) —
    的頭像 發(fā)表于 04-16 11:20 ?1336次閱讀
    <b class='flag-5'>Google</b><b class='flag-5'>推出</b>第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b>芯片Ironwood

    谷歌第七TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七張量處理單元 (
    的頭像 發(fā)表于 04-12 11:10 ?2921次閱讀
    谷歌第七<b class='flag-5'>代</b><b class='flag-5'>TPU</b> Ironwood深度解讀:<b class='flag-5'>AI</b>推理時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    電子發(fā)燒友網(wǎng)報道(文 / 李彎彎)日前,谷歌在 Cloud Next 大會上,隆重推出了最新一代 TPU AI 加速芯片 ——Ironwoo
    的頭像 發(fā)表于 04-12 00:57 ?3226次閱讀

    NetApp與Google Cloud合作,簡化云端高性能工作負載的擴展

    降低了云端存儲工作負載的復雜性并提升了其性能,同時還能完全集成到Google Cloud服務生態(tài)系統(tǒng)中??蛻魧⒛軌蜉p松擴展高性能的企業(yè)應用程序和數(shù)據(jù)庫,包括擁有PB級數(shù)據(jù)集的
    的頭像 發(fā)表于 04-10 16:48 ?484次閱讀

    Arm技術助力Google Axion處理器加速AI工作負載推理

    由 Arm Neoverse V2 平臺賦能的 Google Axion 處理器已在 Google Cloud 上正式上線,其中,C4A 是首款基于 Axion 的云虛擬機,為基于 C
    的頭像 發(fā)表于 02-14 14:11 ?959次閱讀
    Arm技術助力<b class='flag-5'>Google</b> Axion處理器加速<b class='flag-5'>AI</b><b class='flag-5'>工作</b><b class='flag-5'>負載</b>推理