chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫(xiě)文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

欲把AI計(jì)算成本打下來(lái),谷歌高效益TPU正式開(kāi)放

E4Life ? 來(lái)源:電子發(fā)燒友網(wǎng) ? 作者:周凱揚(yáng) ? 2023-11-14 00:18 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

電子發(fā)燒友網(wǎng)報(bào)道(文/周凱揚(yáng))對(duì)于每個(gè)想要自己開(kāi)發(fā)和部署AI模型的應(yīng)用開(kāi)發(fā)者來(lái)說(shuō),硬件和服務(wù)器支出都是一筆不小的費(fèi)用。就以英偉達(dá)GPU為例,即便是消費(fèi)級(jí)的GPU,最近也迎來(lái)了一波漲價(jià)潮,更不用爆火的A100/H100等型號(hào)了。

即便是租賃服務(wù)器,基于這些熱門(mén)硬件的服務(wù)器也遠(yuǎn)算不上便宜,因此不少云服務(wù)廠商為了進(jìn)一步拉攏更多AI應(yīng)用開(kāi)發(fā)者,紛紛推出了性?xún)r(jià)比更高的選項(xiàng)。這些選項(xiàng)有的是基于CPU的AI計(jì)算服務(wù)器,有的是基于第三方AI加速器打造的服務(wù)器,還有的則是由云服務(wù)廠商基于自研加速器打造且獨(dú)家提供的服務(wù)器。

谷歌高性?xún)r(jià)比TPU面世

谷歌在今年8月底發(fā)布了第五代的自研TPU,TPU v5e。谷歌稱(chēng)該加速器實(shí)現(xiàn)了性能與成本效益的平衡。相比上一代TPU v4,TPU V5e提供了同成本下兩倍的訓(xùn)練性能,以及針對(duì)LLM和生成式AI模型2.5倍的推理性能。

wKgaomVR-HqAJvSzAABXKc7C2hk445.png
TPU v5e架構(gòu)


單個(gè)TPU v5e Pod由256個(gè)芯片互聯(lián),總帶寬超過(guò)400Tb/s,INT8總算力達(dá)100petaOps。而且谷歌為T(mén)PU v5e采用了更靈活的配置選項(xiàng),其支持8個(gè)不同的虛擬機(jī)配置,單個(gè)切片支持單芯片到250多個(gè)芯片,如此一來(lái)客戶(hù)就可以根據(jù)自己的模型大小來(lái)選擇合適的配置。

而且過(guò)去借助谷歌TPU進(jìn)行的訓(xùn)練負(fù)載只局限于單個(gè)切片中,谷歌為此開(kāi)發(fā)了Multislice技術(shù),可通過(guò)芯片間互聯(lián)以及數(shù)據(jù)中心網(wǎng)絡(luò)中的多個(gè)TPU Pod相連,從而將訓(xùn)練工作擴(kuò)展到數(shù)萬(wàn)個(gè)芯片上。

為了進(jìn)一步擴(kuò)大對(duì)開(kāi)發(fā)生態(tài)的支持,TPU v5e還內(nèi)置了對(duì)JAX、Pytorch和Tensorflow等領(lǐng)先AI框架,以及 Hugging Face 的 TransformersAccelerate、PyTorch Lightning 和 Ray等一系列常用開(kāi)源工具的支持。

開(kāi)放使用與自用

近日,谷歌終于宣布TPU v5e進(jìn)入公用階段,且在最新的MLPerf訓(xùn)練3.1測(cè)試中,TPUv5e獲得了更好的表現(xiàn)。在該測(cè)試中,谷歌改進(jìn)了創(chuàng)新的混合精度訓(xùn)練算法,除了原生支持的BF16外,還用到了INT8精度格式。這意味著客戶(hù)在提高了模型準(zhǔn)確性的同時(shí),將花費(fèi)更少的成本。

wKgZomVR-IOANSMPAAIyMIzn61I221.png
從谷歌云對(duì)于TPU v5e的定價(jià)表來(lái)看,v5e在成本效益上確實(shí)有著極大的優(yōu)勢(shì)。不過(guò)需要注意的是,v5e與v2、v3 Pod類(lèi)似,每個(gè)芯片中只有一個(gè)TensorCore,而v4 Pod的每個(gè)芯片中有兩個(gè)TensorCore。這也是為何v5e的單芯片峰值算力為197TFLOPS,而v4的單芯片峰值算力為275TFLOPS,可即便如此,在按芯片小時(shí)的定價(jià)下,其所需成本依然低于v4。

在如此高的性?xún)r(jià)比下,谷歌不僅將TPU提供給外部開(kāi)發(fā)者使用,其內(nèi)部一些開(kāi)發(fā)項(xiàng)目也開(kāi)始用上TPU v5e。比如其PaLM模型的創(chuàng)建,就用到了上文提到的Multislice技術(shù),谷歌的Bard團(tuán)隊(duì)同樣在用TPU v5e訓(xùn)練這一生成式AI聊天機(jī)器人。

寫(xiě)在最后

其實(shí)在TPUv5e開(kāi)放使用之前,谷歌也正式開(kāi)放了A3 VM這類(lèi)GPU加速虛擬機(jī)的使用。這也是多數(shù)云服務(wù)廠商采用的多方案供應(yīng)策略,其自研加速器只需要為客戶(hù)提供一個(gè)高性?xún)r(jià)比的方案,而追求更高性能的客戶(hù),依然可以選擇基于H100 GPU打造的服務(wù)器。

聲明:本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • AI
    AI
    +關(guān)注

    關(guān)注

    90

    文章

    38225

    瀏覽量

    297115
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    直擊英偉達(dá)腹地?谷歌TPU v7開(kāi)放部署,催生OCS產(chǎn)業(yè)鏈紅利

    Processing Unit, TPU)構(gòu)建了一套完整的AI算力基礎(chǔ)設(shè)施體系。 ? 11月,谷歌宣布第七代 TPU v7(代號(hào) Ironwood)將在后續(xù)幾周大規(guī)模上市。與此消息同
    的頭像 發(fā)表于 11-27 08:53 ?8533次閱讀
    直擊英偉達(dá)腹地?<b class='flag-5'>谷歌</b><b class='flag-5'>TPU</b> v7<b class='flag-5'>開(kāi)放</b>部署,催生OCS產(chǎn)業(yè)鏈紅利

    谷歌云發(fā)布最強(qiáng)自研TPU,性能比前代提升4倍

    電子發(fā)燒友網(wǎng)報(bào)道(文/李彎彎)近日,谷歌云在官方博客上正式宣布,公司成功推出第七代TPU(張量處理器)“Ironwood”,該芯片預(yù)計(jì)在未來(lái)幾周內(nèi)正式上市。 ? “Ironwood”由谷歌自主
    的頭像 發(fā)表于 11-13 07:49 ?8187次閱讀
    <b class='flag-5'>谷歌</b>云發(fā)布最強(qiáng)自研<b class='flag-5'>TPU</b>,性能比前代提升4倍

    【「AI芯片:科技探索與AGI愿景」閱讀體驗(yàn)】+AI芯片到AGI芯片

    計(jì)算成本。 核心: MoE模型利用稀疏性驅(qū)動(dòng)結(jié)構(gòu),通過(guò)包含多個(gè)專(zhuān)家網(wǎng)絡(luò)的稀疏MoE層替換密集層,其中每個(gè)專(zhuān)家致力于特定的訓(xùn)練數(shù)據(jù)或任務(wù)的子集,并且一個(gè)可訓(xùn)練的門(mén)控機(jī)制動(dòng)態(tài)地將輸入標(biāo)記分配給這些專(zhuān)家,從而
    發(fā)表于 09-18 15:31

    電動(dòng)機(jī)噪聲、振動(dòng)和聲振粗糙度開(kāi)發(fā):使用低計(jì)算成本的系統(tǒng)級(jí)模型預(yù)測(cè)早期噪聲、振動(dòng)和聲振粗糙度

    優(yōu)勢(shì)使用計(jì)算成本低的系統(tǒng)級(jí)模型在動(dòng)態(tài)運(yùn)行條件下對(duì)電驅(qū)動(dòng)裝置執(zhí)行早期噪聲、振動(dòng)和聲振粗糙度評(píng)估優(yōu)化電機(jī)控制策略并做出更好的設(shè)計(jì)選擇,以提高電動(dòng)汽車(chē)的噪聲、振動(dòng)和聲振粗糙度使用Simcenter節(jié)省時(shí)間
    的頭像 發(fā)表于 08-13 11:46 ?549次閱讀
    電動(dòng)機(jī)噪聲、振動(dòng)和聲振粗糙度開(kāi)發(fā):使用低<b class='flag-5'>計(jì)算成本</b>的系統(tǒng)級(jí)模型預(yù)測(cè)早期噪聲、振動(dòng)和聲振粗糙度

    AI芯片:加速人工智能計(jì)算的專(zhuān)用硬件引擎

    人工智能(AI)的快速發(fā)展離不開(kāi)高性能計(jì)算硬件的支持,而傳統(tǒng)CPU由于架構(gòu)限制,難以高效處理AI任務(wù)中的大規(guī)模并行計(jì)算需求。因此,專(zhuān)為
    的頭像 發(fā)表于 07-09 15:59 ?954次閱讀

    AlphaEvolve有望革新AI玩具芯片設(shè)計(jì),算法進(jìn)化驅(qū)動(dòng)能效與成本雙突破

    電子發(fā)燒友網(wǎng)綜合報(bào)道,近期,谷歌?DeepMind發(fā)布了一款A(yù)lphaEvolve,是一款通用科學(xué)AI代理,基于大語(yǔ)言模型Gemini系列與進(jìn)化計(jì)算框架,專(zhuān)注于算法發(fā)現(xiàn)與優(yōu)化??梢灾С?jǐn)?shù)百行代碼
    的頭像 發(fā)表于 06-18 00:09 ?3510次閱讀

    智算加速卡是什么東西?它真能在AI戰(zhàn)場(chǎng)上干掉GPU和TPU!

    隨著AI技術(shù)火得一塌糊涂,大家都在談"大模型"、"AI加速"、"智能計(jì)算",可真到了落地環(huán)節(jié),算力才是硬通貨。你有沒(méi)有發(fā)現(xiàn),現(xiàn)在越來(lái)越多的AI企業(yè)不光用GPU,也不怎么迷信
    的頭像 發(fā)表于 06-05 13:39 ?1319次閱讀
    智算加速卡是什么東西?它真能在<b class='flag-5'>AI</b>戰(zhàn)場(chǎng)上干掉GPU和<b class='flag-5'>TPU</b>!

    Deepseek海思SD3403邊緣計(jì)算AI產(chǎn)品系統(tǒng)

    海思SD3403邊緣計(jì)算AI框架,提供了一套開(kāi)放AI訓(xùn)練產(chǎn)品工具包,解決客戶(hù)低成本AI系統(tǒng),針
    發(fā)表于 04-28 11:05

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專(zhuān)門(mén)為深度學(xué)習(xí)應(yīng)用設(shè)計(jì)的硬件加速器。它的開(kāi)發(fā)源于對(duì)人工智能(AI)和機(jī)器學(xué)習(xí)應(yīng)用的需求,尤其是深度學(xué)習(xí)中的神經(jīng)網(wǎng)絡(luò)計(jì)算
    的頭像 發(fā)表于 04-22 09:41 ?3433次閱讀
    <b class='flag-5'>TPU</b>處理器的特性和工作原理

    谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時(shí)代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專(zhuān)為推理而設(shè)計(jì)。這款功能強(qiáng)大的
    的頭像 發(fā)表于 04-12 11:10 ?2965次閱讀
    <b class='flag-5'>谷歌</b>第七代<b class='flag-5'>TPU</b> Ironwood深度解讀:<b class='flag-5'>AI</b>推理時(shí)代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    Cloud 客戶(hù)開(kāi)放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項(xiàng)。 ? 在核心亮點(diǎn)層面,Ironwood 堪稱(chēng)谷歌首款專(zhuān)門(mén)為 AI 推理精心設(shè)計(jì)的 TPU 芯片,
    的頭像 發(fā)表于 04-12 00:57 ?3250次閱讀

    Banana Pi 發(fā)布 BPI-AI2N &amp; BPI-AI2N Carrier,助力 AI 計(jì)算與嵌入式開(kāi)發(fā)

    和 Renesas一直致力于推動(dòng)開(kāi)源生態(tài)的發(fā)展,并積極合作打造高效、開(kāi)放計(jì)算平臺(tái)。BPI-AI2N & BPI-AI2N Car
    發(fā)表于 03-19 17:54

    傳DeepSeek自研芯片,廠商們要把AI成本打下來(lái)

    外購(gòu)芯片的成本,掌握供應(yīng)鏈主動(dòng)權(quán),另一方面隨著AI推理應(yīng)用的爆發(fā),AI推理芯片有機(jī)會(huì)被重新定義。 ? DeepSeek 不完全依賴(lài)英偉達(dá) ? 去年12月底發(fā)布的DeepSeek-V3模型,整個(gè)訓(xùn)練使用2048塊英偉達(dá)H800 G
    的頭像 發(fā)表于 02-16 00:09 ?3902次閱讀
    傳DeepSeek自研芯片,廠商們要把<b class='flag-5'>AI</b><b class='flag-5'>成本</b><b class='flag-5'>打下來(lái)</b>

    谷歌加速AI部門(mén)整合:AI Studio團(tuán)隊(duì)并入DeepMind

    近日,谷歌正緊鑼密鼓地推進(jìn)其人工智能(AI)部門(mén)的整合工作。據(jù)谷歌AI Studio主管Logan Kilpatrick在領(lǐng)英頁(yè)面上的透露,谷歌
    的頭像 發(fā)表于 01-13 14:40 ?1158次閱讀

    AI云端計(jì)算資源的多維度優(yōu)勢(shì)

    AI云端計(jì)算資源,作為AI技術(shù)與云計(jì)算深度融合的產(chǎn)物,在成本效益、性能優(yōu)化、數(shù)據(jù)安全、靈活擴(kuò)展以
    的頭像 發(fā)表于 01-07 11:11 ?862次閱讀