美女裸体全无遮挡免费视频,九九综合亚洲色hezyo,印度人粗长硬性视频

電子發(fā)燒友網(wǎng)報(bào)道（文/周凱揚(yáng)）對(duì)于每個(gè)想要自己開(kāi)發(fā)和部署AI模型的應(yīng)用開(kāi)發(fā)者來(lái)說(shuō)，硬件和服務(wù)器支出都是一筆不小的費(fèi)用。就以英偉達(dá)的GPU為例，即便是消費(fèi)級(jí)的GPU，最近也迎來(lái)了一波漲價(jià)潮，更不用爆火的A100/H100等型號(hào)了。

即便是租賃服務(wù)器，基于這些熱門(mén)硬件的服務(wù)器也遠(yuǎn)算不上便宜，因此不少云服務(wù)廠商為了進(jìn)一步拉攏更多AI應(yīng)用開(kāi)發(fā)者，紛紛推出了性?xún)r(jià)比更高的選項(xiàng)。這些選項(xiàng)有的是基于CPU的AI計(jì)算服務(wù)器，有的是基于第三方AI加速器打造的服務(wù)器，還有的則是由云服務(wù)廠商基于自研加速器打造且獨(dú)家提供的服務(wù)器。

谷歌高性?xún)r(jià)比TPU面世

谷歌在今年8月底發(fā)布了第五代的自研TPU，TPU v5e。谷歌稱(chēng)該加速器實(shí)現(xiàn)了性能與成本效益的平衡。相比上一代TPU v4，TPU V5e提供了同成本下兩倍的訓(xùn)練性能，以及針對(duì)LLM和生成式AI模型2.5倍的推理性能。

TPU v5e架構(gòu)

單個(gè)TPU v5e Pod由256個(gè)芯片互聯(lián)，總帶寬超過(guò)400Tb/s，INT8總算力達(dá)100petaOps。而且谷歌為T(mén)PU v5e采用了更靈活的配置選項(xiàng)，其支持8個(gè)不同的虛擬機(jī)配置，單個(gè)切片支持單芯片到250多個(gè)芯片，如此一來(lái)客戶(hù)就可以根據(jù)自己的模型大小來(lái)選擇合適的配置。

而且過(guò)去借助谷歌TPU進(jìn)行的訓(xùn)練負(fù)載只局限于單個(gè)切片中，谷歌為此開(kāi)發(fā)了Multislice技術(shù)，可通過(guò)芯片間互聯(lián)以及數(shù)據(jù)中心網(wǎng)絡(luò)中的多個(gè)TPU Pod相連，從而將訓(xùn)練工作擴(kuò)展到數(shù)萬(wàn)個(gè)芯片上。

為了進(jìn)一步擴(kuò)大對(duì)開(kāi)發(fā)生態(tài)的支持，TPU v5e還內(nèi)置了對(duì)JAX、Pytorch和Tensorflow等領(lǐng)先AI框架，以及 Hugging Face 的 Transformers 和 Accelerate、PyTorch Lightning 和 Ray等一系列常用開(kāi)源工具的支持。

開(kāi)放使用與自用

近日，谷歌終于宣布TPU v5e進(jìn)入公用階段，且在最新的MLPerf訓(xùn)練3.1測(cè)試中，TPUv5e獲得了更好的表現(xiàn)。在該測(cè)試中，谷歌改進(jìn)了創(chuàng)新的混合精度訓(xùn)練算法，除了原生支持的BF16外，還用到了INT8精度格式。這意味著客戶(hù)在提高了模型準(zhǔn)確性的同時(shí)，將花費(fèi)更少的成本。

從谷歌云對(duì)于TPU v5e的定價(jià)表來(lái)看，v5e在成本效益上確實(shí)有著極大的優(yōu)勢(shì)。不過(guò)需要注意的是，v5e與v2、v3 Pod類(lèi)似，每個(gè)芯片中只有一個(gè)TensorCore，而v4 Pod的每個(gè)芯片中有兩個(gè)TensorCore。這也是為何v5e的單芯片峰值算力為197TFLOPS，而v4的單芯片峰值算力為275TFLOPS，可即便如此，在按芯片小時(shí)的定價(jià)下，其所需成本依然低于v4。

在如此高的性?xún)r(jià)比下，谷歌不僅將TPU提供給外部開(kāi)發(fā)者使用，其內(nèi)部一些開(kāi)發(fā)項(xiàng)目也開(kāi)始用上TPU v5e。比如其PaLM模型的創(chuàng)建，就用到了上文提到的Multislice技術(shù)，谷歌的Bard團(tuán)隊(duì)同樣在用TPU v5e訓(xùn)練這一生成式AI聊天機(jī)器人。

寫(xiě)在最后

其實(shí)在TPUv5e開(kāi)放使用之前，谷歌也正式開(kāi)放了A3 VM這類(lèi)GPU加速虛擬機(jī)的使用。這也是多數(shù)云服務(wù)廠商采用的多方案供應(yīng)策略，其自研加速器只需要為客戶(hù)提供一個(gè)高性?xún)r(jià)比的方案，而追求更高性能的客戶(hù)，依然可以選擇基于H100 GPU打造的服務(wù)器。

聲明：本文內(nèi)容及配圖由入駐作者撰寫(xiě)或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴