chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內不再提示

谷歌TPU3.0的四大亮點

DPVg_AI_era ? 來源:未知 ? 作者:胡薇 ? 2018-05-14 08:43 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Google在I/O大會上發(fā)布了TPU3,雖然目前詳細信息不多,但下面幾點還是值得討論:8倍性能;快速迭代;云服務和Benchmark。TPU3到底哪里厲害?

8倍性能

今天的新聞中我們都可以看到如下描述“Google CEO Sundar Pichai said the new TPU is eight times more powerful than last year per pod, with up to 100 petaflops in performance.”也就是說一個TPU3 pod的總處理能力100 PFLOPS是TPU2 pod的8倍。

從下圖我們可以看一下TPU3 pod和TPU2 pod的對比。

TPU2的一個pod包括4個rack,兩個CPU rack(左右兩邊),兩個TPU rack(中間兩個)。每個rack有32個computing unit (板卡),每個TPU板卡有4顆TPU芯片。因此一個pod總共有64 x 4顆TPU2芯片。每顆TPU2芯片的處理能力是45TFLOPS,因此一個pod總的處理能力是45 x 4 x 64 = 11.5 PFLOPS.

對比來看,TPU3的板卡仍然包括4顆芯片。但目測TPU3 pod的rack數量和板卡的密度(這個看的不是很清楚)和TPU2相比都增加了一倍。因此,一個pod中的TPU3芯片的數量應該是之前4倍。如果pod的總處理能力是TPU2的8倍,那么TPU3單芯片的處理能力則為TPU2的2倍。

根據Google的說法,這次他們第一次在Data center采用水冷的散熱方式,這可能和芯片功耗以及板卡密度增加有關系。

Google also said this is the first time the company has had to include liquidcooling in its data centers, CEO Sundar Pichai said.

總得來說,如上圖所描述(來自Google I/O大會的talk:Effective Machine Learning with Google TPU,可以在YouTube上搜索Google io 18 stage 8觀看),TPU3實現的超過100 PFLOPS的處理能力是來自“新的芯片架構和大規(guī)模系統(tǒng)”。

快速迭代

從去年I/O大會發(fā)布TPU2到今天不過一年時間,Google的芯片迭代速度還是非常驚人的?!盀槭裁碐oogle能夠實現這樣的快速迭代?”這也是一個非常值得探討的話題。

我先簡單談幾點個人看法:

第一,TPU是一個Domain-specific Architecture(參考當我們設計一個專用處理器的時候我們在干什么?(上)),定位準確,架構簡單,容易擴展。相比之下,傳統(tǒng)的通用處理器必須考慮靈活性和兼容性,有太重的包袱。當然,TPU這種特點也決定它只能用于有限的應用場景,可能只有Google的體量以及云服務能夠所提供的應用需求才能充分利用TPU這種專用芯片,這一點是得天獨厚的。這也是目前幾乎所有科技巨頭都開始自研芯片的一個基本考量。而傳統(tǒng)的芯片廠商在這一點上就有些尷尬了。

第二,Google的軟件和系統(tǒng)能力超強,TPU以Cloud service出現,提高給客戶的是整體服務。芯片硬件可做的tradeoff空間比較大,芯片本身的弱點可以在系統(tǒng)層面彌補。從目前得到的信息分析的,TPU3的處理能力是TPU2的8倍,其中芯片換代的貢獻只有2倍,大部分改進在系統(tǒng)層面。另一方面,目前芯片開發(fā)離不開相關軟件工具,Google的軟件能力和生態(tài)也是其能夠實現芯片快速迭代的一個重要因素。

第三,錢很重要。Google不差錢,在芯片實現上可以通過花錢換取時間。

總得來說,Google TPU的意義可能遠遠超過芯片本身。它背后的芯片設計邏輯,實現方法,應用模式和生態(tài)環(huán)境,相較傳統(tǒng)芯片開發(fā)有很大區(qū)別,也許會成為趨勢。

云服務和Benchmark

Google在發(fā)布TPU3的時候同時提到了新的云服務,在之前的Cloud TPU基礎上,今年晚些時候還會發(fā)布Cloud TPU pod(不知道誰能用的起?),可以看出TPU對于Goolge的云端戰(zhàn)略的重要意義。

有意思的是,在Google的talk中強調了cost的問題,每個例子都給出了相應的training cost,畫風是這樣的。

這里頗有廣告的感覺,不禁讓人想起黃教主的”The more GPUs you buy, The more money you save“。結合最近Microsoft對Brainwave項目的宣傳,感覺云端機器學習的價格戰(zhàn)馬上就要開始了。

另外,Google也強調了Benchmark的重要性,還專門展示了他們最近力推的MLPerf。

最近不同平臺之間的對比很多,有比性能的,也有拼成本的。相信隨著越來越多的廠商加入,刷榜應該會非常熱鬧。

聲明:本文內容及配圖由入駐作者撰寫或者入駐合作網站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網立場。文章及其配圖僅供工程師學習之用,如有內容侵權或者其他違規(guī)問題,請聯系本站處理。 舉報投訴
  • 谷歌
    +關注

    關注

    27

    文章

    6241

    瀏覽量

    109987
  • TPU
    TPU
    +關注

    關注

    0

    文章

    160

    瀏覽量

    21473

原文標題:谷歌TPU 3.0到底厲害在哪里?

文章出處:【微信號:AI_era,微信公眾號:新智元】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    和而泰發(fā)布四大自研核心技術平臺

    從智能家電到工業(yè)機器人,從新能源汽車到低空經濟,和而泰的四大技術平臺正在重新定義智能設備的"生命系統(tǒng)"。
    的頭像 發(fā)表于 10-13 16:08 ?493次閱讀

    匯川技術四大架構重磅發(fā)布

    2025 匯川技術爆品發(fā)布會上,FA、運控、傳動、機器人四大 IPMT 主任攜覆蓋 “設計 - 制造 - 傳動 - 執(zhí)行” 的全棧架構登場,為中國制造業(yè)智能化轉型破局。這不是簡單產品升級,而是重構智能制造底層邏輯的革命。
    的頭像 發(fā)表于 09-02 15:54 ?3773次閱讀
    匯川技術<b class='flag-5'>四大</b>架構重磅發(fā)布

    空氣是如何“鉆空子”的?壓鑄件氣密檢測泄漏的四大元兇

    壓鑄件泄漏是制造業(yè)常見質量難題,看似偶然,實則是設計、工藝、材料、檢測四大環(huán)節(jié)的“漏洞”共同導致。空氣通過這些薄弱點侵入產品,引發(fā)質量事故。下面深度剖析四大元兇,并提供實戰(zhàn)解決方案。1.設計缺陷隱形
    的頭像 發(fā)表于 08-29 15:39 ?878次閱讀
    空氣是如何“鉆空子”的?壓鑄件氣密檢測泄漏的<b class='flag-5'>四大</b>元兇

    基于碳納米材料的TPU導電長絲制備與性能研究

    、金屬材料與復合材料等各領域的研究開發(fā)、工藝優(yōu)化與質量監(jiān)控.基于碳納米材料的TPU導電長絲制備與性能研究【江南大學趙樹強】基于碳納米材料的TPU導電長絲制備與性能研究上海
    的頭像 發(fā)表于 07-11 10:21 ?270次閱讀
    基于碳納米材料的<b class='flag-5'>TPU</b>導電長絲制備與性能研究

    NVIDIA DOCA 3.0版本的亮點解析

    NVIDIA DOCA 框架已發(fā)展成為新一代 AI 基礎設施的重要組成部分。從初始版本到備受期待的 NVIDIA DOCA 3.0 發(fā)布,每個版本都擴展了 NVIDIA BlueField DPU 和 ConnectX SuperNIC 的功能,從而實現了前所未有的 AI 平臺可擴展性和性能。
    的頭像 發(fā)表于 07-04 14:27 ?729次閱讀
    NVIDIA DOCA <b class='flag-5'>3.0</b>版本的<b class='flag-5'>亮點</b>解析

    0.1-3.0 GHz 位數字衰減器 (1 dB LSB) skyworksinc

    電子發(fā)燒友網為你提供()0.1-3.0 GHz 位數字衰減器 (1 dB LSB)相關產品參數、數據手冊,更有0.1-3.0 GHz 位數字衰減器 (1 dB LSB)的引腳圖、接
    發(fā)表于 05-26 18:29
    0.1-<b class='flag-5'>3.0</b> GHz <b class='flag-5'>四</b>位數字衰減器 (1 dB LSB) skyworksinc

    英飛凌碳化硅產品創(chuàng)新的四大支柱綜述(二)

    本文是作者2024年“第十八屆中國半導體行業(yè)協會半導體分立器件年會”演講稿第二部分,第一部分請見《英飛凌碳化硅SiC技術創(chuàng)新的四大支柱綜述(一)》。英飛凌SiC技術創(chuàng)新到豐富產品的四大支柱SiC
    的頭像 發(fā)表于 05-19 17:32 ?518次閱讀
    英飛凌碳化硅產品創(chuàng)新的<b class='flag-5'>四大</b>支柱綜述(二)

    TPU處理器的特性和工作原理

    張量處理單元(TPU,Tensor Processing Unit)是一種專門為深度學習應用設計的硬件加速器。它的開發(fā)源于對人工智能(AI)和機器學習應用的需求,尤其是深度學習中的神經網絡計算。
    的頭像 發(fā)表于 04-22 09:41 ?2622次閱讀
    <b class='flag-5'>TPU</b>處理器的特性和工作原理

    Google推出第七代TPU芯片Ironwood

    在 Google Cloud Next 25 大會上,我們隆重推出第 7 代 Tensor Processing Unit (TPU) — Ironwood。這不僅是我們迄今為止性能最高、擴展性最佳的定制 AI 加速器,更是第一款專為推理而設計的 TPU
    的頭像 發(fā)表于 04-16 11:20 ?1069次閱讀
    Google推出第七代<b class='flag-5'>TPU</b>芯片Ironwood

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命

    谷歌第七代TPU Ironwood深度解讀:AI推理時代的硬件革命 Google 發(fā)布了 Ironwood,這是其第七代張量處理單元 (TPU),專為推理而設計。這款功能強大的 AI 加速器旨在處理
    的頭像 發(fā)表于 04-12 11:10 ?2445次閱讀
    <b class='flag-5'>谷歌</b>第七代<b class='flag-5'>TPU</b> Ironwood深度解讀:AI推理時代的硬件革命

    谷歌新一代 TPU 芯片 Ironwood:助力大規(guī)模思考與推理的 AI 模型新引擎?

    Cloud 客戶開放,將提供 256 芯片集群以及 9,216 芯片集群兩種配置選項。 ? 在核心亮點層面,Ironwood 堪稱谷歌首款專門為 AI 推理精心設計的 TPU 芯片,能夠有力支持大規(guī)模思考
    的頭像 發(fā)表于 04-12 00:57 ?2892次閱讀

    TPU編程競賽系列|第九屆集創(chuàng)賽“算能杯”火熱報名中!

    第九屆全國大學生集成電路創(chuàng)新創(chuàng)業(yè)大賽(以下簡稱“集創(chuàng)賽”)正式開始報名。算能在處理器應用方向特別設立了“TPU賦能的邊緣計算架構優(yōu)化與創(chuàng)新應用設計”賽題,誠邀各校參賽隊伍充分發(fā)揮TPU的算力優(yōu)勢
    的頭像 發(fā)表于 02-06 13:41 ?1495次閱讀
    <b class='flag-5'>TPU</b>編程競賽系列|第九屆集創(chuàng)賽“算能杯”火熱報名中!

    光纜用tpu外護套用在哪些型號光纜上

    光纜用TPU(熱塑性聚氨酯)外護套因其耐磨、抗拉、柔性好以及優(yōu)良的防潮和阻燃性能,被廣泛應用于多種型號的光纜上,特別是需要較高機械保護和惡劣環(huán)境適應性的光纜。以下是一些可能使用TPU外護套的光纜
    的頭像 發(fā)表于 01-10 10:05 ?1173次閱讀

    賽逸展2025響應四大行業(yè)協會倡議,審慎采購美國芯片!

    ,中國互聯網協會、中國汽車工業(yè)協會、中國半導體行業(yè)協會、中國通信企業(yè)協會發(fā)表聲明,呼吁國內企業(yè)審慎選擇采購美國芯片。賽逸展堅定不移地與中國四大行業(yè)協會站在一起,迅速加入四大協會陣營,全力支持四大協會的倡議。 賽逸展以實際行動展現
    的頭像 發(fā)表于 12-05 09:56 ?533次閱讀

    UVLED固化機結構的四大模塊

    UVLED固化機作為一種高效、節(jié)能的固化設備,在多個行業(yè)中發(fā)揮著重要作用。其結構設計的合理性直接決定了設備的性能和使用效果。UVLED固化機的四大模塊主要包括光源系統(tǒng)、控制系統(tǒng)、散熱系統(tǒng)和傳送系統(tǒng)
    的頭像 發(fā)表于 11-25 16:10 ?1127次閱讀
    UVLED固化機結構的<b class='flag-5'>四大</b>模塊