chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復
登錄后你可以
  • 下載海量資料
  • 學習在線課程
  • 觀看技術視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領取20積分哦,立即完善>

3天內(nèi)不再提示

AMD公開VEGA GPU架構使用7nm工藝

傳感器技術 ? 來源:未知 ? 作者:工程師郭婷 ? 2018-06-29 16:17 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在日前舉行的Computex 2018發(fā)布會上,AMD有些出人意料地進行了高規(guī)格的產(chǎn)品發(fā)布,公開的產(chǎn)品包括下一代使用7nm工藝的VEGA GPU,以及使用7nm的Zen 2處理器。目前,7nm VEGA GPU是全球第一個使用7nm工藝的GPU,現(xiàn)在已經(jīng)開始樣品出貨,預計在今年下半年開始大規(guī)模出貨。這比之前預期的時間表提前了不少,也打了Nvidia一個措手不及,讓AMD以迅雷不及掩耳之勢搶得了“全球第一塊7nm GPU”。

除了GPU之外,AMD還公布了下一代使用7nm工藝的Zen 2處理器EPYC,該處理器目前已經(jīng)完成流片正處于實驗室測試中,預計將于2018年下半年進入工程樣品階段并于2019年進入大規(guī)模出貨階段。

隨著桌面PC市場被移動設備日漸蠶食,在本世紀初熱鬧非凡的Computex會議已經(jīng)幾乎被人遺忘。而AMD此次在Computex會議上舉行的高規(guī)格產(chǎn)品發(fā)布無疑是為之前有些疲軟的計算機市場和Computex會議帶來了一陣新風。這也釋放了一個重要信號:以數(shù)據(jù)中心為主要應用場景的高性能計算市場正在接過PC的接力棒,將會成為計算機在下一個十年發(fā)展的主要動力。

數(shù)據(jù)中心的想象空間

隨著大數(shù)據(jù)和深度學習的高速發(fā)展,數(shù)據(jù)正在成為新時代的原油而算力正在成為下一代的基礎設施。AMD在發(fā)布會上指出,到2025年的數(shù)據(jù)將會增長50倍:可穿戴設備、IoT、5G設備正在普及,這些設備都會產(chǎn)生大量的數(shù)據(jù)。除此之外,我們對于這些數(shù)據(jù)的處理方式也越來越復雜,機器學習領域的新算法層出不窮,能夠從數(shù)據(jù)中提取更多有用信息,從而在智慧城市、醫(yī)療、金融、安保等領域引入革命性的變化。隨著數(shù)據(jù)量和算法復雜度的飛速提升,對于算力的需求也在高速增長。

OpenAI公布的深度學習算法算力需求,6年增長了30萬倍

大數(shù)據(jù)算力的主要基礎設施在于數(shù)據(jù)中心。數(shù)據(jù)中心對于處理器的需求目前主要包括CPU和GPU。CPU是傳統(tǒng)計算硬件,可以支持通用計算,也是數(shù)據(jù)中心必不可少的一部分。AMD此次公布的EPYC CPU每個socket至多可以支持32個核。除了核心數(shù)多之外,CPU的內(nèi)存存取和CPU間通信在需要高效執(zhí)行分布式計算的數(shù)據(jù)中心也是重要要素,而EPYC每個CPU能支持至多8個內(nèi)存通道和128條PCIe通道,可謂性能強大。眾所周知,AMD在數(shù)據(jù)中心CPU領域并非傳統(tǒng)強項,在Intel牢牢把持著市場的情況下AMD如何打入數(shù)據(jù)中心CPU生態(tài)也就成了大家關注的要點之一。在本次發(fā)布會上,AMD宣布了EPYC已經(jīng)進入了CISCO,HP和騰訊云等重要客戶的產(chǎn)品中。雖然比起Intel在數(shù)據(jù)中心的市場份額來說AMD還有很大的差距,但是這也是個不錯的出發(fā)點。

除了CPU之外,GPU是數(shù)據(jù)中心想象空間更大的部分。在大數(shù)據(jù)時代,CPU并不能高效支持所有運算:在CPU的芯片上,為了滿足通用算法的支持,有很大一部分芯片面積都用來做緩存和控制邏輯(如分支判斷等),而用于計算單元的面積并不大。而在大數(shù)據(jù)算法中,大量數(shù)據(jù)是可以并行處理的(例如來自不同設備產(chǎn)生的獨立數(shù)據(jù)就可以并行處理而不會互相影響),因此大數(shù)據(jù)算法往往比較規(guī)整,而CPU芯片上的許多控制邏輯對于大數(shù)據(jù)算法就顯得多余。這時候擅長并行計算處理的GPU就脫穎而出。GPU的設計中控制邏輯比較簡單,而絕大部分芯片面積都用來做計算單元,因此一個GPU往往包含了數(shù)千個計算核心,可以提供超高效并行計算,對于合適的大數(shù)據(jù)算法GPU的執(zhí)行速度比同代CPU要快兩到三個數(shù)量級。

GPU在數(shù)據(jù)中心中執(zhí)行大數(shù)據(jù)算法的標志性事件是2012年的深度學習算法AlexNet的訓練。AlexNet是深度學習的標志性算法,其貢獻第一是證明在數(shù)據(jù)量足夠的情況下深度神經(jīng)網(wǎng)絡在圖像分類等任務中的性能遠好于傳統(tǒng)的支持向量機(SVM)等算法,可謂是開啟了這一波深度學習熱潮;除此之外AlexNet還提出了使用GPU去訓練深度學習網(wǎng)絡,相比CPU可以將訓練時間降低兩到三個數(shù)量級從而進入合理的范圍(時間從數(shù)年下降到了幾天)。可以說以深度學習離不開GPU的支持,而隨著深度學習的繼續(xù)普及,數(shù)據(jù)中心對于GPU的需求也在持續(xù)上升。

深度學習的普及是GPU在數(shù)據(jù)中心需求量持續(xù)上升的一個要素。除此之外,深度學習以外的其他需要GPU的算法也在推動GPU需求。眾所周知的是區(qū)塊鏈算法對于GPU也有很大的需求量,在區(qū)塊鏈和加密貨幣最火的2017年各大礦場對于GPU的需求甚至讓GPU賣到斷貨(AMD從中也是獲利頗豐),之后雖然加密貨幣逐漸回歸理性但是對于GPU的需求卻在穩(wěn)步上升。除了區(qū)塊鏈之外,數(shù)據(jù)庫等傳統(tǒng)應用也在逐漸擁抱GPU加速??梢哉f目前數(shù)據(jù)中心對于GPU的需求是以深度學習為首,而在其他領域也在逐漸跟上。Nvidia目前在數(shù)據(jù)中心GPU市場幾乎是處于壟斷地位,與之相應數(shù)據(jù)中心業(yè)務在Nvidia的財報中也越來越重要,2017財年的數(shù)據(jù)中心業(yè)務增長高達245%,在2018財年的增長也有233%,收入接近20億美元。AMD當然不會對數(shù)據(jù)中心這塊市場坐視不管,這次搶先Nvidia發(fā)布7nm VEGA GPU以及Radeon Instinct數(shù)據(jù)中心加速卡也是對Nvidia一個強烈的挑戰(zhàn)信號。

除了硬件之外,

開發(fā)生態(tài)同樣重要

在數(shù)據(jù)中心市場,事實上BAT等各大客戶也希望AMD能打破Nvidia的壟斷地位,從而讓高性能GPU的價格能回歸合理的范圍。AMD這次發(fā)布的7nm VEGA GPU以及Radeon Instinct加速卡可謂性能強大,Radeon Instinct加速卡使用了32GB HBM高速顯存,并且VEGA GPU對于人工智能和機器學習也加入了硬件支持,具體性能值得期待。

在硬件性能之外,開發(fā)者生態(tài)也是決定性因素。Nvidia的戰(zhàn)略眼光極其深遠,在絕大部分人對于GPU的認識還局限于游戲圖形加速的時候,Nvidia就已經(jīng)看到了GPU在其他領域的潛力,于是開始了GPGPU(通用GPU)戰(zhàn)略并開始了CUDA的開發(fā)。在經(jīng)過數(shù)年的開發(fā)積累之后,又遇到了深度學習的大熱,Nvidia的CUDA憑借著穩(wěn)定的性能,易用的API接口,完整的文檔和多年的開發(fā)者社區(qū)運營成為了相關開發(fā)者的首選,配合其GPU因此成為了數(shù)據(jù)中心的標配。另一方面,AMD對于GPGPU類的技術投入之前一直處于不溫不火的狀態(tài),和高通等其他幾個合作廠商在推廣與CUDA相似的OpenCL但是其性能和易用性一直被開發(fā)者社區(qū)詬病。除此之外AMD在GPGPU領域的另一個舉措是推出異構系統(tǒng)架構HSA(heterogeneous system architecture),HSA的初衷是打通CPU和GPU的內(nèi)存空間,用于解決CPU和GPU之間內(nèi)存互訪造成的性能損失,然而至今HSA也只能說是普普通通并未引起太多波瀾。

AMD當然也認識到了其開發(fā)生態(tài)不足造成的問題,因此在這次發(fā)布會上也特意提到了其GPGPU的最新舉措即Radeon Open Ecosystem,可以支持TensorFlow,PyTorch,Caffe,MxNet等主流機器學習平臺并將提供優(yōu)化的庫支持。然而,在開發(fā)生態(tài)領域AMD仍然是處于追趕地位,尤其是在Nvidia在數(shù)據(jù)中心的生態(tài)已經(jīng)開始在探索GPU數(shù)據(jù)庫等藍海的情況下,AMD如何迎頭趕上值得我們關注。

7nm提升有限,

封裝技術同樣重要

從芯片角度,這次AMD的發(fā)布也讓我們看到了半導體制程發(fā)展的趨勢。

AMD發(fā)布了7nm VEGA GPU的數(shù)據(jù)。耐人尋味的是,其性能相對于上一代14nm的VEGA僅僅提升了35%。在特征尺寸縮小一半加上設計也有改善的情況下,其性能的提升幅度并不大:7nm半導體工藝節(jié)點中雖然特征尺寸縮小晶體管開關速度會加快但是金屬互聯(lián)線帶來的延遲也變大,因此對于芯片性能的幫助有限。另一方面,其晶體管密度和功耗改善有兩倍之多,這基本延續(xù)了之前摩爾定律的勢頭。

在特征尺寸對于芯片性能提升幫助有限的情況下,封裝技術將會成為芯片性能提升的另一個推力。在本次發(fā)布會上,AMD發(fā)布的Radeon Instinct加速卡中一個最重要的關鍵詞就是32GB HBM內(nèi)存。HBM使用高級封裝技術,將處理器和DRAM做在同一個封裝內(nèi),可以大大降低走線長度,增加走線密度和總線寬度,從而提供遠高于傳統(tǒng)DDR標準的內(nèi)存帶寬。事實上,目前內(nèi)存帶寬已經(jīng)成為了阻礙處理器完全發(fā)揮峰值計算能力的重要瓶頸,因此HBM內(nèi)存將會成為處理器性能提升的重要技術。

AMD公開 VEGA GPU架構使用 7nm 工藝

AMD在今年ISSCC發(fā)布的Zeppelin架構

此外,AMD還宣布將會在7nm VEGA GPU中使用Infinity Fabric。Infinity Fabric與Nvidia的NVLink有相似也有不同的地方,NVLink主要是用于加速多塊GPU間的數(shù)據(jù)通信,而Infinity Fabric則即可以用于片上網(wǎng)絡(NoC),也可以用于封裝內(nèi)的互聯(lián)或者片外互聯(lián)。除了在VEGA GPU內(nèi)使用之外,AMD還將在其CPU中搭配Zeppelin架構使用Infinity Fabric。Zeppelin是AMD今年在ISSCC會議上發(fā)布的新架構,通過高級封裝技術和Infinity Fabric互聯(lián)技術可以在封裝內(nèi)高效集成多塊芯片,從而實現(xiàn)靈活的集成模式,根據(jù)需求可以集成多塊處理器芯片或者是多塊不同的芯片。在高級封裝領域,AMD非常重視,在幾年前的GPU中用上了HBM內(nèi)存,而隨著Zeppelin架構的發(fā)展我們看到AMD正在往封裝方向繼續(xù)深挖潛力。當然,Intel也并不落后,其EMIB高級封裝技術也處于領先位置。AMD、Intel和Nvidia在高級封裝領域的競爭,我們還將繼續(xù)關注追蹤。

結語

AMD此次在Computex上發(fā)布的7nm產(chǎn)品彰顯了其進軍數(shù)據(jù)中心應用的決心,而數(shù)據(jù)中心應用可望能接過PC的大旗成為計算機市場的下一個發(fā)展動力。在芯片技術方面,7nm工藝提供的優(yōu)勢主要在于集成度和功耗,對于性能的提升除了特征尺寸縮小之外還得依靠封裝技術。

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權轉載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學習之用,如有內(nèi)容侵權或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • amd
    amd
    +關注

    關注

    25

    文章

    5625

    瀏覽量

    138414
  • cpu
    cpu
    +關注

    關注

    68

    文章

    11187

    瀏覽量

    221298

原文標題:AMD突然發(fā)布7nm芯片背后的野心

文章出處:【微信號:WW_CGQJS,微信公眾號:傳感器技術】歡迎添加關注!文章轉載請注明出處。

收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關推薦
    熱點推薦

    如何看懂GPU架構?一分鐘帶你了解GPU參數(shù)指標

    GPU架構參數(shù)如CUDA核心數(shù)、顯存帶寬、TensorTFLOPS、互聯(lián)方式等,并非“冰冷的數(shù)字”,而是直接關系設備能否滿足需求、如何發(fā)揮最大價值、是否避免資源浪費等問題的核心要素。本篇文章將全面
    的頭像 發(fā)表于 10-09 09:28 ?115次閱讀
    如何看懂<b class='flag-5'>GPU</b><b class='flag-5'>架構</b>?一分鐘帶你了解<b class='flag-5'>GPU</b>參數(shù)指標

    AMD 7nm Versal系列器件NoC的使用及注意事項

    AMD 7nm Versal系列器件引入了可編程片上網(wǎng)絡(NoC, Network on Chip),這是一個硬化的、高帶寬、低延遲互連結構,旨在實現(xiàn)可編程邏輯(PL)、處理系統(tǒng)(PS)、AI引擎(AIE)、DDR控制器(DDRMC)、CPM(PCIe/CXL)等模塊之間
    的頭像 發(fā)表于 09-19 15:15 ?1709次閱讀
    <b class='flag-5'>AMD</b> <b class='flag-5'>7nm</b> Versal系列器件NoC的使用及注意事項

    適應邊緣AI全新時代的GPU架構

    電子發(fā)燒友網(wǎng)站提供《適應邊緣AI全新時代的GPU架構.pdf》資料免費下載
    發(fā)表于 09-15 16:42 ?19次下載

    aicube的n卡gpu索引該如何添加?

    請問有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當還是只能看到默認的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    礪算6nm GPU與RTX 4060差距大?官方回應來了

    電子發(fā)燒友網(wǎng)綜合報道 根據(jù)Geekbench的最新信息,礪算科技首款6nm GPU?G100在OpenCL通用計算測試中得分為15,524分。這一成績與13年前的英偉達GTX 660 Ti(約
    的頭像 發(fā)表于 06-24 00:16 ?3947次閱讀
    礪算6<b class='flag-5'>nm</b> <b class='flag-5'>GPU</b>與RTX 4060差距大?官方回應來了

    基于AMD Versal器件實現(xiàn)PCIe5 DMA功能

    Versal是AMD 7nm的SoC高端器件,不僅擁有比16nm性能更強的邏輯性能,并且其PS系統(tǒng)中的CPM PCIe也較上一代MPSoC PS硬核PCIe單元強大得多。本節(jié)將基于AMD
    的頭像 發(fā)表于 06-19 09:44 ?1184次閱讀
    基于<b class='flag-5'>AMD</b> Versal器件實現(xiàn)PCIe5 DMA功能

    GPU架構深度解析

    GPU架構深度解析從圖形處理到通用計算的進化之路圖形處理單元(GPU),作為現(xiàn)代計算機中不可或缺的一部分,已經(jīng)從最初的圖形渲染專用處理器,發(fā)展成為強大的并行計算引擎,廣泛應用于人工智能、科學計算
    的頭像 發(fā)表于 05-30 10:36 ?859次閱讀
    <b class='flag-5'>GPU</b><b class='flag-5'>架構</b>深度解析

    又一顆國產(chǎn)GPU芯片成功點亮!6nm制程,自研TrueGPU架構

    GPU芯片G100采用6nm制程,基于自研的TrueGPU架構,這是全球首個融合高性能圖形渲染與AI推理能力的GPU架構。其核心優(yōu)勢在于通
    發(fā)表于 05-29 00:48 ?2252次閱讀

    Xilinx Ultrascale系列FPGA的時鐘資源與架構解析

    Ultrascale是賽靈思開發(fā)的支持包含步進功能的增強型FPGA架構,相比7系列的28nm工藝,Ultrascale采用20nm
    的頭像 發(fā)表于 04-24 11:29 ?1708次閱讀
    Xilinx Ultrascale系列FPGA的時鐘資源與<b class='flag-5'>架構</b>解析

    專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術創(chuàng)新引領行業(yè)新發(fā)展

    在近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發(fā)布會后,AMD GPU技術與工程研發(fā)副總裁王啟尚接受了我們的專訪。在本次交談中,他詳細分享了RDNA 4架構的設計理
    的頭像 發(fā)表于 03-06 11:19 ?593次閱讀
    專訪<b class='flag-5'>AMD</b>王啟尚 從RDNA 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技術創(chuàng)新引領行業(yè)新發(fā)展

    《CST Studio Suite 2024 GPU加速計算指南》

    的各個方面,包括硬件支持、操作系統(tǒng)支持、許可證、GPU計算的啟用、NVIDIA和AMD GPU的詳細信息以及相關的使用指南和故障排除等內(nèi)容。 1. 硬件支持 - NVIDIA GPU
    發(fā)表于 12-16 14:25

    GPU服務器AI網(wǎng)絡架構設計

    眾所周知,在大型模型訓練中,通常采用每臺服務器配備多個GPU的集群架構。在上一篇文章《高性能GPU服務器AI網(wǎng)絡架構(上篇)》中,我們對GPU
    的頭像 發(fā)表于 11-05 16:20 ?1744次閱讀
    <b class='flag-5'>GPU</b>服務器AI網(wǎng)絡<b class='flag-5'>架構</b>設計

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構分析」閱讀體驗】--了解算力芯片GPU

    本篇閱讀學習第七、八章,了解GPU架構演進及CPGPU存儲體系與線程管理 █從圖形到計算的GPU架構演進 GPU圖像計算發(fā)展 ●從三角形開始
    發(fā)表于 11-03 12:55

    今日看點丨 傳蘋果2025年采用自研Wi-Fi芯片 臺積電7nm制造;富士膠片開始銷售用于半導體EUV光刻的材料

    半年的新產(chǎn)品(例如iPhone 17)計劃采用自家的Wi-Fi芯片,采用臺積電N77nm工藝制造,支持最新的Wi-Fi 7規(guī)格。蘋果預計在三年
    發(fā)表于 11-01 10:57 ?1499次閱讀

    AMD與NVIDIA GPU優(yōu)缺點

    在圖形處理單元(GPU)市場,AMD和NVIDIA是兩大主要的競爭者,它們各自推出的產(chǎn)品在性能、功耗、價格等方面都有著不同的特點和優(yōu)勢。 一、性能 GPU的性能是用戶最關心的指標之一。在高端市場
    的頭像 發(fā)表于 10-27 11:15 ?4706次閱讀