chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會員中心
創(chuàng)作中心

完善資料讓更多小伙伴認識你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

NVIDIA RTX 30系列架構(gòu)的詳細講解

電子設(shè)計 ? 來源:電子設(shè)計 ? 作者:電子設(shè)計 ? 2020-12-24 15:15 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

在當前的顯卡市場上,占據(jù)80%的NVIDIA公司被玩家愛且恨著——他們帶來了最近十多年來最好的顯卡,同時也讓高端游戲卡的價格高企,發(fā)燒顯卡至少五位數(shù)起。

在RTX 30系列顯卡發(fā)布之后,玩家的不滿似乎釋然了,相比當前的圖靈顯卡,安培架構(gòu)的RTX 3090/3080/3070顯卡一下子變得真香了,因為它們性能翻倍不說,國內(nèi)價格反而下降了。

·GeForce RTX 3090:取代RTX Titan,相比于Titan RTX快了50%,性能是RTX 2080 Ti顯卡的2倍,配備24GB GDDR6X顯存,售價11999元,9月24日上市。

·GeForce RTX 3080:取代RTX 2080 Ti,相比于RTX 2080性能快2倍,搭配10GB GDDR6X顯存,海外699美元沒變,國內(nèi)從上代6499降至5499元,9月17日上市。

·GeForce RTX 3070:價格不到RTX 2080 Ti的一半,但是平均性能更高,同時比RTX 2070快足足60%,配備8GB GDDR6顯存,售價3899元,10月份上市。

RTX 30系列顯卡售價及上市時間

RTX 30系列顯卡性能變化

RTX 30系列顯卡規(guī)格

從這個規(guī)格表中可以看出,與RTX 2080 Ti顯卡相比,RTX 3090的標志性FP32性能從13.4T提升到了35.7T,翻倍還多,光追及AI加速提升也同樣明顯。

與圖靈顯卡相比,安培GPU的變化之大讓人驚訝,在過去十多年的顯卡升級換代中,性能翻倍的提升很少見到了,NVIDA是怎么做到的?

今天我們就來從詳細解讀一下安培GPU的架構(gòu),探究它到底帶來了哪些技術(shù)升級以致于讓NVIDIA創(chuàng)始人黃仁勛稱之為有史以來性能提升最大的一次。

先從工藝說起:12nm干掉7nm之后 8nm如何再進一步

對于半導(dǎo)體芯片來說,很關(guān)鍵的一部分是制程工藝,先進的架構(gòu)也要通過工藝來實現(xiàn),這是影響芯片能效、性能甚至成本的一大因素。

對NVIDIA來說,他們的Volta伏特、Turing圖靈兩代架構(gòu)都是臺積電12nm FFN工藝了,這是臺積電16nm工藝的改進版,如果再算上16nm的Pascal架構(gòu),實際上過去三代GPU都沒有重大工藝上的升級了。

在Ampere安培架構(gòu)上,NVIDIA終于升級工藝了,只不過這次有兩個意外——首先沒有選擇臺積電,其次沒有上7nm,而是三星定制的8nm工藝,雖然跟7nm看起來只差了1nm,但實際上是兩代工藝。

考慮到NVIDIA之前對工藝的表態(tài),沒用7nm工藝而是三星8nm工藝又在意料之中,最關(guān)鍵的問題在于NVIDIA能夠做到多好。

三星的8nm工藝是基于10nm工藝改良的,至少有LPP和LPU兩個版本,前者適合移動SoC,后者適合高性能芯片,NVIDIA的定制大概是基于后者。

與臺積電的7nm工藝晶體管密度大約1億/mm2相比,8nm工藝大概是6000萬晶體管/mm2,但這是單一的SRAM芯片的對比,實際上GPU芯片比較復(fù)雜,差距會縮小很多。

根據(jù)是NVIDIA公布的信息,臺積電7nm工藝制造的安培A100核心是540億晶體管,核心面積826mm2,而三星8nm工藝制造的GA102核心是280億晶體管,核心面積官方?jīng)]公布,據(jù)悉是628mm2,也是大核心了。

這么算下來,7nm A100核心的晶體管密度6560萬晶體管/mm2,而三星8nm的GA102核心也有4460萬晶體管/mm2——差距仍在,但似乎可以接受了。

三星8nm工藝的晶圓代工價格還是秘密,但是不論技術(shù)還是商業(yè)策略上,三星都會比臺積電便宜很多,預(yù)計代工價格能差30%或者更高,所以這也是RTX 30系列顯卡能夠不漲價甚至降價的關(guān)鍵。

那三星8nm工藝帶來了多大的性能及能效提升呢?首先大家可以看到RTX 30系列顯卡的頻率提升了,從RTX 20系列的1.5GHz+提升到了1.7GHz+,升級工藝還是有性能提升的。

不過RTX 20系列的加速頻率實際可以達到1.9GHz甚至接近2GHz,RTX 30系列預(yù)計也就這個水平。

但是能效還是有提升的,NVIDIA官方稱在60fps性能下,圖靈顯卡的功耗大約有240W,安培顯卡則是120W多點,算下來是1.9倍能效,提升了90%,同時溫度還低了3度,噪音減少2分貝。

總的來說,在工藝這方面大家對安培GPU有驚喜有失望,失望的是沒有上預(yù)期中的7nm工藝(不管臺積電還是三星),工藝依然升級到了8nm。

但是NVIDIA工藝雖然并不算激進,但性能、能效進步還是挺大的,安培顯卡各方面指標都是大幅勝過現(xiàn)在的圖靈卡,而且價格做到了不升反降,這也是不追求激進工藝的好處,反正之前12nm都能贏,現(xiàn)在上8nm更加穩(wěn)妥了。

安培GPU架構(gòu)詳解之:FP32單元翻倍 CUDA核心改了什么?

發(fā)布安培的時候,NVIDIA CEO黃仁勛表示這是GPU有史以來最大的性能飛躍,而2018年推出圖靈GPU時,老黃也是類似的說詞——GPU有史以來最大的變革,這兩個評價其實也沒錯。

圖靈GPU架構(gòu)有很多第一次,首次支持RTX Core(光追加速單元),首次支持Tensor Core,同時還改進了CUDA內(nèi)核,不過前兩個是重點。

在安培GPU上,RT Core、Tensor Core當然繼續(xù)加強,不過最主要的亮點是CUDA架構(gòu)的改進,性能翻倍的根源就在這里,我們先來看看這方面的變化。

GA102核心架構(gòu)示意圖

GA102核心總計7組GPC單元,每組有12組SM單元,總計84組,RTX 30系列顯卡視乎規(guī)格不同啟用的SM單元總數(shù)不同,RTX 3090是82組,RTX 3080是68組,RTX 3070是46組。

在之前的GA100大核心中,每組SM是64個INT32單元、64個FP32單元及32個FP64單元組成的,但在GA102核心中,F(xiàn)P64單元大幅減少,增加了RT Core,Tensor Core也略微減少。

GA102核心的SM單元

按照之前圖靈GPU的路線走,安培GPU的SM單元增加的并不多,但實際上FP32性能翻倍了還多,算上頻率,RTX 3080的理論性能差不多是RTX 2080的三倍了,這是怎么做到的?

答案就是CUDA核心的FP32翻倍,但翻倍的方式有點特殊,每個SM單元中有4個分區(qū),每個分區(qū)除了第三代Tensor Core核心之外,還有一組是16個FP32單元及16個FP32、16個IN32組成的單元,后者可以同時執(zhí)行FP32或者INT32運算。

16個FP32單元每周期可執(zhí)行16個FP32運算,混合的那個單元可以執(zhí)行32個FP32或者16個FP32+16個INT32。

如此一來,每個SM單元可以同時執(zhí)行4x(16FP32+16FP32)=128個FP32運算,或者4x(16FP32+16INT32)=64個FP32+64個INT32運算。

只算FP32浮點的話,那么就是浮點翻倍了,因為圖靈以及GA100都是每周期64個FP32浮點而已,現(xiàn)在可以做128個FP32運算了。

提升FP32性能不論對游戲還是運算都大有裨益,但也需要配套的提升,GA102的L1容量提升了33%,L1帶寬從116GB/s翻倍到219GB/s,共享內(nèi)存的性能也從每周期64B翻倍到128B。

審核編輯:符乾江


聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請聯(lián)系本站處理。 舉報投訴
  • IC設(shè)計
    +關(guān)注

    關(guān)注

    38

    文章

    1365

    瀏覽量

    107587
  • NVIDIA
    +關(guān)注

    關(guān)注

    14

    文章

    5444

    瀏覽量

    108581
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5050

    瀏覽量

    134019
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評論

    相關(guān)推薦
    熱點推薦

    NVIDIA RTX PRO 4500 Blackwell GPU測試分析

    今天我們帶來全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測試,對比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?2238次閱讀
    <b class='flag-5'>NVIDIA</b> <b class='flag-5'>RTX</b> PRO 4500 Blackwell GPU測試分析

    NVIDIA桌面GPU系列擴展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 20
    的頭像 發(fā)表于 08-18 11:50 ?784次閱讀

    NVIDIA RTX AI加速FLUX.1 Kontext現(xiàn)已開放下載

    NVIDIA RTXNVIDIA TensorRT 現(xiàn)已加速 Black Forest Labs 的最新圖像生成和編輯模型;此外,Gemma 3n 現(xiàn)可借助 RTX
    的頭像 發(fā)表于 07-16 09:16 ?1533次閱讀

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級 GPU 和 AI 賦能的開發(fā)者工具—同時,ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?908次閱讀

    NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對比

    基于大眾所熟知的 NVIDIA Ada Lovelace 架構(gòu),NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA
    的頭像 發(fā)表于 03-05 10:30 ?2915次閱讀

    技嘉RTX 5090 D和 5080系列顯卡開售,性能猛獸降臨

    。 強大性能,卓越架構(gòu) ? 本次發(fā)售的RTX 50系列顯卡均來自NVIDIA Blackwell新架構(gòu),這一
    的頭像 發(fā)表于 02-05 14:32 ?787次閱讀
    技嘉<b class='flag-5'>RTX</b> 5090 D和 5080<b class='flag-5'>系列</b>顯卡開售,性能猛獸降臨

    技嘉科技發(fā)布GeForce RTX 5090 D 和RTX 5080系列顯卡

    旗艦散熱方案,釋放顯卡強勁性能 ?日前— 技嘉科技-主板、顯卡和硬件解決方案制造商,隆重推出搭載 NVIDIA? 革命性 Blackwell 架構(gòu)的 GeForce RTX 5090 D 和
    的頭像 發(fā)表于 01-28 10:31 ?1893次閱讀
    技嘉科技發(fā)布GeForce <b class='flag-5'>RTX</b> 5090 D 和<b class='flag-5'>RTX</b> 5080<b class='flag-5'>系列</b>顯卡

    技嘉CES 2025發(fā)布RTX 50系列顯卡,升級散熱縮小體積

    RTX? 5070等型號。這些顯卡均基于NVIDIA Blackwell架構(gòu)及AI技術(shù),為用戶帶來前所未有的游戲體驗。 技嘉新一代RTX 50系列
    的頭像 發(fā)表于 01-13 11:16 ?1026次閱讀

    NVIDIA GeForce RTX 50系列:AI計算機圖形新紀元

    和筆記本電腦兩種版本,均搭載了NVIDIA革命性的Blackwell架構(gòu)。 Blackwell架構(gòu)的引入,使得GeForce RTX 50系列
    的頭像 發(fā)表于 01-13 10:49 ?678次閱讀

    $1999 的 RTX 5090 來了

    “ ?NVIDIA 的 GeForce RTX 5090 將于1月30日發(fā)售,起價 $1999。雖然可能買不到,但如果可以把4090的價格打下來,那也是非常不錯的...... ? ” Geforce
    的頭像 發(fā)表于 01-13 10:03 ?2691次閱讀
    $1999 的 <b class='flag-5'>RTX</b> 5090 來了

    英偉達發(fā)布Blackwell架構(gòu)RTX 50系列顯卡

    在萬眾矚目的CES 2025展會上,NVIDIA CEO黃仁勛震撼發(fā)布了基于全新Blackwell架構(gòu)RTX 50系列顯卡,為全球圖形處理領(lǐng)域帶來了革命性的突破。 此次發(fā)布的
    的頭像 發(fā)表于 01-09 11:06 ?835次閱讀

    NVIDIA推出GeForce RTX 50系列臺式機和筆記本電腦GPU

    NVIDIA 宣布為游戲玩家、創(chuàng)作者和開發(fā)者推出最先進的消費級 GPU——GeForce RTX 50 系列臺式機和筆記本電腦 GPU。
    的頭像 發(fā)表于 01-08 11:05 ?1256次閱讀

    NVIDIA推出面向RTX AI PC的AI基礎(chǔ)模型

    NVIDIA 今日發(fā)布能在 NVIDIA RTX AI PC 本地運行的基礎(chǔ)模型,為數(shù)字人、內(nèi)容創(chuàng)作、生產(chǎn)力和開發(fā)提供強大助力。
    的頭像 發(fā)表于 01-08 11:01 ?772次閱讀

    技嘉于 CES 2025 首度亮相升級散熱設(shè)計與精實體積的 NVIDIA GeForce RTX 50 系列顯卡

    NVIDIA GeForce RTX? 50 系列顯示芯片設(shè)計的散熱系統(tǒng),可大幅提升高負載需求的游戲表現(xiàn)。以 "Evolution of Ten" 為設(shè)計概念,技嘉新系列顯卡提升高達
    的頭像 發(fā)表于 01-07 17:57 ?696次閱讀

    NVIDIA和GeForce RTX GPU專為AI時代打造

    NVIDIA 和 GeForce RTX GPU 專為 AI 時代打造。
    的頭像 發(fā)表于 01-06 10:45 ?1111次閱讀