亚洲精品福利网站,久久天天躁狠狠躁夜夜躁2016

Ampere架構(gòu)將為GeForce RTX 3090，GeForce RTX 3080，GeForce RTX 3070和其他即將推出的Nvidia GPU提供動(dòng)力。它代表了Team Green的下一次重大升級(jí)，因?yàn)檫@次在性能上它有可能實(shí)現(xiàn)巨大飛躍。該顯卡將于本月晚些時(shí)候上市，而3070要等到10月份。根據(jù)當(dāng)前消息，這些GPU可以輕松遷移至我們的GPU層次結(jié)構(gòu)的頂部，并將一些最好的顯卡淘汰一兩個(gè)。下文將詳細(xì)介紹Ampere架構(gòu)，主要內(nèi)容包括規(guī)格，功能和其他性能增強(qiáng)。

Ampere架構(gòu)標(biāo)志著NVIDIA的重要轉(zhuǎn)折點(diǎn)。這是該公司的首款7納米GPU，或用于消費(fèi)類零件的8納米GPU。無(wú)論以何種方式，制程減小都能使其在比以前更小的面積內(nèi)封裝更多的晶體管。它也是第二代消費(fèi)者光線追蹤和第三代深度學(xué)習(xí)硬件。較雄昂的制程為Nvidia極大程度上改進(jìn)以前的RTX 20系列硬件和技術(shù)創(chuàng)造了條件。

我們知道Ampere架構(gòu)將在即將到來(lái)的GeForce RTX 3090，RTX 3080和RTX 3070顯卡中得到應(yīng)用（預(yù)計(jì)明年RTX 3060和RTX 3050發(fā)布）。它也是Nvidia A100數(shù)據(jù)中心GPUs的一部分，該GPUs是完全獨(dú)立的硬件。在這里，我們將逐步分析Ampere體系結(jié)構(gòu)的消費(fèi)者和數(shù)據(jù)中心的變體，然后深入探討其中的一些差異。

Nvidia的Ampere GPU發(fā)布感覺就像是2016年的Pascal和2018年的Turing GPus的融合。Nvidia首席執(zhí)行官黃仁勛（Jensen Huang）于5月14日發(fā)布了用于數(shù)據(jù)中心的A100，讓我們了解到即將推出的產(chǎn)品的官方消息，但A100不是為GeForce卡設(shè)計(jì)的。A100替代了Volta GV100，而GV100替代了GP100。消費(fèi)類模型具有不同的功能集，并由單獨(dú)的GPU（如GA102，GA103等）提供支持。消費(fèi)類顯卡還使用GDDR6X / GDDR6，而A100使用HBM2。

除了底層的GPU架構(gòu)，Nvidia還改進(jìn)了核心圖形卡設(shè)計(jì)，重點(diǎn)放在散熱和功耗上。正如Nvidia在視頻中所描述，“每當(dāng)我們談?wù)揋PU性能時(shí)，其實(shí)就是在講我們可以賦予和散去的功率，這種功率越大，性能就越好?！苯?jīng)過(guò)改進(jìn)的散熱解決方案，風(fēng)扇和PCB（印刷電路板）都是改善Nvidia Ampere GPU整體性能計(jì)劃的一部分。當(dāng)然，第三方設(shè)計(jì)可以自由調(diào)整Nvidia的設(shè)計(jì)。

隨著臺(tái)積電從12nm FinFET節(jié)點(diǎn)轉(zhuǎn)移到臺(tái)積電N7和三星N8，許多人期望Ampere在更低的功耗水平下提供更好的性能。與之相反的是，Nvidia以多多益善的方式采取了所有額外的晶體管并且提升功率（至少在產(chǎn)品堆棧的頂部是如此）。例如，GA100擁有540億個(gè)晶體管，其方形芯片尺寸是826mm。與GV100相比，晶體管數(shù)量增加了156％，而die尺寸僅增加了1.3％。我們預(yù)計(jì)消費(fèi)類GPU也會(huì)有類似的變化。

雖然7nm / 8nm在相同性能下確實(shí)可以有更高的功率，但其在相同功率下也可以表現(xiàn)出更好的性能。Nvidia邁出了一步，并在更高的功率水平下提供了更高的性能。V100數(shù)據(jù)中心模型的功率是300W，而新發(fā)布的Nvidia A100則將其提高到400W。我們?cè)谙M(fèi)者模型上得到了相同的結(jié)果。GeForce RTX 2080 Ti的功率為250 / 260W，Titan RTX的功率為280W。有傳言稱RTX 3090超越了它，并配備有歷史最高的TDP，可用于350W功率的單個(gè)GPU（顯然不包括A100）。

這對(duì)終端用戶意味著什么？除了可能需要升級(jí)電源以及在Nvidia自己的型號(hào)上使用12針電源連接器之外，還意味著性能的度量標(biāo)準(zhǔn)會(huì)做出相應(yīng)改變。在我的印象中，這次是Nvidia性能上最大的單代提升。Nvidia表示，結(jié)合即將進(jìn)行的體系結(jié)構(gòu)更新，RTX 3080的性能是RTX 2080的兩倍。如果這些工作負(fù)載包括光線跟蹤和/或DLSS，那么差距可能會(huì)更大。

值得慶幸的是，最終價(jià)格不會(huì)比上一代GPU差很多（這取決于定價(jià)的比較方式）。GeForce RTX 3090的首發(fā)價(jià)為1，499美元，創(chuàng)下了單GPU的 GeForce顯卡的記錄，有效取代了Titan系列。RTX 3080的價(jià)格為699美元，RTX 3070的價(jià)格為499美元，與上一代RTX 2080 Super和RTX 2070 Super保持相同的價(jià)格。Ampere架構(gòu)是否價(jià)格公道？我們需要再作等待才能實(shí)際測(cè)試硬件，但是這些規(guī)格至少看起來(lái)非常有吸引力。

Ampere GA100使Nvidia以前的GPU相形見絀，其晶體管的數(shù)量是GV100的2.5倍。

Nvidia Ampere體系結(jié)構(gòu)規(guī)格

除了用于數(shù)據(jù)中心的GA100之外，Nvidia還計(jì)劃在2020年至少再推出三個(gè)Ampere GPU。來(lái)年，可能還會(huì)有多達(dá)三個(gè)額外的Ampere解決方案，盡管這些解決方案尚未得到證實(shí)。

規(guī)格最大并且性能最差的GPU是A100。它具有多達(dá)128個(gè)SM和6個(gè)8GB的HBM2堆棧，其中Nvidia A100當(dāng)前僅啟用108個(gè)SM和五個(gè)HBM2堆棧。未來(lái)的版本可能具有完整的GPU和RAM配置。但是，GA100不會(huì)像普通的GP100和GV100那樣僅用作數(shù)據(jù)中心和工作站，而是成為消費(fèi)類產(chǎn)品。如果沒有光線追蹤硬件，GA100不會(huì)像GeForce卡那樣遙不可及（因?yàn)闊o(wú)需考慮大型裸片，HBM2和硅中介層的成本）。

在把方向下調(diào)至消費(fèi)者模型后，Nvidia進(jìn)行了一些重大更改。我們還沒有完整的外觀，但是Nvidia顯然使每個(gè)SM的CUDA內(nèi)核數(shù)量增加了一倍，從而在著色器性能上取得了巨大的進(jìn)步。有了GA102和RTX 3090，Nvidia可能會(huì)削減相對(duì)于GA100軸上兩個(gè)SM集群，從而保留96個(gè)SM的最大配置。其中，RTX 3090僅啟用了82個(gè)。HBM2和硅中介層也消失了，取而代之的是12個(gè)GDDR6X芯片。

每個(gè)SM的CUDA內(nèi)核增加一倍之后（相當(dāng)于10496個(gè)CUDA內(nèi)核），每個(gè)SM可能有兩個(gè)支持FP64的CUDA內(nèi)核。Nvidia去除了剩余的FP64功能，并在其位置添加了第二代RT內(nèi)核。至于四個(gè)第三代Tensor核心，其中每個(gè)核心的吞吐量是上一代Turing Tensor核心的每時(shí)鐘吞吐量的四倍。1700 MHz的boost頻率可提供FP32計(jì)算性能的35.7 TFLOPS，而19.5 Gbps GDDR6X可提供936 GBps的帶寬。大致來(lái)講，RTX 3090的性能可能會(huì)是RTX 2080 Ti的兩倍以上。

值得注意的是，目前有一大批SM被禁用。將來(lái)是否會(huì)完全啟用GA102的Titan卡？當(dāng)然如此。也許它還將配備21 Gbps內(nèi)存，并配上相應(yīng)的高價(jià)。（友情提示：即便你壕氣沖天，也不要為了游戲而購(gòu)買Titan GPU。3-5％的性能提升絕對(duì)不值這個(gè)價(jià)。）

相對(duì)于GA102，GA103做出了進(jìn)一步修整。目前GA103有6個(gè)SM集群，最多72個(gè)SM。RTX 3080使用幾乎完整的GA103，其有68個(gè)SM和8704 CUDA內(nèi)核，而我們認(rèn)為RTX 3070使用僅具有46個(gè)active SM和5888 CUDA內(nèi)核的harvest芯片（可能是GA104，但這并不重要）。3080還具有10GB的GDDR6X內(nèi)存和320位總線，而3070禁用了兩個(gè)通道，最終在256位的總線上具有8GB的GDDR6內(nèi)存。

與前幾代產(chǎn)品不同，所有三個(gè)RTX 30系列GPU的工作頻率都較為相似：1700-1730MHz。從理論性能上講，RTX 3080可以完成29.8 TFLOPS，并具有760 GBps的帶寬，Nvidia表示它的速度是即將發(fā)布的RTX 2080的兩倍。

同時(shí)，RTX 3070提供20.4 TFLOPS和512 GBps的帶寬。Nvidia表示RTX 3070的最終運(yùn)行速度也將比RTX 2080 Ti快，盡管在某些情況下11GB與8GB VRAM相比，會(huì)讓前重量級(jí)冠軍略勝一籌。同樣，架構(gòu)上的改進(jìn)肯定會(huì)有所幫助。

現(xiàn)在我們開始討論Ampere架構(gòu)。

A100是Nvidia有史以來(lái)規(guī)格最大的GPU，相比之下各種消費(fèi)類芯片要小得多

英偉達(dá)的GA100 Ampere架構(gòu)

隨著GA100和Nvidia A100的發(fā)布以及GeForce RTX 30系列的面世，我們現(xiàn)在對(duì)預(yù)期會(huì)有一個(gè)很好的了解。英偉達(dá)將繼續(xù)擁有兩條獨(dú)立的GPU系列，其中一條專注于數(shù)據(jù)中心和深度學(xué)習(xí)，另一條專注于圖形和游戲。數(shù)據(jù)中心GA100所做的一些更改會(huì)延伸至消費(fèi)類產(chǎn)品線，但這并沒有擴(kuò)展到FP64的Tensor核心增強(qiáng)功能。這就是我們對(duì)Ampere架構(gòu)始于GA100的了解。

首先，GA100包含許多新內(nèi)容。從較高的角度來(lái)看，GPU已從GV100中的最多80個(gè)SMs / 5120 CUDA內(nèi)核增加到GA100中的128個(gè)SMs / 8192 CUDA內(nèi)核。雖然核心數(shù)量增加了60％，但GA100使用的晶體管數(shù)量是其2.56倍。所有這些額外的晶體管都用于增強(qiáng)架構(gòu)。如果您想深入了解所有細(xì)節(jié)，請(qǐng)查看Nvidia的A100 Architecture白皮書，我們只對(duì)其進(jìn)行簡(jiǎn)要總結(jié)。

GA100中的Tensor核心取得了最重要的升級(jí)。上一代GV100 Tensor內(nèi)核在兩個(gè)4x4 FP16矩陣上運(yùn)行，并且可以計(jì)算兩個(gè)矩陣的4x4x4融合乘加（FMA），每個(gè)周期具有第三個(gè)矩陣。每個(gè)Tensor內(nèi)核每個(gè)周期可以進(jìn)行128個(gè)浮點(diǎn)運(yùn)算，而Nvidia將GV100評(píng)為FP16的125 TFLOPS峰值吞吐量。相比之下，GA100 Tensor內(nèi)核每個(gè)工作頻率可以完成8x4x8 FMA矩陣運(yùn)算，每個(gè)Tensor內(nèi)核總共可以進(jìn)行256 FMA或512 FP（吞吐量是其四倍）。即使它每個(gè)SM的Tensor內(nèi)核數(shù)量只有上一代GV100 Tensor內(nèi)核的一半，但它仍然是上一代GV100 Tensor內(nèi)核每個(gè)SM的性能的兩倍。

GA100還增加了對(duì)Tensor內(nèi)核稀疏性的支持。該改進(jìn)考慮到許多深度學(xué)習(xí)操作最終會(huì)產(chǎn)生一堆不再重要的加權(quán)值，因此隨著訓(xùn)練的進(jìn)行，這些值基本上可以忽略。稀疏性將Tensor核心吞吐量提高了一倍。FP16的Nvidia A100的額定值為312 TFLOPS，而有稀疏性支持的Tensor 內(nèi)核則為624 TFLOPS。

除了大幅提高原始吞吐量外，GA100 Tensor內(nèi)核還增加了對(duì)更低精度的INT8，INT4和二進(jìn)制Tensor運(yùn)行的支持。INT8容許具有稀疏性的624 TOPS和 1248 TOPS，而INT4則將其翻倍，達(dá)到了1248/2496 TOPS。二進(jìn)制模式不支持稀疏性，可能用途有限，但是A100可以在該模式下進(jìn)行4992 TOPS。

另一方面，A100中的Tensor內(nèi)核也支持FP64指令。FP64的性能在19.5 TFLOPS時(shí)遠(yuǎn)低于FP16。但是，對(duì)于FP64工作負(fù)載，它仍然比GV100的最大FP64吞吐量快2.5倍。

最后一點(diǎn)，A100添加了兩種新的浮點(diǎn)格式。BF16（Bfloat16）已被其他一些深度學(xué)習(xí)加速器（例如Google的TPUv4）使用。就像FP16一樣，BF16使用16位，但是使用8位指數(shù)和7位尾數(shù)進(jìn)行轉(zhuǎn)換，匹配FP32的8位指數(shù)范圍，同時(shí)降低了精度。事實(shí)已經(jīng)證明，這可以提供比普通FP16格式更好的訓(xùn)練和模型精度。第二種格式是Nvidia在Tensor Float 32（TF32）上的格式，該格式保留8位指數(shù)，但將尾數(shù)擴(kuò)展到10位，使FP16的精度與FP32的范圍相匹配。TF32的性能也與FP16相同，因此深度學(xué)習(xí)仿真的額外精度基本上是“免費(fèi)”的。

哇，這是一個(gè)具有公制對(duì)接晶體管的大芯片！

Tensor的核心增強(qiáng)功能很多，這也表明了Nvidia在GA100上的重心。深度學(xué)習(xí)和超級(jí)計(jì)算工作負(fù)載的性能大大提高。GA100還具有其他一些體系結(jié)構(gòu)更新，我們將在此處作簡(jiǎn)要介紹。SM晶體管的數(shù)量增加了50-60％，所有這些晶體管都必須放在某個(gè)地方。

多實(shí)例GPU（MIG）是一項(xiàng)新功能。這使得單個(gè)A100可以劃分為多達(dá)七個(gè)獨(dú)立的虛擬GPU。每個(gè)虛擬GPU（使用Tensor操作運(yùn)行推理工作負(fù)載）都可能與單個(gè)GV100的性能相匹配，從而極大地增加了云服務(wù)提供商的橫向擴(kuò)展機(jī)會(huì)。

每個(gè)SM的A100 L1高速緩存大了50％，與V100上的128KB相比為192KB。L2緩存的增加幅度更大，從V100的6MB增加到A100的40MB。它還具有新的分區(qū)交叉開關(guān)結(jié)構(gòu)，可提供GV100 L2緩存的讀取帶寬的2.3倍。請(qǐng)注意，總的HBM2內(nèi)存“僅”從GV100的16GB或32GB增加到GA100的40GB，但是增加的L1和L2緩存有助于更好地優(yōu)化內(nèi)存性能。

NVLink性能也幾乎翻了一番，從GV100中的每個(gè)信號(hào)對(duì)25.78 Gbps到GA100中的50 Gbps。A100中的單個(gè)NVLink在每個(gè)方向上提供25 GBps的速率，類似于GV100，但每個(gè)鏈路具有一半的信號(hào)對(duì)。鏈接總數(shù)也增加了一倍，達(dá)到12條，從而使NVLink總帶寬在A100下為600 GBps，而在V100下為300 GBps。此外還提供了PCIe Gen4支持，幾乎使x16連接的帶寬增加了一倍（從15.76 GBps到31.5 GBps）。

最后，A100添加了新的異步副本，異步屏障和任務(wù)圖加速。異步副本可提高內(nèi)存帶寬效率并減少寄存器文件帶寬，并且可以在SM執(zhí)行其他工作時(shí)在后臺(tái)完成。硬件加速障礙為CUDA開發(fā)人員提供了更大的靈活性和性能，并且任務(wù)圖加速有助于優(yōu)化向GPU提交的工作。

還有其他體系結(jié)構(gòu)增強(qiáng)，例如NVJPG解碼可加速JPG解碼，以用于基于圖像的算法的深度學(xué)習(xí)訓(xùn)練。A100包含5核硬件JPEG解碼引擎，該引擎可勝過(guò)基于CPU的JPEG解碼并減輕PCIe擁塞。同樣，A100添加了五個(gè)NVDEC（Nvidia解碼）單元，以加速常見視頻流格式的解碼，這有助于與視頻一起使用的深度學(xué)習(xí)和推理應(yīng)用的端到端吞吐量。

介紹完了GA100和Nvidia A100架構(gòu)之后，以下將介紹消費(fèi)類GeForce RTX卡的Ampere架構(gòu)變化。

Nvidia GA102 / GA103 Ampere架構(gòu)

與GV100相比，GA100進(jìn)行了大量更改，而在消費(fèi)類方面，更新同樣顯著。以上對(duì)Tensor核心的許多更改都直接帶入了消費(fèi)類模型（自然很可能會(huì)減去FP64）。除了支持Micron的新GDDR6X存儲(chǔ)器（而不是HBM2）之外，其他主要更改還包括光線跟蹤和CUDA內(nèi)核。

Nvidia在2018年使用Turing架構(gòu)和GeForce RTX 20系列GPU在光線追蹤方面引起了很多爭(zhēng)議。兩年過(guò)去了……好吧，說(shuō)實(shí)話：游戲中的光線追蹤并沒有真正發(fā)揮其潛力?！稇?zhàn)地風(fēng)云5》具有更好的反射效果，《古墓麗影》和《使命召喚》的陰影得到了改善，《地鐵出埃及記》使用了RT全局照明，并且在每種情況下，性能的下降都使視覺效果有了相對(duì)較小的提高。迄今為止，關(guān)于光線追蹤可以做什么，最好的例子可以說(shuō)是“控制游戲”，該游戲使用RT效果進(jìn)行反射，陰影和漫射照明。它看起來(lái)相當(dāng)不錯(cuò)，盡管您可能抱有期望，但其對(duì)性能的影響仍然很大。

究竟有多大呢？對(duì)于RTX 2080 Ti和Core i9-9900K，在1440p和最高質(zhì)量下運(yùn)行Control且沒有光線追蹤的情況下，其性能為80 fps（這是我們?cè)诒疚闹袆倓偼瓿傻臏y(cè)試）。打開所有光線跟蹤功能之后，七性能降低到43 fps，慢47％，或基本上降低一半。盡管您可以通過(guò)啟用DLSS 2.0來(lái)緩解問題，但該功能在質(zhì)量模式下可渲染為1707x960，并可以放大到1440p。但這會(huì)帶來(lái)一個(gè)痛苦的代價(jià)：性能降回72 fps。

還有“全路徑跟蹤”的演示，其中硬件進(jìn)一步推向了更高的位置。以Quake II或Minecraft之類的相對(duì)古老且低保真的游戲?yàn)槔?，再添加照明，陰影，反射，折射等全光線追蹤效果。而且，結(jié)果可能是60 fps，而不是每秒數(shù)百幀。這還是在以至少1080p的RTX 2070 Super啟用DLSS的情況（這已經(jīng)到達(dá)質(zhì)量水平）。

或許有人認(rèn)為光線跟蹤效果對(duì)性能造成的損失太大， Nvidia應(yīng)該反其道而行之。但是說(shuō)這類話的人對(duì)Nvida不是很了解。據(jù)Nvidia稱，GeForce 256是第一個(gè)GPU，它還將硬件轉(zhuǎn)換和照明計(jì)算引入了消費(fèi)類硬件。大多數(shù)游戲要幾年后才能正確使用這些功能。第一批帶有著色器的GPU早在數(shù)年之前就已經(jīng)普遍使用該硬件，但是今天幾乎所有發(fā)行的游戲都廣泛使用了著色器技術(shù)。Nvidia認(rèn)為光線追蹤會(huì)有一個(gè)類似的演變過(guò)程。

好消息是，采用Ampere架構(gòu)的光線追蹤性能正在迅速崛起。Nvidia表示，與RTX 2080 Ti的34 TFLOPS相比，RTX 3080可以進(jìn)行58 TFLOPS的光線跟蹤計(jì)算。換句話說(shuō)，光線追蹤的速度快了1.7倍。2080 Ti的光線三角相交計(jì)算速度達(dá)到每秒11千兆字節(jié)，因此RTX 3080可以達(dá)到每秒19千兆字節(jié)，而與以往的最佳紀(jì)錄相比，RTX 3090將翻倍甚至更躲。

這對(duì)光線追蹤游戲意味著什么？我們會(huì)很快找到答案，但是根據(jù)我們從Nvidia那里聽到的消息，我們將看到更多的游戲開發(fā)人員增加了光線跟蹤效果。賽博朋克2077將具有光線追蹤的反射，陰影，環(huán)境光遮擋等功能。像Control這樣的游戲可能在啟用所有光線跟蹤效果的情況下運(yùn)行，并且一旦啟用DLSS，相對(duì)于傳統(tǒng)渲染而言，其性能不會(huì)顯著下降，甚至有可能會(huì)表現(xiàn)出性能提升。

Nvidia還從其使用完整路徑跟蹤的Marbles技術(shù)演示中提供了上述指標(biāo)。一個(gè)未命名的Turing GPU（RTX 2080 Ti？）那能夠以720p和25 fps的速度運(yùn)行Marbles，沒有景深，只有一個(gè)圓頂燈和一個(gè)間接光。同時(shí)，Ampere（RTX 3090？）可以以1440p和30 fps的速度運(yùn)行演示，并啟用了景深和130個(gè)區(qū)域照明燈。結(jié)果是無(wú)論使用什么實(shí)際的GPU，都有可能將光線追蹤提升到一個(gè)全新的水平。

當(dāng)然，這不僅與光線追蹤有關(guān)。英偉達(dá)還在DLSS上加倍努力，而且由于擁有更強(qiáng)大的Tensor內(nèi)核，所以質(zhì)量和性能應(yīng)該比以前更好。我們即將實(shí)現(xiàn)質(zhì)量模式下的DLSS 2.0看起來(lái)比使用TAA或SMAA的本機(jī)渲染效果更好。不難想象，許多游戲玩家選擇啟用DLSS來(lái)獲得健康的性能提升。

由于Ampere對(duì)8K顯示器具有本機(jī)支持，因此得益于HDMI 2.1，DLSS變得更加重要。什么樣的硬件能夠以絕佳的性能水平為8K提供動(dòng)力？這很容易：打開DLSS并使用RTX 3090或RTX 3080以4K渲染。這是8K渲染嗎？當(dāng)然不是。但這是個(gè)無(wú)關(guān)緊要的問題。

當(dāng)然，8K顯示器的價(jià)格仍然高得驚人，如果您坐在沙發(fā)上，幾乎不可能看到4K和8K之間的差異。另外，如果您像我一樣視力老化，那這種可能性為零。但是在家庭影院領(lǐng)域，營(yíng)銷力量很強(qiáng)大，因此我們可以肯定將來(lái)8K電視會(huì)以更大的推動(dòng)力向前發(fā)展（這正是消費(fèi)電子公司試圖說(shuō)服所有4K HDR電視所有者做出升級(jí)的方式）。

Nvidia Ampere架構(gòu)：第二輪光線追蹤

毫無(wú)疑問，現(xiàn)在使用Nvidia的RTX 20系列GPU的人會(huì)有一種受到欺騙的感覺。如果幾個(gè)月前您沒有收到我們所提出的關(guān)于等待購(gòu)買新GPU直到Ampere發(fā)布的建議，那么看到RTX 30系列規(guī)格和Ampere架構(gòu)可能會(huì)給您帶來(lái)更大的損失。問題在于，我們始終知道這一天會(huì)到來(lái)。就像Turing取代Pascal，Pascal取代Maxwell，Maxwell又取代Kepler一樣，GPU世界的迭代更新之路也在穩(wěn)定發(fā)展。

另一方面，如果您在過(guò)去幾年中一直對(duì)游戲中的光線追蹤持懷疑態(tài)度，Ampere可能最終會(huì)成功說(shuō)服您嘗試一下。然后您又拖一個(gè)月左右，想看看AMD的Big Navi表現(xiàn)?，F(xiàn)實(shí)情況是，我們將看到更多支持某種形式的光線追蹤的游戲，尤其是計(jì)劃于今年秋天推出的下一代PlayStation 5和Xbox Series X控制臺(tái)。我們有望在足夠的硬件實(shí)力的支持下，游戲的光線追蹤效果具有現(xiàn)實(shí)意義。

可以肯定的一件事是：光線追蹤不會(huì)消失。它幾乎已經(jīng)成為每部電影的重要組成部分，雖然目前還不是游戲與2020年好萊塢的電影競(jìng)爭(zhēng)的時(shí)候，但他們也許可以追趕2000年代的好萊塢。目前，實(shí)時(shí)游戲通常希望每個(gè)像素僅使用幾條光線，以更好地貼近現(xiàn)實(shí)光線的表現(xiàn)方式。相比之下，好萊塢每個(gè)像素可能使用數(shù)千條光線（或路徑）。具有光線追蹤硬件的GPU仍處于早期階段，但是如果Nvidia（以及AMD和Intel）可以繼續(xù)升級(jí)我們的GPU，那么游戲和電影之間的差距將只會(huì)縮小。

Nvidia尚未透露所有關(guān)于Ampere架構(gòu)更改的消息，因此我們后續(xù)將在了解更多信息后做出更新。
責(zé)任編輯：tzh

聲明：本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人，不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用，如有內(nèi)容侵權(quán)或者其他違規(guī)問題，請(qǐng)聯(lián)系本站處理。舉報(bào)投訴

印刷電路板

印刷電路板

+關(guān)注

關(guān)注
4

文章
863

瀏覽量
36884
gpu

gpu

+關(guān)注

關(guān)注
28

文章
5099

瀏覽量
134468
帶寬

帶寬

+關(guān)注

關(guān)注
3

文章
1029

瀏覽量
43025

chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛兴趣闲谈,欧美亚洲精品 8区,国产精品久久久久精品免费

搜索歷史

Ampere架構(gòu)標(biāo)志著NVIDIA的重要轉(zhuǎn)折點(diǎn)

評(píng)論