chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

Ampere架構(gòu)標(biāo)志著NVIDIA的重要轉(zhuǎn)折點(diǎn)

我快閉嘴 ? 來(lái)源: 半導(dǎo)體行業(yè)觀察 ? 作者: 半導(dǎo)體行業(yè)觀察 ? 2020-09-07 12:22 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

Ampere架構(gòu)將為GeForce RTX 3090,GeForce RTX 3080,GeForce RTX 3070和其他即將推出的Nvidia GPU提供動(dòng)力。它代表了Team Green的下一次重大升級(jí),因?yàn)檫@次在性能上它有可能實(shí)現(xiàn)巨大飛躍。該顯卡將于本月晚些時(shí)候上市,而3070要等到10月份。根據(jù)當(dāng)前消息,這些GPU可以輕松遷移至我們的GPU層次結(jié)構(gòu)的頂部,并將一些最好的顯卡淘汰一兩個(gè)。下文將詳細(xì)介紹Ampere架構(gòu),主要內(nèi)容包括規(guī)格,功能和其他性能增強(qiáng)。

Ampere架構(gòu)標(biāo)志著NVIDIA的重要轉(zhuǎn)折點(diǎn)。這是該公司的首款7納米GPU,或用于消費(fèi)類零件的8納米GPU。無(wú)論以何種方式,制程減小都能使其在比以前更小的面積內(nèi)封裝更多的晶體管。它也是第二代消費(fèi)者光線追蹤和第三代深度學(xué)習(xí)硬件。較雄昂的制程為Nvidia極大程度上改進(jìn)以前的RTX 20系列硬件和技術(shù)創(chuàng)造了條件。

我們知道Ampere架構(gòu)將在即將到來(lái)的GeForce RTX 3090,RTX 3080和RTX 3070顯卡中得到應(yīng)用(預(yù)計(jì)明年RTX 3060和RTX 3050發(fā)布)。它也是Nvidia A100數(shù)據(jù)中心GPUs的一部分,該GPUs是完全獨(dú)立的硬件。在這里,我們將逐步分析Ampere體系結(jié)構(gòu)的消費(fèi)者和數(shù)據(jù)中心的變體,然后深入探討其中的一些差異。

Nvidia的Ampere GPU發(fā)布感覺就像是2016年的Pascal和2018年的Turing GPus的融合。Nvidia首席執(zhí)行官黃仁勛(Jensen Huang)于5月14日發(fā)布了用于數(shù)據(jù)中心的A100,讓我們了解到即將推出的產(chǎn)品的官方消息,但A100不是為GeForce卡設(shè)計(jì)的。A100替代了Volta GV100,而GV100替代了GP100。消費(fèi)類模型具有不同的功能集,并由單獨(dú)的GPU(如GA102,GA103等)提供支持。消費(fèi)類顯卡還使用GDDR6X / GDDR6,而A100使用HBM2。

除了底層的GPU架構(gòu),Nvidia還改進(jìn)了核心圖形卡設(shè)計(jì),重點(diǎn)放在散熱和功耗上。正如Nvidia在視頻中所描述,“每當(dāng)我們談?wù)揋PU性能時(shí),其實(shí)就是在講我們可以賦予和散去的功率,這種功率越大,性能就越好?!苯?jīng)過(guò)改進(jìn)的散熱解決方案,風(fēng)扇和PCB(印刷電路板)都是改善Nvidia Ampere GPU整體性能計(jì)劃的一部分。當(dāng)然,第三方設(shè)計(jì)可以自由調(diào)整Nvidia的設(shè)計(jì)。

隨著臺(tái)積電從12nm FinFET節(jié)點(diǎn)轉(zhuǎn)移到臺(tái)積電N7和三星N8,許多人期望Ampere在更低的功耗水平下提供更好的性能。與之相反的是,Nvidia以多多益善的方式采取了所有額外的晶體管并且提升功率(至少在產(chǎn)品堆棧的頂部是如此)。例如,GA100擁有540億個(gè)晶體管,其方形芯片尺寸是826mm。與GV100相比,晶體管數(shù)量增加了156%,而die尺寸僅增加了1.3%。我們預(yù)計(jì)消費(fèi)類GPU也會(huì)有類似的變化。

雖然7nm / 8nm在相同性能下確實(shí)可以有更高的功率,但其在相同功率下也可以表現(xiàn)出更好的性能。Nvidia邁出了一步,并在更高的功率水平下提供了更高的性能。V100數(shù)據(jù)中心模型的功率是300W,而新發(fā)布的Nvidia A100則將其提高到400W。我們?cè)谙M(fèi)者模型上得到了相同的結(jié)果。GeForce RTX 2080 Ti的功率為250 / 260W,Titan RTX的功率為280W。有傳言稱RTX 3090超越了它,并配備有歷史最高的TDP,可用于350W功率的單個(gè)GPU(顯然不包括A100)。

這對(duì)終端用戶意味著什么?除了可能需要升級(jí)電源以及在Nvidia自己的型號(hào)上使用12針電源連接器之外,還意味著性能的度量標(biāo)準(zhǔn)會(huì)做出相應(yīng)改變。在我的印象中,這次是Nvidia性能上最大的單代提升。Nvidia表示,結(jié)合即將進(jìn)行的體系結(jié)構(gòu)更新,RTX 3080的性能是RTX 2080的兩倍。如果這些工作負(fù)載包括光線跟蹤和/或DLSS,那么差距可能會(huì)更大。

值得慶幸的是,最終價(jià)格不會(huì)比上一代GPU差很多(這取決于定價(jià)的比較方式)。GeForce RTX 3090的首發(fā)價(jià)為1,499美元,創(chuàng)下了單GPU的 GeForce顯卡的記錄,有效取代了Titan系列。RTX 3080的價(jià)格為699美元,RTX 3070的價(jià)格為499美元,與上一代RTX 2080 Super和RTX 2070 Super保持相同的價(jià)格。Ampere架構(gòu)是否價(jià)格公道?我們需要再作等待才能實(shí)際測(cè)試硬件,但是這些規(guī)格至少看起來(lái)非常有吸引力。

Ampere GA100使Nvidia以前的GPU相形見絀,其晶體管的數(shù)量是GV100的2.5倍。

Nvidia Ampere體系結(jié)構(gòu)規(guī)格

除了用于數(shù)據(jù)中心的GA100之外,Nvidia還計(jì)劃在2020年至少再推出三個(gè)Ampere GPU。來(lái)年,可能還會(huì)有多達(dá)三個(gè)額外的Ampere解決方案,盡管這些解決方案尚未得到證實(shí)。

規(guī)格最大并且性能最差的GPU是A100。它具有多達(dá)128個(gè)SM和6個(gè)8GB的HBM2堆棧,其中Nvidia A100當(dāng)前僅啟用108個(gè)SM和五個(gè)HBM2堆棧。未來(lái)的版本可能具有完整的GPU和RAM配置。但是,GA100不會(huì)像普通的GP100和GV100那樣僅用作數(shù)據(jù)中心和工作站,而是成為消費(fèi)類產(chǎn)品。如果沒有光線追蹤硬件,GA100不會(huì)像GeForce卡那樣遙不可及(因?yàn)闊o(wú)需考慮大型裸片,HBM2和硅中介層的成本)。

在把方向下調(diào)至消費(fèi)者模型后,Nvidia進(jìn)行了一些重大更改。我們還沒有完整的外觀,但是Nvidia顯然使每個(gè)SM的CUDA內(nèi)核數(shù)量增加了一倍,從而在著色器性能上取得了巨大的進(jìn)步。有了GA102和RTX 3090,Nvidia可能會(huì)削減相對(duì)于GA100軸上兩個(gè)SM集群,從而保留96個(gè)SM的最大配置。其中,RTX 3090僅啟用了82個(gè)。HBM2和硅中介層也消失了,取而代之的是12個(gè)GDDR6X芯片。

每個(gè)SM的CUDA內(nèi)核增加一倍之后(相當(dāng)于10496個(gè)CUDA內(nèi)核),每個(gè)SM可能有兩個(gè)支持FP64的CUDA內(nèi)核。Nvidia去除了剩余的FP64功能,并在其位置添加了第二代RT內(nèi)核。至于四個(gè)第三代Tensor核心,其中每個(gè)核心的吞吐量是上一代Turing Tensor核心的每時(shí)鐘吞吐量的四倍。1700 MHz的boost頻率可提供FP32計(jì)算性能的35.7 TFLOPS,而19.5 Gbps GDDR6X可提供936 GBps的帶寬。大致來(lái)講,RTX 3090的性能可能會(huì)是RTX 2080 Ti的兩倍以上。

值得注意的是,目前有一大批SM被禁用。將來(lái)是否會(huì)完全啟用GA102的Titan卡?當(dāng)然如此。也許它還將配備21 Gbps內(nèi)存,并配上相應(yīng)的高價(jià)。(友情提示:即便你壕氣沖天,也不要為了游戲而購(gòu)買Titan GPU。3-5%的性能提升絕對(duì)不值這個(gè)價(jià)。)

相對(duì)于GA102,GA103做出了進(jìn)一步修整。目前GA103有6個(gè)SM集群,最多72個(gè)SM。RTX 3080使用幾乎完整的GA103,其有68個(gè)SM和8704 CUDA內(nèi)核,而我們認(rèn)為RTX 3070使用僅具有46個(gè)active SM和5888 CUDA內(nèi)核的harvest芯片(可能是GA104,但這并不重要)。3080還具有10GB的GDDR6X內(nèi)存和320位總線,而3070禁用了兩個(gè)通道,最終在256位的總線上具有8GB的GDDR6內(nèi)存。

與前幾代產(chǎn)品不同,所有三個(gè)RTX 30系列GPU的工作頻率都較為相似:1700-1730MHz。從理論性能上講,RTX 3080可以完成29.8 TFLOPS,并具有760 GBps的帶寬,Nvidia表示它的速度是即將發(fā)布的RTX 2080的兩倍。

同時(shí),RTX 3070提供20.4 TFLOPS和512 GBps的帶寬。Nvidia表示RTX 3070的最終運(yùn)行速度也將比RTX 2080 Ti快,盡管在某些情況下11GB與8GB VRAM相比,會(huì)讓前重量級(jí)冠軍略勝一籌。同樣,架構(gòu)上的改進(jìn)肯定會(huì)有所幫助。

現(xiàn)在我們開始討論Ampere架構(gòu)。

A100是Nvidia有史以來(lái)規(guī)格最大的GPU,相比之下各種消費(fèi)類芯片要小得多

英偉達(dá)的GA100 Ampere架構(gòu)

隨著GA100和Nvidia A100的發(fā)布以及GeForce RTX 30系列的面世,我們現(xiàn)在對(duì)預(yù)期會(huì)有一個(gè)很好的了解。英偉達(dá)將繼續(xù)擁有兩條獨(dú)立的GPU系列,其中一條專注于數(shù)據(jù)中心和深度學(xué)習(xí),另一條專注于圖形和游戲。數(shù)據(jù)中心GA100所做的一些更改會(huì)延伸至消費(fèi)類產(chǎn)品線,但這并沒有擴(kuò)展到FP64的Tensor核心增強(qiáng)功能。這就是我們對(duì)Ampere架構(gòu)始于GA100的了解。

首先,GA100包含許多新內(nèi)容。從較高的角度來(lái)看,GPU已從GV100中的最多80個(gè)SMs / 5120 CUDA內(nèi)核增加到GA100中的128個(gè)SMs / 8192 CUDA內(nèi)核。雖然核心數(shù)量增加了60%,但GA100使用的晶體管數(shù)量是其2.56倍。所有這些額外的晶體管都用于增強(qiáng)架構(gòu)。如果您想深入了解所有細(xì)節(jié),請(qǐng)查看Nvidia的A100 Architecture白皮書,我們只對(duì)其進(jìn)行簡(jiǎn)要總結(jié)。

GA100中的Tensor核心取得了最重要的升級(jí)。上一代GV100 Tensor內(nèi)核在兩個(gè)4x4 FP16矩陣上運(yùn)行,并且可以計(jì)算兩個(gè)矩陣的4x4x4融合乘加(FMA),每個(gè)周期具有第三個(gè)矩陣。每個(gè)Tensor內(nèi)核每個(gè)周期可以進(jìn)行128個(gè)浮點(diǎn)運(yùn)算,而Nvidia將GV100評(píng)為FP16的125 TFLOPS峰值吞吐量。相比之下,GA100 Tensor內(nèi)核每個(gè)工作頻率可以完成8x4x8 FMA矩陣運(yùn)算,每個(gè)Tensor內(nèi)核總共可以進(jìn)行256 FMA或512 FP(吞吐量是其四倍)。即使它每個(gè)SM的Tensor內(nèi)核數(shù)量只有上一代GV100 Tensor內(nèi)核的一半,但它仍然是上一代GV100 Tensor內(nèi)核每個(gè)SM的性能的兩倍。

GA100還增加了對(duì)Tensor內(nèi)核稀疏性的支持。該改進(jìn)考慮到許多深度學(xué)習(xí)操作最終會(huì)產(chǎn)生一堆不再重要的加權(quán)值,因此隨著訓(xùn)練的進(jìn)行,這些值基本上可以忽略。稀疏性將Tensor核心吞吐量提高了一倍。FP16的Nvidia A100的額定值為312 TFLOPS,而有稀疏性支持的Tensor 內(nèi)核則為624 TFLOPS。

除了大幅提高原始吞吐量外,GA100 Tensor內(nèi)核還增加了對(duì)更低精度的INT8,INT4和二進(jìn)制Tensor運(yùn)行的支持。INT8容許具有稀疏性的624 TOPS和 1248 TOPS,而INT4則將其翻倍,達(dá)到了1248/2496 TOPS。二進(jìn)制模式不支持稀疏性,可能用途有限,但是A100可以在該模式下進(jìn)行4992 TOPS。

另一方面,A100中的Tensor內(nèi)核也支持FP64指令。FP64的性能在19.5 TFLOPS時(shí)遠(yuǎn)低于FP16。但是,對(duì)于FP64工作負(fù)載,它仍然比GV100的最大FP64吞吐量快2.5倍。

最后一點(diǎn),A100添加了兩種新的浮點(diǎn)格式。BF16(Bfloat16)已被其他一些深度學(xué)習(xí)加速器(例如Google的TPUv4)使用。就像FP16一樣,BF16使用16位,但是使用8位指數(shù)和7位尾數(shù)進(jìn)行轉(zhuǎn)換,匹配FP32的8位指數(shù)范圍,同時(shí)降低了精度。事實(shí)已經(jīng)證明,這可以提供比普通FP16格式更好的訓(xùn)練和模型精度。第二種格式是Nvidia在Tensor Float 32(TF32)上的格式,該格式保留8位指數(shù),但將尾數(shù)擴(kuò)展到10位,使FP16的精度與FP32的范圍相匹配。TF32的性能也與FP16相同,因此深度學(xué)習(xí)仿真的額外精度基本上是“免費(fèi)”的。

哇,這是一個(gè)具有公制對(duì)接晶體管的大芯片!

Tensor的核心增強(qiáng)功能很多,這也表明了Nvidia在GA100上的重心。深度學(xué)習(xí)和超級(jí)計(jì)算工作負(fù)載的性能大大提高。GA100還具有其他一些體系結(jié)構(gòu)更新,我們將在此處作簡(jiǎn)要介紹。SM晶體管的數(shù)量增加了50-60%,所有這些晶體管都必須放在某個(gè)地方。

多實(shí)例GPU(MIG)是一項(xiàng)新功能。這使得單個(gè)A100可以劃分為多達(dá)七個(gè)獨(dú)立的虛擬GPU。每個(gè)虛擬GPU(使用Tensor操作運(yùn)行推理工作負(fù)載)都可能與單個(gè)GV100的性能相匹配,從而極大地增加了云服務(wù)提供商的橫向擴(kuò)展機(jī)會(huì)。

每個(gè)SM的A100 L1高速緩存大了50%,與V100上的128KB相比為192KB。L2緩存的增加幅度更大,從V100的6MB增加到A100的40MB。它還具有新的分區(qū)交叉開關(guān)結(jié)構(gòu),可提供GV100 L2緩存的讀取帶寬的2.3倍。請(qǐng)注意,總的HBM2內(nèi)存“僅”從GV100的16GB或32GB增加到GA100的40GB,但是增加的L1和L2緩存有助于更好地優(yōu)化內(nèi)存性能。

NVLink性能也幾乎翻了一番,從GV100中的每個(gè)信號(hào)對(duì)25.78 Gbps到GA100中的50 Gbps。A100中的單個(gè)NVLink在每個(gè)方向上提供25 GBps的速率,類似于GV100,但每個(gè)鏈路具有一半的信號(hào)對(duì)。鏈接總數(shù)也增加了一倍,達(dá)到12條,從而使NVLink總帶寬在A100下為600 GBps,而在V100下為300 GBps。此外還提供了PCIe Gen4支持,幾乎使x16連接的帶寬增加了一倍(從15.76 GBps到31.5 GBps)。

最后,A100添加了新的異步副本,異步屏障和任務(wù)圖加速。異步副本可提高內(nèi)存帶寬效率并減少寄存器文件帶寬,并且可以在SM執(zhí)行其他工作時(shí)在后臺(tái)完成。硬件加速障礙為CUDA開發(fā)人員提供了更大的靈活性和性能,并且任務(wù)圖加速有助于優(yōu)化向GPU提交的工作。

還有其他體系結(jié)構(gòu)增強(qiáng),例如NVJPG解碼可加速JPG解碼,以用于基于圖像的算法的深度學(xué)習(xí)訓(xùn)練。A100包含5核硬件JPEG解碼引擎,該引擎可勝過(guò)基于CPU的JPEG解碼并減輕PCIe擁塞。同樣,A100添加了五個(gè)NVDEC(Nvidia解碼)單元,以加速常見視頻流格式的解碼,這有助于與視頻一起使用的深度學(xué)習(xí)和推理應(yīng)用的端到端吞吐量。

介紹完了GA100和Nvidia A100架構(gòu)之后,以下將介紹消費(fèi)類GeForce RTX卡的Ampere架構(gòu)變化。

Nvidia GA102 / GA103 Ampere架構(gòu)

與GV100相比,GA100進(jìn)行了大量更改,而在消費(fèi)類方面,更新同樣顯著。以上對(duì)Tensor核心的許多更改都直接帶入了消費(fèi)類模型(自然很可能會(huì)減去FP64)。除了支持Micron的新GDDR6X存儲(chǔ)器(而不是HBM2)之外,其他主要更改還包括光線跟蹤和CUDA內(nèi)核。

Nvidia在2018年使用Turing架構(gòu)和GeForce RTX 20系列GPU在光線追蹤方面引起了很多爭(zhēng)議。兩年過(guò)去了……好吧,說(shuō)實(shí)話:游戲中的光線追蹤并沒有真正發(fā)揮其潛力?!稇?zhàn)地風(fēng)云5》具有更好的反射效果,《古墓麗影》和《使命召喚》的陰影得到了改善,《地鐵出埃及記》使用了RT全局照明,并且在每種情況下,性能的下降都使視覺效果有了相對(duì)較小的提高。迄今為止,關(guān)于光線追蹤可以做什么,最好的例子可以說(shuō)是“控制游戲”,該游戲使用RT效果進(jìn)行反射,陰影和漫射照明。它看起來(lái)相當(dāng)不錯(cuò),盡管您可能抱有期望,但其對(duì)性能的影響仍然很大。

究竟有多大呢?對(duì)于RTX 2080 Ti和Core i9-9900K,在1440p和最高質(zhì)量下運(yùn)行Control且沒有光線追蹤的情況下,其性能為80 fps(這是我們?cè)诒疚闹袆倓偼瓿傻臏y(cè)試)。打開所有光線跟蹤功能之后,七性能降低到43 fps,慢47%,或基本上降低一半。盡管您可以通過(guò)啟用DLSS 2.0來(lái)緩解問題,但該功能在質(zhì)量模式下可渲染為1707x960,并可以放大到1440p。但這會(huì)帶來(lái)一個(gè)痛苦的代價(jià):性能降回72 fps。

還有“全路徑跟蹤”的演示,其中硬件進(jìn)一步推向了更高的位置。以Quake II或Minecraft之類的相對(duì)古老且低保真的游戲?yàn)槔?,再添加照明,陰影,反射,折射等全光線追蹤效果。而且,結(jié)果可能是60 fps,而不是每秒數(shù)百幀。這還是在以至少1080p的RTX 2070 Super啟用DLSS的情況(這已經(jīng)到達(dá)質(zhì)量水平)。

或許有人認(rèn)為光線跟蹤效果對(duì)性能造成的損失太大, Nvidia應(yīng)該反其道而行之。但是說(shuō)這類話的人對(duì)Nvida不是很了解。據(jù)Nvidia稱,GeForce 256是第一個(gè)GPU,它還將硬件轉(zhuǎn)換和照明計(jì)算引入了消費(fèi)類硬件。大多數(shù)游戲要幾年后才能正確使用這些功能。第一批帶有著色器的GPU早在數(shù)年之前就已經(jīng)普遍使用該硬件,但是今天幾乎所有發(fā)行的游戲都廣泛使用了著色器技術(shù)。Nvidia認(rèn)為光線追蹤會(huì)有一個(gè)類似的演變過(guò)程。

好消息是,采用Ampere架構(gòu)的光線追蹤性能正在迅速崛起。Nvidia表示,與RTX 2080 Ti的34 TFLOPS相比,RTX 3080可以進(jìn)行58 TFLOPS的光線跟蹤計(jì)算。換句話說(shuō),光線追蹤的速度快了1.7倍。2080 Ti的光線三角相交計(jì)算速度達(dá)到每秒11千兆字節(jié),因此RTX 3080可以達(dá)到每秒19千兆字節(jié),而與以往的最佳紀(jì)錄相比,RTX 3090將翻倍甚至更躲。

這對(duì)光線追蹤游戲意味著什么?我們會(huì)很快找到答案,但是根據(jù)我們從Nvidia那里聽到的消息,我們將看到更多的游戲開發(fā)人員增加了光線跟蹤效果。賽博朋克2077將具有光線追蹤的反射,陰影,環(huán)境光遮擋等功能。像Control這樣的游戲可能在啟用所有光線跟蹤效果的情況下運(yùn)行,并且一旦啟用DLSS,相對(duì)于傳統(tǒng)渲染而言,其性能不會(huì)顯著下降,甚至有可能會(huì)表現(xiàn)出性能提升。

Nvidia還從其使用完整路徑跟蹤的Marbles技術(shù)演示中提供了上述指標(biāo)。一個(gè)未命名的Turing GPU(RTX 2080 Ti?)那能夠以720p和25 fps的速度運(yùn)行Marbles,沒有景深,只有一個(gè)圓頂燈和一個(gè)間接光。同時(shí),Ampere(RTX 3090?)可以以1440p和30 fps的速度運(yùn)行演示,并啟用了景深和130個(gè)區(qū)域照明燈。結(jié)果是無(wú)論使用什么實(shí)際的GPU,都有可能將光線追蹤提升到一個(gè)全新的水平。

當(dāng)然,這不僅與光線追蹤有關(guān)。英偉達(dá)還在DLSS上加倍努力,而且由于擁有更強(qiáng)大的Tensor內(nèi)核,所以質(zhì)量和性能應(yīng)該比以前更好。我們即將實(shí)現(xiàn)質(zhì)量模式下的DLSS 2.0看起來(lái)比使用TAA或SMAA的本機(jī)渲染效果更好。不難想象,許多游戲玩家選擇啟用DLSS來(lái)獲得健康的性能提升。

由于Ampere對(duì)8K顯示器具有本機(jī)支持,因此得益于HDMI 2.1,DLSS變得更加重要。什么樣的硬件能夠以絕佳的性能水平為8K提供動(dòng)力?這很容易:打開DLSS并使用RTX 3090或RTX 3080以4K渲染。這是8K渲染嗎?當(dāng)然不是。但這是個(gè)無(wú)關(guān)緊要的問題。

當(dāng)然,8K顯示器的價(jià)格仍然高得驚人,如果您坐在沙發(fā)上,幾乎不可能看到4K和8K之間的差異。另外,如果您像我一樣視力老化,那這種可能性為零。但是在家庭影院領(lǐng)域,營(yíng)銷力量很強(qiáng)大,因此我們可以肯定將來(lái)8K電視會(huì)以更大的推動(dòng)力向前發(fā)展(這正是消費(fèi)電子公司試圖說(shuō)服所有4K HDR電視所有者做出升級(jí)的方式)。

Nvidia Ampere架構(gòu):第二輪光線追蹤

毫無(wú)疑問,現(xiàn)在使用Nvidia的RTX 20系列GPU的人會(huì)有一種受到欺騙的感覺。如果幾個(gè)月前您沒有收到我們所提出的關(guān)于等待購(gòu)買新GPU直到Ampere發(fā)布的建議,那么看到RTX 30系列規(guī)格和Ampere架構(gòu)可能會(huì)給您帶來(lái)更大的損失。問題在于,我們始終知道這一天會(huì)到來(lái)。就像Turing取代Pascal,Pascal取代Maxwell,Maxwell又取代Kepler一樣,GPU世界的迭代更新之路也在穩(wěn)定發(fā)展。

另一方面,如果您在過(guò)去幾年中一直對(duì)游戲中的光線追蹤持懷疑態(tài)度,Ampere可能最終會(huì)成功說(shuō)服您嘗試一下。然后您又拖一個(gè)月左右,想看看AMD的Big Navi表現(xiàn)?,F(xiàn)實(shí)情況是,我們將看到更多支持某種形式的光線追蹤的游戲,尤其是計(jì)劃于今年秋天推出的下一代PlayStation 5和Xbox Series X控制臺(tái)。我們有望在足夠的硬件實(shí)力的支持下,游戲的光線追蹤效果具有現(xiàn)實(shí)意義。

可以肯定的一件事是:光線追蹤不會(huì)消失。它幾乎已經(jīng)成為每部電影的重要組成部分,雖然目前還不是游戲與2020年好萊塢的電影競(jìng)爭(zhēng)的時(shí)候,但他們也許可以追趕2000年代的好萊塢。目前,實(shí)時(shí)游戲通常希望每個(gè)像素僅使用幾條光線,以更好地貼近現(xiàn)實(shí)光線的表現(xiàn)方式。相比之下,好萊塢每個(gè)像素可能使用數(shù)千條光線(或路徑)。具有光線追蹤硬件的GPU仍處于早期階段,但是如果Nvidia(以及AMD和Intel)可以繼續(xù)升級(jí)我們的GPU,那么游戲和電影之間的差距將只會(huì)縮小。

Nvidia尚未透露所有關(guān)于Ampere架構(gòu)更改的消息,因此我們后續(xù)將在了解更多信息后做出更新。
責(zé)任編輯:tzh

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • 印刷電路板
    +關(guān)注

    關(guān)注

    4

    文章

    863

    瀏覽量

    36884
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5099

    瀏覽量

    134468
  • 帶寬
    +關(guān)注

    關(guān)注

    3

    文章

    1029

    瀏覽量

    43025
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    NVIDIA推出NVQLink高速互連架構(gòu)

    NVIDIA 推出 NVIDIA NVQLink,這是一種開放式系統(tǒng)架構(gòu),可將 GPU 計(jì)算的極致性能與量子處理器緊密結(jié)合,以構(gòu)建加速的量子超級(jí)計(jì)算機(jī)。
    的頭像 發(fā)表于 11-03 14:53 ?484次閱讀

    英偉達(dá)與意法半導(dǎo)體合作實(shí)現(xiàn)數(shù)據(jù)中心領(lǐng)域重要突破

    ????????近期,英偉達(dá)(NVIDIA)已完成對(duì)意法半導(dǎo)體(ST)12kW配電概念驗(yàn)證板的設(shè)計(jì)驗(yàn)證測(cè)試,這一成果標(biāo)志著該項(xiàng)目正式邁入生產(chǎn)驗(yàn)證測(cè)試階段。
    的頭像 發(fā)表于 10-18 09:38 ?1607次閱讀

    激光雷達(dá)進(jìn)入新時(shí)代,數(shù)字芯片化革命與資本變局正重塑行業(yè)

    激光雷達(dá)市場(chǎng)迎來(lái)加速增長(zhǎng),市場(chǎng)規(guī)模攀升至8.61億美元,2025年激光雷達(dá)機(jī)器人市場(chǎng)迎來(lái)爆發(fā)。在這個(gè)高速增長(zhǎng)的背景下,2025年9月三大標(biāo)志性事件同時(shí)發(fā)生,成為中國(guó)激光雷達(dá)行業(yè)發(fā)展史上的重要分水嶺,徹底改寫了行業(yè)競(jìng)爭(zhēng)格局與發(fā)展軌跡,標(biāo)志
    的頭像 發(fā)表于 09-12 09:29 ?850次閱讀
    激光雷達(dá)進(jìn)入新時(shí)代,數(shù)字芯片化革命與資本變局正重塑行業(yè)

    中科創(chuàng)達(dá)與吉利汽車、NVIDIA聯(lián)合發(fā)布創(chuàng)新產(chǎn)品AIBOX

    產(chǎn)品AIBOX。該方案依托中科創(chuàng)達(dá)滴水AIOS和NVIDIA DRIVE AGX車載計(jì)算平臺(tái),首次實(shí)現(xiàn)7B大模型在車端實(shí)時(shí)流暢運(yùn)行,打造了真正的AI座艙,標(biāo)志著汽車產(chǎn)業(yè)正式進(jìn)入AI大模型實(shí)車量產(chǎn)時(shí)代。
    的頭像 發(fā)表于 09-10 09:05 ?839次閱讀

    振奮人心!星閃技術(shù)納入ITU國(guó)際標(biāo)準(zhǔn),觸覺智能助力星閃硬件生態(tài)

    5月29日,國(guó)際電信聯(lián)盟(ITU)正式將星閃技術(shù)納入無(wú)線接入標(biāo)準(zhǔn),標(biāo)志著中國(guó)通信技術(shù)在國(guó)際標(biāo)準(zhǔn)制定領(lǐng)域?qū)崿F(xiàn)從跟隨到引領(lǐng)的歷史性跨越!星閃技術(shù)是什么?歷史背景:六年前,華為遭遇他國(guó)“實(shí)體清單”打壓
    的頭像 發(fā)表于 06-06 17:58 ?3137次閱讀
    振奮人心!星閃技術(shù)納入ITU國(guó)際標(biāo)準(zhǔn),觸覺智能助力星閃硬件生態(tài)

    NVIDIA與光輪智能合作實(shí)現(xiàn)GR00T N1落地汽車工廠

    光輪智能成功將 NVIDIA GR00T N1 人形機(jī)器人基礎(chǔ)模型部署至汽車制造生產(chǎn)線,這一成果標(biāo)志著具身智能在工業(yè)自動(dòng)化領(lǐng)域的重大突破以及應(yīng)用潛力。
    的頭像 發(fā)表于 05-15 10:45 ?1021次閱讀

    IBM發(fā)布全新AI智能體解決方案

    今天,AI 智能體代表 AI 技術(shù)變革的一個(gè)重要轉(zhuǎn)折點(diǎn),即從聊天工具進(jìn)化成生產(chǎn)力工具,并且具有前所未有的自主性。
    的頭像 發(fā)表于 05-12 14:28 ?880次閱讀

    NVIDIA NVLink 深度解析

    引言 NVIDIA NVLink 是一種關(guān)鍵的高速互連技術(shù),專為加速計(jì)算而設(shè)計(jì),尤其是在多 GPU 系統(tǒng)以及 GPU 和支持 CPU 之間 ^1^。NVLink 的出現(xiàn)標(biāo)志著傳統(tǒng)互連瓶頸的突破,凸顯
    的頭像 發(fā)表于 05-06 18:14 ?4108次閱讀

    軟銀集團(tuán)將收購(gòu)Ampere Computing

    近日,軟銀集團(tuán)公司(TSE:9984,“軟銀集團(tuán)”)宣布,將以 65 億美元的全現(xiàn)金交易方式收購(gòu)領(lǐng)先的獨(dú)立芯片設(shè)計(jì)公司 Ampere Computing。根據(jù)協(xié)議條款,Ampere 將作為軟銀集團(tuán)
    的頭像 發(fā)表于 03-20 17:55 ?994次閱讀

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell架構(gòu)技術(shù)解析

    NVIDIA Blackwell數(shù)據(jù)手冊(cè)與NVIDIA Blackwell 架構(gòu)技術(shù)解析
    的頭像 發(fā)表于 03-20 17:19 ?1703次閱讀

    軟銀接近達(dá)成收購(gòu)Ampere協(xié)議

    。此次交易對(duì)Ampere的估值可能高達(dá)約65億美元,這一數(shù)字包括了Ampere的債務(wù)。這一估值顯示了軟銀對(duì)Ampere在芯片設(shè)計(jì)領(lǐng)域的實(shí)力和潛力的認(rèn)可。 Ampere Computin
    的頭像 發(fā)表于 02-06 14:19 ?698次閱讀

    簡(jiǎn)述NVIDIA Isaac的重要更新

    在 2025 CES,NVIDIA 宣布了對(duì)NVIDIA Isaac的重要更新。NVIDIA Isaac 是一個(gè)由加速庫(kù)、應(yīng)用框架和 AI 模型組成的平臺(tái),可加速 AI 機(jī)器人的開發(fā)。
    的頭像 發(fā)表于 01-17 09:57 ?1759次閱讀
    簡(jiǎn)述<b class='flag-5'>NVIDIA</b> Isaac的<b class='flag-5'>重要</b>更新

    NVIDIA發(fā)布個(gè)人超算利器project digital,標(biāo)志著ai元年的開啟

    上圖NVIDIA公司創(chuàng)始人兼首席執(zhí)行官黃仁勛(JensenHuang)這些年被大家熟知的賽博朋克風(fēng)格一直都是未來(lái)的代言詞,可以承載人類記憶的芯片,甚至能獨(dú)立思考的仿生人,現(xiàn)在,隨著NVIDIA
    的頭像 發(fā)表于 01-16 11:52 ?1034次閱讀
    <b class='flag-5'>NVIDIA</b>發(fā)布個(gè)人超算利器project digital,<b class='flag-5'>標(biāo)志著</b>ai元年的開啟

    MediaTek與NVIDIA攜手打造超級(jí)芯片

    的個(gè)人AI超級(jí)計(jì)算機(jī)項(xiàng)目NVIDIA? Project DIGITS中,標(biāo)志著兩家科技巨頭在AI計(jì)算領(lǐng)域的深度合作。 MediaTek作為全球領(lǐng)先的芯片供應(yīng)商,在智能手機(jī)、智能電視、Android平板
    的頭像 發(fā)表于 01-10 13:49 ?818次閱讀

    MediaTek與NVIDIA攜手打造GB10 Grace Blackwell超級(jí)芯片

    ? Project DIGITS之中,標(biāo)志著兩家科技巨頭在高性能計(jì)算領(lǐng)域的深度合作。 MediaTek作為智能手機(jī)、智能電視、Android平板電腦、語(yǔ)音助理設(shè)備(VAD)以及基于Arm架構(gòu)
    的頭像 發(fā)表于 01-08 15:32 ?1305次閱讀