chinese直男口爆体育生外卖, 99久久er热在这里只有精品99, 又色又爽又黄18禁美女裸身无遮挡, gogogo高清免费观看日本电视,私密按摩师高清版在线,人妻视频毛茸茸,91论坛 兴趣闲谈,欧美 亚洲 精品 8区,国产精品久久久久精品免费

0
  • 聊天消息
  • 系統(tǒng)消息
  • 評(píng)論與回復(fù)
登錄后你可以
  • 下載海量資料
  • 學(xué)習(xí)在線課程
  • 觀看技術(shù)視頻
  • 寫文章/發(fā)帖/加入社區(qū)
會(huì)員中心
創(chuàng)作中心

完善資料讓更多小伙伴認(rèn)識(shí)你,還能領(lǐng)取20積分哦,立即完善>

3天內(nèi)不再提示

兩種GPU之間的延遲對(duì)比 AMD RDNA2完勝NVIDIA安培

ss ? 來(lái)源:快科技 ? 作者:快科技 ? 2021-04-21 13:51 ? 次閱讀
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

CPU緩存與內(nèi)存延遲測(cè)試,相信大家都有所耳聞,但是GPU同樣的測(cè)試卻幾乎沒人做過(guò)。

ChipsAndCheese就做了一次特別的測(cè)試,對(duì)比考察了AMD、NVIDIAGPU架構(gòu)的緩存、顯存遲問(wèn)題。

首先是AMDRDNA2、NVIDIAAmpere兩家最新架構(gòu)的比拼,代表是RX6900XT、RTX3090,前者在幾乎所有階段都完勝。

RNDA2架構(gòu)創(chuàng)新性地加入了InfinityCache無(wú)限緩存,提升帶寬的同時(shí),延遲也可圈可點(diǎn),二級(jí)緩存命中率上只增加了大約20ns的延遲,明顯低于Ampere。

更驚人的是,RDNA2顯存延遲和Ampere幾乎一模一樣,但是別忘了,Ampere只有兩個(gè)層級(jí)的緩存,RDNA2卻有四個(gè)。

Ampere的緩存架構(gòu)更加傳統(tǒng),SM陣列私有一級(jí)緩存到二級(jí)緩存要增加超過(guò)100ns的延遲,RDNA2從零級(jí)緩存到二級(jí)緩存則只增加了約66ns。看起來(lái),GA102核心面積過(guò)大,也直接增加了延遲。

這正好可以解釋AMDRDNA2架構(gòu)在低分辨率下性能、能效更優(yōu)秀,因?yàn)槎?jí)緩存、三級(jí)緩存延遲很低,更適合執(zhí)行較小的負(fù)載。Ampere則相反,高負(fù)載下優(yōu)勢(shì)明顯,比如說(shuō)4K分辨率。

說(shuō)完了GPU之間的對(duì)比,那么GPU、CPU放在一起怎么樣呢?這里以RX6900XT、Intel四代酷睿i7-4770為例來(lái)看看。

CPU的緩存自然不是一個(gè)級(jí)別的,所以這里Y軸用了線性數(shù)據(jù),可以看到全程大大低于RDNA2,搭配DDR3-1600CL9內(nèi)存延遲只有63ns,RX6900XT、GDDR6的組合則有226ns,另外末級(jí)緩存平均延遲分別是53.42ns、123.2ns。

再看看前幾代的NVIDIAGPU,包括Maxwell架構(gòu)的GTX980Ti、Pascal架構(gòu)的GTX1080、Turing架構(gòu)的RTX2060Mobile。

Maxwell、Pascal其實(shí)差不多,前者整體略高一些,可能是受制于芯片面積較大、核心頻率較低。

Turing則已經(jīng)有了Ampere的樣子,一級(jí)緩存延遲低得多,二級(jí)差不多,奇怪的是顯存延遲在32MB之后偏高,原因未知。

AMD考察了TeraScale架構(gòu)的HD5850/6950、GCN架構(gòu)的HD7970,再加上RX6900XT,很明顯在逐代降低,而且是各級(jí)緩存都在同時(shí)進(jìn)步。

編輯:jq

聲明:本文內(nèi)容及配圖由入駐作者撰寫或者入駐合作網(wǎng)站授權(quán)轉(zhuǎn)載。文章觀點(diǎn)僅代表作者本人,不代表電子發(fā)燒友網(wǎng)立場(chǎng)。文章及其配圖僅供工程師學(xué)習(xí)之用,如有內(nèi)容侵權(quán)或者其他違規(guī)問(wèn)題,請(qǐng)聯(lián)系本站處理。 舉報(bào)投訴
  • amd
    amd
    +關(guān)注

    關(guān)注

    25

    文章

    5667

    瀏覽量

    139428
  • cpu
    cpu
    +關(guān)注

    關(guān)注

    68

    文章

    11250

    瀏覽量

    223855
  • 數(shù)據(jù)
    +關(guān)注

    關(guān)注

    8

    文章

    7324

    瀏覽量

    94289
  • gpu
    gpu
    +關(guān)注

    關(guān)注

    28

    文章

    5150

    瀏覽量

    134748
收藏 人收藏
加入交流群
微信小助手二維碼

掃碼添加小助手

加入工程師交流群

    評(píng)論

    相關(guān)推薦
    熱點(diǎn)推薦

    ADI GMSL技術(shù)兩種視頻數(shù)據(jù)傳輸模式的區(qū)別

    本文深入介紹GMSL技術(shù),重點(diǎn)說(shuō)明用于視頻數(shù)據(jù)傳輸?shù)南袼啬J胶退淼滥J?b class='flag-5'>之間的差異。文章將闡明這兩種模式之間的主要區(qū)別,并探討成功實(shí)施需要注意的具體事項(xiàng)。
    的頭像 發(fā)表于 10-10 13:49 ?2110次閱讀
    ADI GMSL技術(shù)<b class='flag-5'>兩種</b>視頻數(shù)據(jù)傳輸模式的區(qū)別

    AMD Vivado IP integrator的基本功能特性

    我們還將帶您了解在 AMD Zynq UltraScale+ MPSoC 開發(fā)板與 AMD Versal 自適應(yīng) SoC 開發(fā)板上使用 IP integrator 時(shí),兩種設(shè)計(jì)流程之間
    的頭像 發(fā)表于 10-07 13:02 ?2009次閱讀
    <b class='flag-5'>AMD</b> Vivado IP integrator的基本功能特性

    NVIDIA Isaac Lab多GPU多節(jié)點(diǎn)訓(xùn)練指南

    NVIDIA Isaac Lab 是一個(gè)適用于機(jī)器人學(xué)習(xí)的開源統(tǒng)一框架,基于 NVIDIA Isaac Sim 開發(fā),其模塊化高保真仿真適用于各種訓(xùn)練環(huán)境,可提供各種物理 AI 功能和由 GPU 驅(qū)動(dòng)的物理仿真,縮小仿真與現(xiàn)實(shí)世
    的頭像 發(fā)表于 09-23 17:15 ?2239次閱讀
    <b class='flag-5'>NVIDIA</b> Isaac Lab多<b class='flag-5'>GPU</b>多節(jié)點(diǎn)訓(xùn)練指南

    兩種散熱路徑的工藝與應(yīng)用解析

    背景:兩種常見的散熱設(shè)計(jì)思路 在大電流或高功率器件應(yīng)用中,散熱和載流能力是PCB設(shè)計(jì)中必須解決的難題。常見的兩種思路分別是: 厚銅板方案:通過(guò)整體增加銅箔厚度(如3oz、6oz甚至更高),增強(qiáng)導(dǎo)熱
    的頭像 發(fā)表于 09-15 14:50 ?647次閱讀

    NVIDIA RTX PRO 4500 Blackwell GPU測(cè)試分析

    今天我們帶來(lái)全新 NVIDIA Blackwell 架構(gòu) GPU —— NVIDIA RTX PRO 4500 Blackwell 的測(cè)試,對(duì)比上一代產(chǎn)品
    的頭像 發(fā)表于 08-28 11:02 ?3677次閱讀
    <b class='flag-5'>NVIDIA</b> RTX PRO 4500 Blackwell <b class='flag-5'>GPU</b>測(cè)試分析

    NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品

    NVIDIA 桌面 GPU 系列擴(kuò)展,推出 NVIDIA RTX PRO 4000 SFF Edition GPU 和 RTX PRO 2000 Blackwell
    的頭像 發(fā)表于 08-18 11:50 ?1260次閱讀

    aicube的n卡gpu索引該如何添加?

    請(qǐng)問(wèn)有人知道aicube怎樣才能讀取n卡的gpu索引呢,我已經(jīng)安裝了cuda和cudnn,在全局的py里添加了torch,能夠調(diào)用gpu,當(dāng)還是只能看到默認(rèn)的gpu0,顯示不了gpu1
    發(fā)表于 07-25 08:18

    NVIDIA Blackwell GPU優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小延遲場(chǎng)景中的性能紀(jì)錄

    本文將探討 NVIDIA TensorRT-LLM 如何基于 8 個(gè) NVIDIA Blackwell GPU 的配置,打破 DeepSeek-R1 在最小延遲場(chǎng)景中的性能紀(jì)錄:在 G
    的頭像 發(fā)表于 07-02 19:31 ?3112次閱讀
    <b class='flag-5'>NVIDIA</b> Blackwell <b class='flag-5'>GPU</b>優(yōu)化DeepSeek-R1性能 打破DeepSeek-R1在最小<b class='flag-5'>延遲</b>場(chǎng)景中的性能紀(jì)錄

    【「算力芯片 | 高性能 CPU/GPU/NPU 微架構(gòu)分析」閱讀體驗(yàn)】+NVlink技術(shù)從應(yīng)用到原理

    兩種結(jié)構(gòu): ①GPU-GPU ②CPU-GPU 這是書中介紹的一個(gè)包括了個(gè)完全通過(guò)NVlink連接的8 GPU混合立方網(wǎng)狀拓?fù)浣Y(jié)構(gòu): N
    發(fā)表于 06-18 19:31

    銣原子鐘與CPT原子鐘:兩種時(shí)間標(biāo)準(zhǔn)的區(qū)別

    在物理學(xué)的世界中,精密的時(shí)間測(cè)量是至關(guān)重要的。這就需要一個(gè)高度準(zhǔn)確且穩(wěn)定的時(shí)間標(biāo)準(zhǔn),這就是原子鐘。今天我們將探討兩種重要的原子鐘:銣原子鐘和CPT原子鐘,以及它們之間的主要區(qū)別。首先,我們來(lái)了解一下
    的頭像 發(fā)表于 05-22 15:49 ?631次閱讀
    銣原子鐘與CPT原子鐘:<b class='flag-5'>兩種</b>時(shí)間標(biāo)準(zhǔn)的區(qū)別

    使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)

    NVIDIA GTC 推出新一代專業(yè)級(jí) GPU 和 AI 賦能的開發(fā)者工具—同時(shí),ChatRTX 更新現(xiàn)已支持 NVIDIA NIM,RTX Remix 正式結(jié)束測(cè)試階段,本月的 NVIDIA
    的頭像 發(fā)表于 03-28 09:59 ?1200次閱讀

    專訪AMD王啟尚 從RDNA 4到FSR 4,AMD GPU技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    在近日于珠海舉辦的AMD新一代Radeon RX 9070系列顯卡發(fā)布會(huì)后,AMD GPU技術(shù)與工程研發(fā)副總裁王啟尚接受了我們的專訪。在本次交談中,他詳細(xì)分享了RDNA 4架構(gòu)的設(shè)計(jì)理
    的頭像 發(fā)表于 03-06 11:19 ?781次閱讀
    專訪<b class='flag-5'>AMD</b>王啟尚 從<b class='flag-5'>RDNA</b> 4到FSR 4,<b class='flag-5'>AMD</b> <b class='flag-5'>GPU</b>技術(shù)創(chuàng)新引領(lǐng)行業(yè)新發(fā)展

    NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對(duì)比

    基于大眾所熟知的 NVIDIA Ada Lovelace 架構(gòu),NVIDIA RTX 4500 Ada Generation是一款介于 NVIDIA RTX 4000 Ada 和 NVIDIA
    的頭像 發(fā)表于 03-05 10:30 ?4340次閱讀

    借助PerfXCloud和dify開發(fā)代碼轉(zhuǎn)換器

    隨著深度學(xué)習(xí)與高性能計(jì)算的迅速發(fā)展,GPU計(jì)算的廣泛應(yīng)用已成為推動(dòng)技術(shù)革新的一股重要力量。對(duì)于GPU編程語(yǔ)言的選擇,CUDA和HIP是目前最為流行的兩種選擇。CUDA是由NVIDIA
    的頭像 發(fā)表于 02-25 09:36 ?1521次閱讀
    借助PerfXCloud和dify開發(fā)代碼轉(zhuǎn)換器

    納米銅燒結(jié)為何納米銀燒結(jié)?

    在半導(dǎo)體功率模塊封裝領(lǐng)域,互連技術(shù)一直是影響模塊性能、可靠性和成本的關(guān)鍵因素。近年來(lái),隨著納米技術(shù)的快速發(fā)展,納米銀燒結(jié)和納米銅燒結(jié)技術(shù)作為兩種新興的互連技術(shù),備受業(yè)界關(guān)注。然而,在眾多應(yīng)用場(chǎng)景中
    的頭像 發(fā)表于 02-24 11:17 ?1885次閱讀
    納米銅燒結(jié)為何<b class='flag-5'>完</b><b class='flag-5'>勝</b>納米銀燒結(jié)?