越來越多的應(yīng)用正在使用 AI 加速,而無論工作站的大小或形態(tài)如何,都有越來越多的用戶需要 AI 性能。NVIDIA RTX PRO 2000 Blackwell是全新 NVIDIA Blackwell 架構(gòu) GPU 中的中端專業(yè)圖形卡,高度僅為全高 GPU 的二分之一。如果您需要的是一塊半高顯卡,能適配小機(jī)箱,功耗不高,還要具備 AI 及光線追蹤性能的話,那么 RTX PRO 2000 是很好的選擇。
今天我們帶來全新NVIDIA RTX PRO2000 Blackwell的測(cè)試,對(duì)比上一代產(chǎn)品 NVIDIA RTX 2000 Ada Generation 具體有哪些提升。
測(cè)試環(huán)境

軟件測(cè)試列表

顯卡規(guī)格

軟件測(cè)試結(jié)果及分析
1. 計(jì)算性能:CUDA-Z
CUDA-Z 和 CPU-Z、GPU-Z 相類似,能直觀地展現(xiàn) GPU 顯卡的一些性能信息。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
2025 麗臺(tái)(上海)信息科技有限公司
本文所有測(cè)試結(jié)果均由麗臺(tái)科技實(shí)測(cè)得出,如果您有任何疑問或需要使用此測(cè)試結(jié)果,請(qǐng)聯(lián)系麗臺(tái)科技(下同)
單精度浮點(diǎn)運(yùn)算性能是顯卡一項(xiàng)重要的指標(biāo),很多計(jì)算都是使用單精度完成的。從測(cè)試結(jié)果來看,RTX PRO 2000 Blackwell 的單精度和 32 位整數(shù)計(jì)算能力是 RTX 2000 Ada 的1.78倍,RTX PRO 2000 的雙精度性能是 RTX 2000 Ada 的1.61倍,RTX PRO 2000 的 64 位整數(shù)計(jì)算能力是 RTX 2000 Ada 的1.48倍,RTX PRO 2000 的 24 位整數(shù)計(jì)算能力是 RTX 2000 Ada 的1.67倍。
2. 圖形性能:SPECviewperf 15
SPECviewperf 15 主要是用來評(píng)測(cè)顯卡專業(yè)圖形性能的軟件,其中包括了我們常見的 3ds Max、Maya、Catia、SolidWorks、Creo、Blender、Enscape、Unreal_engine 軟件性能測(cè)試,以及醫(yī)療和能量仿真性能測(cè)試。通過模擬對(duì)軟件場(chǎng)景的交互操作的速度來評(píng)分,最終得出顯卡的圖形性能的相對(duì)性能。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從 SPECviewperf 15 的測(cè)試結(jié)果看,RTX PRO 2000 和 RTX 2000 Ada 的圖形交互性能在 Unreal_engine、Medical、Maya、3ds Max的測(cè)試中均有1.4倍左右的提升。RTX PRO 2000 在 Solidworks、Creo、Catia、blender 的測(cè)試中是 RTX 2000 Ada 的1.5倍左右,RTX PRO 2000 在 Energy 的測(cè)試中是 RTX 2000 Ada 的1.72倍,RTX PRO 2000 在 Enscape 的測(cè)試中是 RTX 2000 Ada 的2.33倍,圖形性能普遍提升。
3. 實(shí)時(shí)渲染性能
3.1 FurMark
FurMark 是 GPU 測(cè)試中常用工具,可以做 OpenGL 性能測(cè)試,主要用于評(píng)估 GPU 性能級(jí)穩(wěn)定性測(cè)試。本次測(cè)試 OpenGL 的 4K 實(shí)時(shí)渲染圖形性能,以及室溫下 GPU 散熱表現(xiàn)。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從 FurMark 的實(shí)時(shí)渲染測(cè)試結(jié)果中可以看出, RTX PRO 2000 的 OpenGL 4K 性能是 RTX 2000 Ada 的1.46倍。通過長(zhǎng)時(shí)間烤機(jī)(穩(wěn)定性測(cè)試),RTX PRO 2000 的溫度控制在 76 度以下。這個(gè)溫度是在顯卡滿載運(yùn)行的情況下測(cè)得的,反映了 RTX PRO 2000 在高負(fù)載下的散熱能力。
3.2 3DMark
3DMark 主要是測(cè)試基于大型 3D 場(chǎng)景圖形性能的軟件,此次測(cè)試我們找了兩個(gè)相對(duì)較大的場(chǎng)景進(jìn)行測(cè)試,并測(cè)試了 DXR 和 Vulkan 的性能,使用 Port Royal 測(cè)試光追的性能。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從 3DMark Steel Nomad 的測(cè)試結(jié)果看,基于 DX 和 Vulkan 的性能測(cè)試,RTX PRO 2000 的性能是 RTX 2000 Ada 的1.4倍。在 Port Royal 光追性能測(cè)試中 RTX PRO 2000 是 RTX 2000 Ada 的1.5倍。RTX PRO 2000 的渲染性能和光追性能都有了很大的提高。
3.3 NVIDIA Omniverse 工作流實(shí)時(shí)渲染
NVIDIA Omniverse 是一個(gè)包含 API、SDK 和服務(wù)的平臺(tái),使開發(fā)者能夠?qū)?OpenUSD、NVIDIA RTX 渲染技術(shù)和生成式物理 AI 集成到工業(yè)和機(jī)器人用例的現(xiàn)有軟件工具和仿真工作流中??梢灾С侄嗳送瑫r(shí)在線進(jìn)行 3D 立體場(chǎng)景的協(xié)同搭建,支持豐富的 DCC 生態(tài)融合,可以支持光線追蹤極具真實(shí)感的實(shí)時(shí)渲染。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
在 Omniverse 實(shí)時(shí)渲染中,分別測(cè)試了開啟 NVIDIA DLSS 和關(guān)閉 DLSS 進(jìn)行測(cè)試。針對(duì)相同場(chǎng)景的 4K 實(shí)時(shí)渲染,在啟用 DLSS 時(shí) RTX PRO 2000 的性能是 RTX 2000 Ada 的5.6倍性能,在不啟用 DLSS 時(shí),RTX PRO 2000 的性能是 RTX 2000 Ada 的3.2倍。由于 RTX PRO 2000 具備第 5 代的 Tensor Core,并且支持最新一代的 NVIDIA DLSS 4,因此在開啟 DLSS 功能后增幀效果顯著。
4. 離線渲染性能
渲染在媒體娛樂、設(shè)計(jì)制造以及建筑行業(yè)被廣泛的應(yīng)用,目前很多渲染器均支持 GPU 渲染,而 GPU 渲染的速度就取決于顯卡的計(jì)算速度。
4.1 V-Ray Benchmark
V-Ray Benchmark 是一款免費(fèi)的獨(dú)立渲染速度測(cè)試軟件,用于測(cè)試您計(jì)算機(jī)的渲染速度。它可以簡(jiǎn)單快速的測(cè)試兩種渲染引擎:
> V-Ray GPU CUDA — GPU 渲染模式測(cè)試
> V-Ray GPU RTX — RTX GPU 渲染模式測(cè)試
本次測(cè)試不同 GPU 在不同 V-Ray 5 渲染引擎下的離線渲染性能,并記錄最終得分。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
在使用 CUDA 和 RTX 渲染測(cè)試中,RTX PRO 2000 的性能都是 RTX 2000 Ada 的1.42倍。
4.2 Blender Benchmark
在 Blender Benchmark 中分別使用 3 個(gè)場(chǎng)景 monster、junkshop、classroom 進(jìn)行渲染性能的測(cè)試。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
其中在 monster 場(chǎng)景的測(cè)試中,RTX PRO 2000 是 RTX 2000 Ada 的1.22倍。在 junkshop 的測(cè)試中 RTX PRO 2000 是 RTX 2000 Ada 的1.23倍。在 classroom 的測(cè)試中 RTX PRO 2000 是 RTX 2000 Ada 的1.17倍。
5. AI 性能測(cè)試
Procyon 推出了面向?qū)I(yè)用戶的基準(zhǔn)測(cè)試。Procyon 是 UL 專為工業(yè)、企業(yè)、政府、零售和媒體領(lǐng)域的專業(yè)用戶打造的全新基準(zhǔn)測(cè)試套件。每個(gè) Procyon 基準(zhǔn)測(cè)試都采用通用的設(shè)計(jì)和功能集,提供熟悉且一致的體驗(yàn)。靈活的許可機(jī)制意味著您可以根據(jù)自身需求選擇最合適的基準(zhǔn)測(cè)試。
隨著更多測(cè)試即將推出,Procyon 基準(zhǔn)測(cè)試套件將很快為專業(yè)用戶提供一系列基準(zhǔn)測(cè)試和性能測(cè)試。每個(gè)基準(zhǔn)測(cè)試都針對(duì)特定用例而設(shè)計(jì),并盡可能使用真實(shí)的應(yīng)用程序。
5.1 AI Compute Video benchmark
在此項(xiàng)測(cè)試中,我們選擇 NVIDIA TensorRT 來進(jìn)行測(cè)試 NVIDIA GPU 的推理性能,使用精度 Float16 進(jìn)行推理計(jì)算,推理速度越快,得分越高。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
針對(duì) AI 視頻計(jì)算在 TensorRT Float16 位精度的測(cè)試中,RTX PRO 2000 是 RTX 2000 Ada 的1.30倍。
5.2 AI Text Generation Benchmark
在此項(xiàng)測(cè)試中,軟件分別使用 4 個(gè)模型進(jìn)行測(cè)試,分別基于 Llama 2、Llama 3.1、Mistral 7B、Phi 3.5 四個(gè)大模型進(jìn)行推理生成,通過推理速度相對(duì)應(yīng)的時(shí)間來對(duì)比 GPU 的性能。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從上圖測(cè)試的結(jié)果來看,在 Llama 2 測(cè)試中 RTX PRO 2000 是 RTX 2000 Ada 的1.40倍。在 Llama 3.1 測(cè)試中 RTX PRO 2000 是 RTX 2000 Ada 的1.34倍。在 Mistral 7B 測(cè)試中 RTX PRO 2000 是 RTX 2000 Ada 的1.38倍。在 Phi 3.5 測(cè)試中 RTX PRO 2000 是 RTX 2000 Ada 的1.31倍。
5.3 AI Image Generation Benchmark
本項(xiàng)測(cè)試 Procyon 將調(diào)用 Stable Diffusion XL 進(jìn)行測(cè)試,分別使用 FP16、W8A16 以及 XL 版本 FP16 進(jìn)行推測(cè)試,來測(cè)試 GPU 的圖像生成性能。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
從上圖測(cè)試的結(jié)果來看,使用 Stable Diffusion 1.5 Light 進(jìn)行測(cè)試時(shí),RTX PRO 2000 是 RTX 2000 Ada 的1.35倍。使用 Stable Diffusion 1.5 FP16 精度進(jìn)行測(cè)試時(shí),RTX PRO 2000 是 RTX 2000 Ada 的1.53倍。在 SDXL 中使用 FP16 精度測(cè)試,RTX PRO 2000 是 RTX 2000 Ada 的1.51倍。
5.4 Flux.1 AI Image Generation
使用 Flux.1 量化 FP4 的模型,對(duì)比上一代產(chǎn)品使用 FP8 精度的生成速度。

▲ RTX PRO 2000 Blackwell 測(cè)試結(jié)果截圖

▲ 測(cè)試結(jié)果圖表
由于 Blackwell 架構(gòu)的 Tensor Core 可以支持 FP4 精度的推理,所以在很多 AIGC 的應(yīng)用領(lǐng)域中,在不影響生成質(zhì)量的情況下可以使用 FP4 來進(jìn)行加速生成。而上一代 Ada Lovelace 架構(gòu)的產(chǎn)品僅支持 FP8,在這種情況下,在相同的任務(wù)下使用 RTX PRO 2000 的性能是 RTX 2000 Ada 的6.14倍。
總結(jié)
NVIDIA RTX PRO 2000 Blackwell GPU 采用節(jié)能高效的緊湊外觀規(guī)格,可提供卓越的性能。測(cè)試結(jié)果表明,其綜合性能較前代產(chǎn)品 RTX 2000 Ada 有大幅提升。
CUDA 核心數(shù)相較上一代產(chǎn)品增加了 54%,因此在諸多應(yīng)用場(chǎng)景下性能都有了很大的提高。
在 AI 性能方面,第 5 代 Tensor Core 增加了對(duì) FP4 精度的支持,并結(jié)合 GDDR7 顯存,可加速 AI 增強(qiáng)型工作流,所以這個(gè)功能未來會(huì)在 AI 推理上會(huì)有很大的應(yīng)用,對(duì)應(yīng)的推理性能也會(huì)有很大提升。原本使用 FP16 或者 FP8 的推理的場(chǎng)景,也有了 30%~50% 的提升。
在 DLSS 的應(yīng)用上,可以支持最新的幀生成技術(shù),從 Omniverse 的測(cè)試中可以看出,對(duì)實(shí)時(shí)渲染的幀數(shù)確實(shí)有很大的提升作用。
在專業(yè) CAD 和 DCC 的交互性能提升幅度巨大,可以適配小機(jī)箱,支持更多的工業(yè)制圖、DCC 內(nèi)容生產(chǎn)的更大應(yīng)用場(chǎng)景。
在離線渲染方面也有了 20%~40% 的性能提升,渲染出圖或者視頻的性能會(huì)更快。
綜上所述,在半高專業(yè)圖形卡中,NVIDIA RTX PRO 2000 憑借其緊湊的外型及出眾的性能,在新技術(shù)的加持下,為小機(jī)箱用戶提供了更好的選擇。此外 RTX PRO 2000 帶有全高檔片,也可適配于 4U 全高機(jī)箱,結(jié)構(gòu)緊湊,性能強(qiáng)大。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5489瀏覽量
109008 -
gpu
+關(guān)注
關(guān)注
28文章
5087瀏覽量
134369 -
AI
+關(guān)注
關(guān)注
89文章
37958瀏覽量
295714
原文標(biāo)題:小巧機(jī)身,強(qiáng)大 AI:NVIDIA RTX PRO 2000 Blackwell 測(cè)評(píng)解讀
文章出處:【微信號(hào):Leadtek,微信公眾號(hào):麗臺(tái)科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄

NVIDIA RTX PRO 2000 Blackwell GPU性能測(cè)試
評(píng)論