作為 NVIDIA 專業(yè)顯卡產(chǎn)品線中單槽性能的巔峰之作,NVIDIARTX PRO 4000 Blackwell 在各項(xiàng)核心指標(biāo)上均實(shí)現(xiàn)對前代NVIDIARTX 4000 Ada Generation 的全面超越。那么,這款劃時(shí)代的專業(yè) GPU 在真實(shí)應(yīng)用場景中的表現(xiàn)究竟如何?今天,我們將通過深度實(shí)測,為您揭曉NVIDIA RTX PRO 4000 Blackwell相較于前代產(chǎn)品的性能躍遷。
測試環(huán)境

軟件測試列表

顯卡規(guī)格

軟件測試結(jié)果及分析
1. 計(jì)算性能:CUDA-Z
CUDA-Z 作為與 CPU-Z、GPU-Z 并列的硬件檢測工具,可直觀呈現(xiàn) GPU 顯卡的核心性能參數(shù),為用戶提供便捷的性能監(jiān)控與評估支持。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
2025 麗臺(上海)信息科技有限公司
本文所有測試結(jié)果均由麗臺科技實(shí)測得出,如果您有任何疑問或需要使用此測試結(jié)果,請聯(lián)系麗臺科技(下同)
單精度浮點(diǎn)運(yùn)算性能是顯卡一項(xiàng)重要的指標(biāo),很多計(jì)算都是使用單精度完成的。從測試結(jié)果來看,RTX PRO 4000 Blackwell 的單精度性能是 RTX 4000 Ada 的1.59倍,RTX PRO 4000 的雙精度性能是 RTX 4000 Ada 的1.54倍,RTX PRO 4000 的 64 位整數(shù)計(jì)算能力是 RTX 4000 Ada 的1.53倍,RTX PRO 4000 的 32 位整數(shù)計(jì)算能力是 RTX 4000 Ada 的1.56倍。RTX PRO 4000 的 24 位整數(shù)計(jì)算能力是 RTX 4000 Ada 的1.47倍。
2. 圖形性能:SPECviewperf 15
SPECviewperf 15 是專用于評估顯卡專業(yè)圖形性能的基準(zhǔn)測試軟件,涵蓋 3ds Max、Maya、Catia、SolidWorks、Creo、Blender、Enscape 及 Unreal Engine 等主流設(shè)計(jì)軟件的性能測試,同時(shí)包含醫(yī)療成像與能源仿真等專業(yè)領(lǐng)域場景。該工具通過模擬軟件交互操作響應(yīng)速度進(jìn)行評分,最終量化顯卡的圖形處理能力相對性能。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
從 SPECviewperf 15 的測試結(jié)果看,RTX PRO 4000 和 RTX 4000 Ada 的圖形交互性能在 Medical、Maya、3ds Max、Blender、energy 的測試中均有1.5倍左右的提升。RTX PRO 4000 在 Solidworks、Unreal_engine 的測試中是 RTX 4000 Ada 的1.2倍左右,RTX PRO 4000 在 Enscape 的測試中是 RTX 4000 Ada 的2.07倍,RTX PRO 4000 在 Catia、Creo 的測試中是 RTX 4000 Ada 的1.3倍左右,圖形性能普遍提升。
3. 實(shí)時(shí)渲染性能
3.1 FurMark
FurMark 是 GPU 測試領(lǐng)域的權(quán)威工具,專用于 OpenGL 圖形性能評估與系統(tǒng)穩(wěn)定性測試。本次測試聚焦兩大核心維度:其一,通過 4K 分辨率實(shí)時(shí)渲染場景評估 OpenGL 圖形處理性能;其二,在標(biāo)準(zhǔn)室溫環(huán)境下監(jiān)測 GPU 的散熱效能與溫度穩(wěn)定性。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
從 FurMark 的實(shí)時(shí)渲染測試結(jié)果中可以看出,RTX PRO 4000 的 OpenGL 4K 性能是 RTX 4000 Ada 的1.55倍。通過長時(shí)間烤機(jī)(穩(wěn)定性測試),RTX PRO 4000 的溫度控制在 78 度以下。這個(gè)溫度是在顯卡滿載運(yùn)行的情況下測得的,反映了 RTX PRO 4000 在高負(fù)載下的散熱能力。
3.2 3DMark
3DMark 是專用于評估大型 3D 場景圖形性能的基準(zhǔn)測試軟件。本次測試選取了兩個(gè)高復(fù)雜度場景進(jìn)行壓力測試,同時(shí)涵蓋 DirectX 與 Vulkan API 的性能表現(xiàn),并通過 Port Royal 模塊專項(xiàng)評估光線追蹤性能。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
從 3DMark Steel Nomad 的測試結(jié)果看,基于 DX 的性能和 Port Royal 光追的性能測試,RTX PRO 4000 的性能是 RTX 4000 Ada 的1.5倍。在 Steel Nomad Vulkan 的測試中 RTX PRO 4000 是 RTX 4000 Ada 的1.4倍。RTX PRO 4000 的渲染性能和光追性能都有了很大的提高。
3.3 NVIDIA Omniverse 工作流實(shí)時(shí)渲染
NVIDIA Omniverse 是一個(gè)包含 API、SDK 和服務(wù)的平臺,使得開發(fā)者能夠?qū)?OpenUSD、NVIDIA RTX 渲染技術(shù)和生成式物理 AI 集成到工業(yè)和機(jī)器人用例的現(xiàn)有軟件工具和仿真工作流中??梢灾С侄嗳送瑫r(shí)在線進(jìn)行 3D 立體場景的協(xié)同搭建,支持豐富的 DCC 生態(tài)融合,可以支持光線追蹤極具真實(shí)感的實(shí)時(shí)渲染。
▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
▲實(shí)時(shí)渲染性能對比視頻
在 Omniverse 實(shí)時(shí)渲染中,分別測試了開啟 NVIDIA DLSS 和關(guān)閉 DLSS 的性能。針對相同場景的 4K 實(shí)時(shí)渲染,在啟用 DLSS 時(shí) RTX PRO 4000 的性能是 RTX 4000 Ada 的3.2倍性能,在不啟用 DLSS 時(shí),RTX PRO 4000 的性能是 RTX 4000 Ada 的1.9倍。由于 RTX PRO 4000 具備第 5 代的 Tensor Core,并且支持最新一代的 NVIDIA DLSS 4,因此在開啟 DLSS 功能后增幀效果顯著。
4. 離線渲染軟件
渲染技術(shù)作為媒體娛樂、工業(yè)設(shè)計(jì)及建筑可視化等領(lǐng)域的核心工具,已廣泛應(yīng)用于影視特效、產(chǎn)品建模、虛擬建筑等場景。當(dāng)前主流渲染器均支持GPU加速渲染,其執(zhí)行效率直接取決于顯卡的計(jì)算性能。
4.1 V-Ray Benchmark
V-Ray Benchmark 是一款免費(fèi)的獨(dú)立渲染速度測試軟件,用于測試您計(jì)算機(jī)的渲染速度。它可以簡單快速的測試兩種渲染引擎:
> V-Ray GPU CUDA — GPU 渲染模式測試
> V-Ray GPU RTX — RTX GPU 渲染模式測試
本次測試不同 GPU 在不同 V-Ray 5 渲染引擎下的離線渲染性能,并記錄最終得分。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
在使用 RTX 渲染測試中,RTX PRO 4000 的性能都是 RTX 4000 Ada 的1.7倍。在使用 CUDA 測試中,RTX PRO 4000 的性能是 RTX 4000 Ada 的1.9倍。
4.2 Blender Benchmark
在Blender Benchmark測試中,我們選取了Monster、Junkshop和Classroom三個(gè)標(biāo)準(zhǔn)場景進(jìn)行渲染性能評估。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
其中在 Monster 場景的測試中,RTX PRO 4000 是 RTX 4000 Ada 的1.44倍。在 Junkshop 的測試中 RTX PRO 4000 是RTX 4000 Ada 的1.52倍。在 Classroom 的測試中 RTX PRO 4000 是 RTX 4000 Ada 的1.43倍。
4.3 Keyshot View Benchmark
KeyShot 作為工業(yè)制造領(lǐng)域廣泛應(yīng)用的實(shí)時(shí)渲染引擎,其官方配套提供了 KeyShot View 性能測試工具,專門用于評估 GPU 在 KeyShot 渲染場景中的圖形處理能力。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
在 KeyShot View 測試中,RTX PRO 4000 的性能是 RTX 4000 Ada 的1.4倍。
4.4 Octanebench
Octane渲染器作為業(yè)界主流的GPU渲染引擎,率先支持基于光線追蹤技術(shù)的實(shí)時(shí)渲染。我們采用其官方提供的基準(zhǔn)測試工具(Benchmark)對GPU渲染性能進(jìn)行量化評估。

▲ 測試結(jié)果圖表
從測試結(jié)果來看,在 Octane 渲染器上的性能 RTX PRO 4000 是 RTX 4000 Ada 的1.3倍。
5. AI 性能測試
在 AI 性能測試環(huán)節(jié),我們聚焦當(dāng)前主流應(yīng)用場景,分別針對文生圖(Text-to-Image)與大模型文本生成(LLM)展開專項(xiàng)評估。
?文生圖測試?:采用業(yè)界廣泛應(yīng)用的 ComfyUI 工具,使用其默認(rèn)工作流參數(shù)及預(yù)設(shè)提示詞,通過統(tǒng)計(jì)單次圖像生成耗時(shí)進(jìn)行性能對比。
?LLM 性能測試?:基于 MLPerf Client v1.5 基準(zhǔn)測試套件,重點(diǎn)測量首 Token 生成時(shí)間(TTFT)和每秒處理 Token 數(shù)(TPS)兩大核心指標(biāo)。
5.1 Picture Generation Benchmark
▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表
從測試結(jié)果來看使用 ComfyUI 中常用的 Flux1-dev-fp8 模型進(jìn)行推理性能測試,RTX PRO 4000 是 RTX 4000 Ada 性能的1.9倍。
5.2 MLPerf Client v1.5 Benchmark
在軟件測試環(huán)節(jié),我們采用了多款主流語言模型(LLM)進(jìn)行性能評估。大型語言模型作為當(dāng)前最具影響力的生成式人工智能形態(tài)之一,能夠通過自然語言交互實(shí)現(xiàn)多任務(wù)處理。選擇聚焦 LLM 測試,源于其在客戶端本地部署場景中展現(xiàn)出廣闊應(yīng)用前景,涵蓋智能聊天交互、AI 代理服務(wù)及個(gè)性化信息管理等領(lǐng)域。因此,我們選用 MLPerf 這一權(quán)威基準(zhǔn)測試平臺,重點(diǎn)評估 GPU 加速大模型的首 Token 生成時(shí)間(TTFT)及每秒處理 Token 數(shù)(TPS)兩大核心指標(biāo)。

▲ RTX PRO 4000 Blackwell 測試結(jié)果截圖

▲ 測試結(jié)果圖表

▲ 測試結(jié)果圖表
從測試結(jié)果來看在大模型推理性能上,無論是響應(yīng)時(shí)間,還是每秒處理的 Tokens 數(shù)量,RTX PRO 4000 都是 RTX 4000 Ada 的1.4~1.5倍性能,性能提升幅度很大。
總結(jié)

▲ NVIDIA RTX PRO 4000 Blackwell 官方渲染圖
作為高端專業(yè)圖形卡產(chǎn)品線的最新力作,NVIDIA RTX PRO 4000 Blackwell 延續(xù)了標(biāo)志性的單槽設(shè)計(jì),在功耗小幅提升的基礎(chǔ)上,實(shí)現(xiàn)了跨應(yīng)用場景的顯著性能躍升。
單精度浮點(diǎn)運(yùn)算性能提升了近 60%,在實(shí)時(shí)渲染上 DirectX12、OpenGL、Vulkan 都有 50% 左右的性能提升。如果使用 DLSS 渲染,由于 GPU 支持第 5 代 Tensor Coe 所以可以支持 4 倍的增幀效果,渲染幀數(shù)提高更多。
在離線渲染方面也有了 40%~90% 的性能提升,渲染出圖或者視頻的性能會更快。
在 AI 性能方面,第 5 代 Tensor Core 增加了對 FP4 精度的支持,在測試文生圖的業(yè)務(wù)流程中有 90% 的性能提升。在大模型推理的應(yīng)用場景中,首次響應(yīng)時(shí)間和每秒處理的 Tokens 數(shù)量,都有 40%~50% 的提升。
在專業(yè) CAD 和 DCC 的交互性能方面普遍有了提升,根據(jù)軟件的不同,從 20%~100% 提升幅度不一。
綜上所述,NVIDIA RTX PRO 4000 Blackwell 基于 NVIDIA Blackwell 架構(gòu)構(gòu)建,提供突破性的 AI 性能和無與倫比的圖形處理效率,從而釋放新體驗(yàn),并加速要求嚴(yán)苛的工作流。配備 24GB 超高速顯存、第五代 Tensor Core 和第四代 RT Core,可處理大型數(shù)據(jù)集,加速生成式 AI 工作流程,并以極快的速度渲染出逼真的場景。
-
NVIDIA
+關(guān)注
關(guān)注
14文章
5565瀏覽量
109370 -
gpu
+關(guān)注
關(guān)注
28文章
5149瀏覽量
134732 -
顯卡
+關(guān)注
關(guān)注
16文章
2520瀏覽量
71229
原文標(biāo)題:NVIDIA RTX PRO 4000 Blackwell 評測:性能暴漲,專業(yè)工作流全面提速!
文章出處:【微信號:Leadtek,微信公眾號:麗臺科技】歡迎添加關(guān)注!文章轉(zhuǎn)載請注明出處。
發(fā)布評論請先 登錄
NVIDIA RTX PRO 2000 Blackwell GPU性能測試
進(jìn)一步解讀英偉達(dá) Blackwell 架構(gòu)、NVlink及GB200 超級芯片
NVIDIA火熱招聘GPU高性能計(jì)算架構(gòu)師
NVIDIA發(fā)布 GeForce RTX 40 系列 GPU
全新 NVIDIA RTX Enterprise 驅(qū)動程序支持最新的 RTX 6000 Ada 架構(gòu) GPU,助力改進(jìn)圖形工作流
NVIDIA和GeForce RTX GPU專為AI時(shí)代打造
NVIDIA RTX 4500 Ada與NVIDIA RTX A5000的對比
NVIDIA Blackwell數(shù)據(jù)手冊與NVIDIA Blackwell架構(gòu)技術(shù)解析
NVIDIA Blackwell白皮書:NVIDIA Blackwell Architecture Technical Brief
使用NVIDIA RTX PRO Blackwell系列GPU加速AI開發(fā)
NVIDIA Blackwell推動流式傳輸和數(shù)據(jù)分析的未來發(fā)展
NVIDIA桌面GPU系列擴(kuò)展新產(chǎn)品
NVIDIA RTX PRO 5000 72GB Blackwell GPU現(xiàn)已全面上市
NVIDIA RTX PRO 4000 Blackwell GPU性能測試
評論