性能更強(qiáng) 功耗更高! GeForce RTX 5090 D顯卡天梯榜首測(cè)

發(fā)布時(shí)間：2025-02-12 08:20:25 作者：佚名

耕升RTX 5090 D踏雪憑借優(yōu)秀的硬件設(shè)計(jì)與軟硬結(jié)合的技術(shù)創(chuàng)新，定義了高性能顯卡的新標(biāo)準(zhǔn)，詳細(xì)請(qǐng)看下文測(cè)評(píng)

時(shí)隔兩年又三個(gè)多月，英偉達(dá)終于帶來了全新的GeForce RTX 50系顯卡。然而受到相關(guān)規(guī)定（滿足綜合運(yùn)算性能TPP不超過4800的限制）的影響，RTX 5090的命運(yùn)和RTX 4090一樣，化身RTX 5090 D進(jìn)入國(guó)內(nèi)市場(chǎng)。同時(shí)，RTX 5090 D是沒有公版（Founder Edition）的，因此，高端玩家們就只能從一眾非公顯卡里面去挑選適合自己的那一款了。

而說起耕升的踏雪系列，可能大家第一時(shí)間更多會(huì)想到純白設(shè)計(jì)、中高端定位，很難會(huì)將過往最高只搭載過RTX 4070 TI SUPER芯片的它和旗艦顯卡聯(lián)想到一起。不過，當(dāng)英偉達(dá)正式進(jìn)入RTX 50系顯卡時(shí)代之后，踏雪也迎來的蛻變，出現(xiàn)在了耕升的RTX 5090 D的產(chǎn)品名單里面。在了解耕升 GeForce RTX 5090 D 踏雪之前，我們先來簡(jiǎn)單回顧一下英偉達(dá)RTX 50系顯卡到底有什么新的特點(diǎn)。

關(guān)于RTX 5090 D

相較于上一代RTX 4090 D來看，RTX 5090 D在芯片的規(guī)模上有了較大幅度的升級(jí)。雖然制程工藝不變，依然是定制的TSMC 4N，但是，憑借更大的芯片面積和新一代的Blackwell核心架構(gòu)，后者的晶體管數(shù)量從763億個(gè)增加至922億個(gè)，CUDA核心數(shù)量增加將近50%，而且同樣是12個(gè)GPC，RTX 5090 D每個(gè)GPC里的TPC和SM數(shù)量增多了，TPC從6個(gè)增至8個(gè)，SM從12個(gè)增至16個(gè)。編解碼器同樣進(jìn)行了迭代加碼，新增了4:2:2色度采樣視頻編解碼的能力，節(jié)省CPU的負(fù)擔(dān)，提升內(nèi)容創(chuàng)作者的工作效率。此外，RTX 5090 D還用上了容量更大、性能更強(qiáng)的GDDR7顯存，位寬也從384-bit增至512-bit。顯示輸出接口升級(jí)為3×DisplayPort 2.1b+1×HDMI 2.1b的配置，借助DSC技術(shù)最高支持4K@480Hz或8K@140Hz。

不過，這次的RTX 5090 D的命運(yùn)并不像RTX 4090 D一樣在核心規(guī)格作出調(diào)整。我們從表面參數(shù)上基本看不出與RTX 5090有什么區(qū)別，對(duì)游戲性能造成的影響肯定是遠(yuǎn)小于RTX 4090 D當(dāng)初的。至于AI性能嘛，RTX 5090 D則從RTX 5090的3352 AI TOPS降至2375 AI TOPS，降幅約29%。

Blackwell架構(gòu)有多牛

不斷壯大的核心規(guī)模

其實(shí)，完全體的 Blackwell GB202共有12組GPC、24576個(gè)CUDA核心，RTX 5090 D上的GB202-250則用了其中的88.5%。從整體結(jié)構(gòu)圖上還能看到，GigaThread Engine調(diào)度器隔壁多了一個(gè)叫做AI-Management Processor（AI管理處理器，簡(jiǎn)稱AMP）的幫手。AMP是一個(gè)位于管線前端的RISC-V處理器，支持Windows硬件加速GPU計(jì)劃，能夠更自由地管理GPU。CUDA、RT Core和Tensor Core三大部分在它的帶領(lǐng)下可以協(xié)調(diào)工作，實(shí)現(xiàn)AI響應(yīng)速度提高的同時(shí)，游戲畫面也不會(huì)受到影響。

GPC段中，它所包含的TPC從Ada Lovelace的6組擴(kuò)展到了8組。不過布局上還是一樣的，一個(gè)獨(dú)立的光柵引擎，兩個(gè)ROP分區(qū)（每個(gè)包含8個(gè)ROP單元），而每組TPC包含兩組SM。

SM段的變化是比較大的?，F(xiàn)在所有的32個(gè)CUDA核心都能執(zhí)行FP32/INT32運(yùn)算了，因此INT32的算力可以說是增加了一倍。不過在一個(gè)時(shí)鐘周期里面，核心只能二選一運(yùn)算。NVIDIA表示，這種設(shè)計(jì)是為神經(jīng)著色器優(yōu)化的。

Tensor Core和RT Core自然也有升級(jí)。第5代Tensor Core繼承了上一代架構(gòu)的特性，并新增了FP4、FP6的支持，還把FP8 Transformer Engine更新到了第二代。其中，F(xiàn)P4是個(gè)比較值得關(guān)注的點(diǎn)，它相比常規(guī)的FP16模型需要的顯存更小，在TensorRT模型優(yōu)化器的支持下能夠做到幾乎沒有質(zhì)量損失。

現(xiàn)在，Blackwell上的SER（著色器重排序） 2.0還可以將神經(jīng)網(wǎng)絡(luò)的負(fù)載直接發(fā)送至Tensor Core處理，加速神經(jīng)網(wǎng)絡(luò)渲染，效率達(dá)到了Ada Lovelace上的2倍，降低開銷之余還能提高精準(zhǔn)度。

同時(shí)運(yùn)作的話，LLM的響應(yīng)時(shí)間變慢，游戲幀率也會(huì)受影響

而第4代RT Core中，新增的組件包括有Triangle Cluster Intersection Engine、Triangle Cluster Compression Engine以及Linear Swept Spheres。同時(shí)，Blackwell提供了兩倍于上一代Ada Lovelace的Ray-Triangle交叉檢測(cè)吞吐量。它們的出現(xiàn)，與Mega Geometry技術(shù)息息相關(guān)，起到一個(gè)打基礎(chǔ)的作用。

Mega Geometry是在TLAS（頂層加速結(jié)構(gòu)）和BLAS（底層加速結(jié)構(gòu)）兩個(gè)層級(jí)的架構(gòu)上做改進(jìn)。BLAS一側(cè)的Cluster-level Acceleration Structures（CLAS，簇級(jí)加速結(jié)構(gòu)）最多能把256個(gè)三角形簇打包好，并將其作為BVH的基礎(chǔ)部分輸入，最后組成BVH樹。同時(shí)，CLAS不僅能在游戲里面按需創(chuàng)建，還能緩存到硬盤里面，后面的幀要用的話直接從硬盤加載。這樣一來，系統(tǒng)要處理的事情就少很多了。

TLAS還有個(gè)兄弟叫Partitioned Top-Level Acceleration Structure（PTLAS，分區(qū)頂層加速架構(gòu)），是針對(duì)復(fù)雜場(chǎng)景設(shè)計(jì)的。NVIDIA表示，在很多游戲里面，場(chǎng)景內(nèi)有不少物品比如建筑都是固定不變的，但是如果每一幀都要給它們構(gòu)建一次TLAS，肯定就不劃算。而正如名稱中的Partitioned分區(qū)所示，PTLAS把場(chǎng)景內(nèi)的物體分成了多個(gè)區(qū)域，一些用來放置靜態(tài)的物品，然后一個(gè)全局分區(qū)用于處理動(dòng)態(tài)的物品，同樣可以做到減輕了系統(tǒng)的壓力，提高運(yùn)算效率。

值得一提的是，所有RTX顯卡都能支持Mega Geometry，但跟所有新技術(shù)一樣，Blackwell是目前支持最好的。

魔法一般的神經(jīng)網(wǎng)絡(luò)渲染

鋪墊了這么多的硬件基礎(chǔ)，英偉達(dá)實(shí)際上是為了更好地構(gòu)筑神經(jīng)網(wǎng)絡(luò)渲染這項(xiàng)技術(shù)，應(yīng)用范圍包括RTX神經(jīng)網(wǎng)絡(luò)紋理壓縮、RTX神經(jīng)網(wǎng)絡(luò)材質(zhì)、神經(jīng)網(wǎng)絡(luò)輻射緩存（NRC）以及RTX神經(jīng)網(wǎng)絡(luò)皮膚/面部。

RTX神經(jīng)紋理壓縮：使用AI在不到一分鐘的時(shí)間內(nèi)壓縮數(shù)千種紋理，在相同的視覺質(zhì)量下可以節(jié)省高達(dá)7倍的顯存占用。

RTX神經(jīng)材質(zhì)：使用AI壓縮通常保留給離線材質(zhì)的復(fù)雜著色器代碼，并且這些材質(zhì)由多層組成，處理速度可提升5倍。

RTX神經(jīng)網(wǎng)絡(luò)輻射緩存：使用在實(shí)時(shí)游戲數(shù)據(jù)上訓(xùn)練的神經(jīng)網(wǎng)絡(luò)，能更準(zhǔn)確和高效地估計(jì)游戲場(chǎng)景中的間接光照，而大幅減少光線追蹤的計(jì)算量。

RTX神經(jīng)網(wǎng)絡(luò)皮膚/面部：能夠使光線完成射入皮膚內(nèi)的反射和折射，并且基于AI模型生成更真實(shí)的面部和表情，改善人物的身整體呈現(xiàn)和解決恐怖谷效應(yīng)的問題。

RTX神經(jīng)材質(zhì)

RTX神經(jīng)網(wǎng)絡(luò)輻射緩存

RTX神經(jīng)網(wǎng)絡(luò)皮膚

RTX神經(jīng)網(wǎng)絡(luò)面部

DLSS 4：幀生成PLUS

新一代Blackwell架構(gòu)GPU上引入了DLSS 4，提供了多幀生成功能，即在每個(gè)傳統(tǒng)渲染的幀之間生成多達(dá)三個(gè)額外的幀。這不僅基于Blackwell的幀生成模型比上一代快了40%、顯存占用降低30%的強(qiáng)大優(yōu)勢(shì)，而且用于提供光流場(chǎng)信息的不再是RTX 40系列上的光流加速器，而是一個(gè)更高效的AI模型。

為了避免輸出幀畫面過多導(dǎo)致的順序亂套，英偉達(dá)還引入了Flip Metering功能，能夠?qū)交壿嫃腃PU轉(zhuǎn)移到GPU的顯示引擎上，讓GPU更精確地掌控顯示每一幀的節(jié)奏并降低幀時(shí)間。而剛好Blackwell的顯示引擎擁有較為出色的像素處理能力，可以以支持更高的分辨率和刷新率，從而實(shí)現(xiàn)帶有DLSS 4的Flip Metering。不過，由于DLSS 4多幀生成需要用到第5代Tensor Core的強(qiáng)勁算力去計(jì)算光流場(chǎng)和生成多幀，因此這個(gè)功能目前是Blackwell獨(dú)占的。

此外，超分辨率、光線重建、DLAA也獲得了更新，它們的模型從CNN換成了Transformer，是一個(gè)采用自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò)，能夠提高畫面的穩(wěn)定性，提升光照細(xì)節(jié)，給予動(dòng)態(tài)物體更多細(xì)節(jié)。預(yù)計(jì)在未來數(shù)年里，圖像質(zhì)量會(huì)持續(xù)提升。

對(duì)于游戲和應(yīng)用，DLSS 4結(jié)合多幀生成、光線重建和超級(jí)分辨率技術(shù)，將幀率提升至普通渲染的最高8倍，并在從幀生成升級(jí)到多幀生成時(shí)，進(jìn)一步提高幀率高達(dá)1.7倍，性能提升效果非常地明顯。

延遲救星NVIDIA Reflex 2

這時(shí)可能會(huì)有朋友說到了，DLSS 4補(bǔ)幀這么猛，延遲不會(huì)大打折扣嗎？英偉達(dá)對(duì)此早已給出了對(duì)策——NVIDIA Reflex 2。它結(jié)合了Reflex低延遲模式和新的Frame Warp技術(shù)，能夠把最新的鼠標(biāo)輸入指令同步給渲染幀，及時(shí)更新渲染的游戲幀并在渲染幀被發(fā)送到顯示器之前獲取最新的鼠標(biāo)信息，通過刷新渲染的游戲幀以進(jìn)一步減少延遲，將PC延遲進(jìn)一步降低多達(dá)75%。

NVENC和NVDEC新增YUV422支持

目前很多攝像機(jī)都支持錄制YUV422格式的視頻，這是有原因的：YUV422相比起YUV444更節(jié)省儲(chǔ)存空間，但是比起YUV420能保存更多的顏色，這樣一來就給后期調(diào)色留下了充足的空間。Blackwell這次新增了YUV422的編解碼支持，從而能提高創(chuàng)作者的效率，比如說導(dǎo)出時(shí)間減少，更流暢的多路回放等。NVIDIA表示，第6代NVDEC可同步解碼和播放多達(dá)8個(gè)4K60 YUV422視頻流。

而第9代NVENC則提升了HEVC和AV1的編碼質(zhì)量，為YUV422 H.264和HVEC編碼提供了支持。另外，還有一個(gè)全新的AV1 Ultra High Quality（UHQ）模式，它可以用更多的時(shí)間去獲得額外5%的質(zhì)量提升。NVIDIA還表示，這個(gè)模式在RTX 40系列上也可用，不過Blackwell的質(zhì)量是更好的。

顯卡解析：踏雪至山巔

我們把目光放回我們本次評(píng)測(cè)的主角——耕升 RTX 5090 D 踏雪。由于它是不帶OC的標(biāo)準(zhǔn)版，包括核心Boost頻率在內(nèi)的絕大部分參數(shù)都與英偉達(dá)官方標(biāo)稱一致。

外觀與包裝

耕升 RTX 4070 SUPER 踏雪

說實(shí)話，老踏雪給我的印象妥妥的是一張定位高端純白顯卡，如果將它的外觀直接搬到萬元級(jí)的RTX 5090 D上，多少是缺少誠(chéng)意的，重新設(shè)計(jì)是勢(shì)在必行。

雪花標(biāo)志依舊是踏雪系列顯卡的靈魂所在，從外包裝上，耕升就將此十分直接地展現(xiàn)出來，旁邊附易略帶古風(fēng)的“踏雪”字樣，給人一種磅礴凜冽之感。三年個(gè)人送保服務(wù)作為耕升引以為傲的優(yōu)勢(shì)，自然也是會(huì)標(biāo)注在最顯眼的地方。

拿出顯卡本體后我們可以看到，RTX 5090 D 踏雪果然是沒有讓我們失望。純白外殼不僅與散熱鰭片盡可能地齊平貼合，而且尾部延伸至金屬背板，帶來非常不錯(cuò)的一體性觀感。三把第三代炫風(fēng)之刃風(fēng)扇（兩側(cè)100mm，中間90mm）采用了性能表現(xiàn)更好的環(huán)形連葉設(shè)計(jì)，扇葉表面還有紋理加強(qiáng)導(dǎo)流。軸心處注入了標(biāo)志性的雪花logo，在同心圓金屬紋理的襯托之下倍顯質(zhì)感。

不僅如此，我們從顯卡的大部分地方都能看到大量的雪花圖案，充分展現(xiàn)“踏雪”之意。其中，最值得一提的就是側(cè)面的logo燈板了，轉(zhuǎn)角過渡的設(shè)計(jì)剛好對(duì)應(yīng)著常規(guī)安裝時(shí)的展示視角，給人一種曲面屏般的立體觀感。比起以往的踏雪系列顯卡，RTX 5090 D踏雪的顏值可謂是脫胎換骨了。

顯卡的供電接口從RTX 4090公版的12VHPWR升級(jí)成了更安全的12V-2×6，并且旋轉(zhuǎn)了180°，卡扣朝上，便于用戶拔插的同時(shí)減少插不牢的概率。在它的旁邊是ARGB燈光同步接口，配合附送的線材使用。

顯卡的顯示輸出接口和英偉達(dá)官方標(biāo)稱的一樣，為三個(gè)DP2.1b+一個(gè)HDMI2.1b的組合。PCIe擋板只給到了雙槽，其中一槽多是散熱開孔，剩余厚度位置被外殼所覆蓋。

尺寸方面，我們手動(dòng)測(cè)量的結(jié)果的328×122×61mm（不包含擋板凸出長(zhǎng)度和插槽），厚度大約是三槽多一點(diǎn)，對(duì)常規(guī)的MATX主板和機(jī)箱來說不太友好。不過都上旗艦卡了，一般情況下用戶都會(huì)首先考慮大機(jī)箱。至于ITX用戶，就只能按自身的實(shí)際情況去判斷了。顯卡實(shí)測(cè)重量是1907g，份量不小，正常安裝方式下建議搭配顯卡支架使用，盡可能避免造成PCB彎曲。

而配件這邊，耕升也是附送了一個(gè)與顯卡相稱的銀白色顯卡金屬支架，底部帶有磁吸固定，安裝在機(jī)箱時(shí)不易脫落。另外就是常規(guī)的四8Pin轉(zhuǎn)12V-2×6供電線以及5V ARGB燈光控制線，后者可直接實(shí)現(xiàn)與主板燈效同步，無需在顯卡控制軟件內(nèi)部進(jìn)行額外的設(shè)置。

顯卡拆解

全新的雪魂散熱裝置配備了7根8mm復(fù)合式鍍鎳熱管，核心接觸面底座為VC均熱板，提供高效的散熱能力。供電元件、顯存芯片也覆蓋有導(dǎo)熱墊與散熱模塊上的一體式金屬中框充分接觸。

耕升 RTX 5090 D 踏雪采用了14層PCB設(shè)計(jì)，供電配置給到了16+7+6相，主供電控制芯片放置在了PCB的左上角，為來自MPS的MP29816-A，所用的MOSFET全部是來自MPS的MP97993，最大支持電流為50A。

背面還有一顆型號(hào)為uS5650Q的供電控制芯片

風(fēng)扇PWM接口和5V ARGB燈光接口在PCB的右下方，三把風(fēng)扇現(xiàn)在是單獨(dú)控制。

GB202-250-A1核心在PCB的中心位置，周圍環(huán)繞著16顆三星的GDDR7芯片，每顆容量為2GB，位寬為32-bit，組成512-bit/32GB的規(guī)格。

顯卡背部元件不多，一眼看過去很干凈，基本都布局在了正面，可見這次耕升 RTX 5090 D 踏雪的硬件集成度非常高。

性能測(cè)試：“軟硬”兼施效果顯著

測(cè)試平臺(tái)與說明

為了能夠發(fā)揮出耕升 RTX 5090 D 踏雪的最佳表現(xiàn)，測(cè)試平臺(tái)的CPU選用了當(dāng)下最強(qiáng)游戲CPU——AMD Ryzen 7 9800X3D；與之搭配的主板為微星 MPG X870E CARBON WIFI 暗黑，擁有18+2+1相110A SPS智能供電的它即便是帶旗艦級(jí)別的Ryzen 9 9950X也是不在話下，另外主板還配備了具有戰(zhàn)未來屬性的PICe 8Pin輔助供電接口，為顯卡提供穩(wěn)定，高效和持續(xù)的電力供應(yīng)（測(cè)試時(shí)并沒有接，主要是考慮到其他品牌主板沒有配備該接口，不進(jìn)行“作弊”）；內(nèi)存輔以芝奇 Trident Z5 RGB 32GB雙通道DDR5-6000 CL30內(nèi)存，甜點(diǎn)頻率+低延遲的組合不僅對(duì)于絕大部分用戶都能夠?qū)崿F(xiàn)，而且我們實(shí)測(cè)相比高頻在實(shí)際使用中差別非常小。

參加測(cè)試的顯卡除了耕升 RTX 5090 D 踏雪，還有作為對(duì)比的GeForce RTX 4090 D。測(cè)試兼顧2K和4K分辨率，包括基準(zhǔn)性能跑分、傳統(tǒng)光柵游戲以及光追游戲，DLSS測(cè)試部分加入了最新的DLSS 4。

基準(zhǔn)性能測(cè)試

首先是純理論跑分，會(huì)以3D Mark作為顯卡基準(zhǔn)性能測(cè)試，測(cè)試項(xiàng)目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Steel Nomad、Port Royal、以及Speed Way八個(gè)項(xiàng)目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個(gè)項(xiàng)目分別測(cè)試的是顯卡在DX11游戲中的1080P分辨率、2K分辨率和4K分辨率下的性能指數(shù)，Time Spy、Time Spy Extreme兩個(gè)項(xiàng)目則是顯卡在DX12游戲中的2K分辨率和4K分辨率下的性能指數(shù)，Port Royal是測(cè)試的顯卡實(shí)時(shí)光線追蹤的性能指數(shù)。另外還有去年推出的Steel Nomad，這是原有的Time Spy基準(zhǔn)測(cè)試的繼承者，屬于新的非光追顯卡基準(zhǔn)性能測(cè)試工具。而NVIDA DLSS測(cè)試項(xiàng)目中，由于我們拿到的是測(cè)試版本，可以對(duì)DLSS 4的性能表現(xiàn)進(jìn)行一個(gè)初步的預(yù)估，具有第一定的參考價(jià)值，具體設(shè)置為4K質(zhì)量擋位，幀生成選項(xiàng)提供了2X，3X和4X三擋切換，其中DLSS 4 2X其實(shí)就是DLSS 3 2X，即渲染1幀生成1幀。RTX 4090 D不支持DLSS 4，因此就沒有相關(guān)的成績(jī)了。

具體成績(jī)見下表，表中所列成績(jī)均為3D Mark顯卡單項(xiàng)的得分。

在3DMark測(cè)試中可以看到，耕升 RTX 5090 D 踏雪要比RTX 4090 D快35%~66.5%，其中，Steel Nomad、Port Royal和Speed Way三個(gè)測(cè)試中擁有相當(dāng)明顯的優(yōu)勢(shì)，領(lǐng)先幅度都在50%以上，兩項(xiàng)考驗(yàn)DX12性能的Time Spy的測(cè)試?yán)锩嬉渤^了45%，代表DX11性能的Fire Strike則隨著分辨率的降低，領(lǐng)先幅度逐步縮小。

耕升 RTX 5090 D 踏雪憑借更出色的性能表現(xiàn)在原生畫質(zhì)中就拔得頭籌，再加上DLSS 4的助力，幀數(shù)的提升相當(dāng)夸張，4X時(shí)大約達(dá)到了原生的5.6倍。這不禁讓人更加期待它的實(shí)際游戲體驗(yàn)了。

游戲測(cè)試

在這次游戲測(cè)試環(huán)節(jié)中，我們?cè)?K分辨率選擇了7款光柵化游戲及光追游戲，2K分辨率選擇了4款光柵化游戲及光追游戲，另外還有3款DLSS 4游戲。一般情況下，游戲會(huì)選擇極高或者超高的預(yù)設(shè)畫質(zhì)，光追游戲如果有路徑光追都會(huì)是優(yōu)先選項(xiàng)，同時(shí)這些測(cè)試?yán)锒紱]有開啟DLSS。由于GeForce RTX 5090 D屬于旗艦顯卡，基本上都是以4K游戲?yàn)槟繕?biāo)，2K游戲則選擇壓力較大的幾款大作，壓力非常小的1080P分辨率的參考意義較低，就不作測(cè)試。

4K分辨率光柵游戲

光追游戲

在4K光柵游戲的環(huán)節(jié)，除了《黑神話：悟空》勉強(qiáng)達(dá)到流暢之外，其余游戲在耕升 RTX 5090 D 踏雪面前基本算得上的游刃有余，相比RTX 4090 D有著較為明顯的幀數(shù)提升。

開啟光追之后，兩者依然保有一定的性能差距， RTX 5090 D均能做到30fps以上，而RTX 4090 D有4款游戲是低于30fps的。但總體來說，要想4K光追暢玩，新一代顯卡還是要依賴DLSS。

2K分辨率光柵游戲

光追游戲

轉(zhuǎn)戰(zhàn)壓力較小的2K分辨率之后，耕升 RTX 5090 D 踏雪毫無意外是繼續(xù)領(lǐng)先。2K光柵對(duì)于它來說基本上是不成問題了，RTX 4090 D面對(duì)《黑神話：悟空》還是處于勉強(qiáng)過關(guān)的程度。2K光追的情況同樣如此，RTX 5090 D悉數(shù)踩著60fps的暢玩基礎(chǔ)線過關(guān)，RTX 4090 D除了《心靈殺手2》外都只有40多fps。

總體來說，RTX 5090 D讓很多大作在高分辨率+光追+原生畫質(zhì)的條件下完成了從不可玩到可玩轉(zhuǎn)變，打好的原生幀數(shù)的基礎(chǔ)，才能更好地發(fā)揮DLSS幀生成的優(yōu)勢(shì)，提升游戲體驗(yàn)。

DLSS 4性能測(cè)試

在DLSS 4測(cè)試項(xiàng)目中，我們選擇了四款游戲，包括《賽博朋克2077》、《心靈殺手2》、《星球大戰(zhàn)：亡命之徒》和《漫威爭(zhēng)鋒》。原本想測(cè)試更多支持DLSS 4的游戲，但是遇到了不穩(wěn)定等情況，而且時(shí)間有限。相信當(dāng)大家收到RTX 50系顯卡的時(shí)候，應(yīng)該就會(huì)有很多游戲獲得原生DLSS 4或DLSS優(yōu)化支持了。幀生成選項(xiàng)和3D Mark的DLSS測(cè)試項(xiàng)目一樣，提供了2X，3X和4X三擋切換，而RTX 40系顯卡是只有開關(guān)選項(xiàng)，沒有給到增幅擋位。

在DLSS 4功能測(cè)試版的《賽博朋克2077》中，畫質(zhì)設(shè)置菜單里新增了超分辨率模型選擇，玩家可以選擇全新的Transformer或以前的CNN模型，雖然說是超分辨率，但其實(shí)光線重建的模型也會(huì)被一并切換。

NVIDIA App的設(shè)置跟游戲中的類似，也是分成模型選擇、幀生成倍數(shù)和超分辨率三個(gè)選項(xiàng)。一般來說因?yàn)槭球?qū)動(dòng)級(jí)設(shè)置，過程可能比游戲內(nèi)設(shè)置要略微多花一點(diǎn)時(shí)間，比如我們這次測(cè)試的《漫威爭(zhēng)鋒》，就需要先設(shè)置好再開游戲，而不能在游戲里實(shí)時(shí)設(shè)置。

測(cè)試內(nèi)容除了原生幀率外，我們嘗試了新舊兩種不同模型，以及不同倍數(shù)的設(shè)置，讓大家可以更好地去做對(duì)比。需要說明的是，《星球大戰(zhàn)：亡命之徒》不支持DLSS新舊模型切換。

DLSS 4對(duì)于幀數(shù)的提升是肉眼可見的大，均是成倍地增加，同時(shí)，多擋位以及雙模型的切換也為用戶提供了更多的選擇。大家最關(guān)心的延遲問題其實(shí)總體感覺還好，大部分情況下DLSS 4 和DLSS 2/3僅存在些許的差距，且明顯好于原生，實(shí)際體驗(yàn)的感知并不明顯。另外，畫質(zhì)方面這里給到大家Transformer和CNN兩個(gè)新舊模型的對(duì)比，所有的對(duì)比截圖均是在性能擋獲取的，屏幕分辨率為4K，渲染分辨率則是1920 x 1080。

CNN模型CNN模型Transformer模型Transformer模型

顯而易見，Transformer在細(xì)節(jié)處理上要比CNN好上不少，不僅是正常的畫面，而且水面的倒影也是更加清晰。在畫面穩(wěn)定性這塊，新模型還顯著減少了物體邊緣處的閃爍以及偽影現(xiàn)象。

AI與生產(chǎn)力性能測(cè)試

AI生圖與大語(yǔ)言模型

前面也提到了，RTX 5090 D新增了FP4的支持，具體表現(xiàn)究竟會(huì)如何呢？在UL Procyon FLUX.1 AI生圖測(cè)試?yán)锩?，RTX 5090 D在FP4模式下僅用了4秒不到就生成了一張圖，而RTX 4090 D則是要花上將近20秒。在FP8模式里面，RTX 5090 D的速度依然是RTX 4090 D的1.7倍。

至于不少玩家關(guān)注常規(guī)FP16性能，我們也做了相應(yīng)的Stable Diffusion測(cè)試。需要提一下的是，在我們測(cè)試時(shí)公開的TensorRT加速庫(kù)還沒更新對(duì)RTX 50系列的支持，所以我們是用ONNX DirectML運(yùn)行時(shí)進(jìn)行測(cè)試的。在這個(gè)測(cè)試中，RTX 5090 D仍然處于領(lǐng)先位置。盡管RTX 5090 D在這個(gè)情況下的生成速度也挺快的了，要是有TensorRT的話，速度會(huì)更上一層樓。

LLM類別的測(cè)試中，涉及的模型要多不少，但在首Token延遲和輸出Token速度這些關(guān)鍵指標(biāo)上，RTX 5090 D在大部分模型里面要比RTX 4090 D好上約30%。

生產(chǎn)力創(chuàng)意軟件

3D創(chuàng)作有關(guān)的軟件中，V-Ray和Blender我們認(rèn)為是比較有代表性的，在這里面，RTX 5090 D相比RTX 4090 D獲得了超過25%的增幅。

溫度測(cè)試

我們的GPU散熱測(cè)試均在裸機(jī)狀態(tài)（如果安裝在機(jī)箱內(nèi)，GPU溫度會(huì)高出5℃左右）下進(jìn)行測(cè)試，測(cè)試環(huán)境溫度約為23.5℃。待機(jī)溫度是開機(jī)以后記錄5分鐘，滿載溫度則是完成3DMark Speed Way壓力測(cè)試后記錄下，數(shù)據(jù)通過GPU-Z的Log to File功能記錄，以下為溫度測(cè)試曲線。

耕升 RTX 5090 D 踏雪支持低溫風(fēng)扇停轉(zhuǎn)，所以待機(jī)溫度都是被動(dòng)散熱下的溫度，整體呈緩慢上升的趨勢(shì)，直到最高的42.5℃依然是處于停轉(zhuǎn)狀態(tài)。滿載時(shí)，顯卡的最高溫度大約在第6分鐘達(dá)到最高，為72.1℃。在此之后，風(fēng)扇轉(zhuǎn)速還是稍有增加，最高達(dá)到1844 RPM以更好地維持在相對(duì)較低的工作溫度范圍內(nèi)。

功耗測(cè)試

我們通過手中的PCAT套件，分別精確地測(cè)量顯卡PCIe、外接電源接口瓦特?cái)?shù)，顯卡最大功耗在3DMark Speed Way壓力測(cè)試中獲得，待機(jī)功耗則是在進(jìn)入系統(tǒng)后記錄1分鐘取平均值。

統(tǒng)計(jì)功耗測(cè)試的結(jié)果算出，我們手上這張耕升 RTX 5090 D 踏雪顯卡的整卡平均待機(jī)功耗約為31W，滿載平均功耗在584W左右，峰值功耗達(dá)到了668W，已達(dá)到16-Pin 12V-2x6供電接口滿載狀態(tài)。這也就不難解釋為什么英偉達(dá)官方給到的電源瓦數(shù)建議從RTX 4090的850W提升至了1000W。

噪音測(cè)試

在GPU-Z的Log to File中我們同時(shí)記錄下了顯卡轉(zhuǎn)速情況。由于這次的RTX 5090 D顯卡風(fēng)扇均獨(dú)立控制，我們只標(biāo)出最速較高的一個(gè)，為1844 RPM。接著我們把顯卡放進(jìn)了環(huán)境噪音小于10 dB(A)的消音實(shí)驗(yàn)室，把其風(fēng)扇還原同樣轉(zhuǎn)速，然后在30CM的距離上測(cè)試其噪音水平，由于顯卡在待機(jī)時(shí)風(fēng)扇是停轉(zhuǎn)的，所以就不用測(cè)試了。

耕升 RTX 5090 D 踏雪所測(cè)得的噪音值為44.4 dB(A)，在開放平臺(tái)下會(huì)感受到些許聲響，如果按照正常用戶裝入機(jī)箱的使用習(xí)慣，應(yīng)該是感知不明顯的。

GW-SOUL控制軟件體驗(yàn)

前面我們有提到，耕升 RTX 5090 D 踏雪的三把風(fēng)扇現(xiàn)在是獨(dú)立控制的，舊版本的控制軟件是只能控制其中的兩把。而新版的GW-SOUL里面，風(fēng)扇調(diào)節(jié)一欄就明確顯示三把風(fēng)扇均單獨(dú)可調(diào)了。此外，軟件還提供了顯卡實(shí)時(shí)狀態(tài)信息、超頻和燈光調(diào)節(jié)功能，右上角給到了主板燈光同步開關(guān)。

總結(jié)：難以撼動(dòng)的旗艦級(jí)性能表現(xiàn)

從耕升 RTX 5090 D 踏雪身上我們可以看到，英偉達(dá)的新一代旗艦顯卡主要是在核心規(guī)模和相關(guān)技術(shù)上取得明顯進(jìn)步，擁有符合現(xiàn)時(shí)市場(chǎng)競(jìng)爭(zhēng)狀況的代際提升幅度，游戲及AI生產(chǎn)力表現(xiàn)出色。尤其是極具戰(zhàn)未來意義的神經(jīng)網(wǎng)絡(luò)渲染與DLSS 4技術(shù)，更是將一些有著極高性能需求的游戲馴服妥帖。不過，由于芯片制程工藝沒有變化，功耗增加是在所難免的，供電接口上引入了最新的12V-2×6正是為此而保駕護(hù)航，當(dāng)然，搭配1000W或以上的ATX 3電源使用也是必不可少的。

價(jià)格方面，英偉達(dá)官方給到的建議零售價(jià)雖為16499元，但耕升 RTX 5090 D 踏雪作為一張用料扎實(shí)又有純白外觀和全新設(shè)計(jì)加持的非公版顯卡實(shí)際上市的價(jià)格應(yīng)該會(huì)略有增加，同時(shí)，首發(fā)的熱度所帶來的供需變化可能也會(huì)成為價(jià)格波動(dòng)的因素之一。盡管如此，由于主要競(jìng)爭(zhēng)對(duì)手AMD沒有給到足夠的壓力，相信在未來的好一段時(shí)間內(nèi)，RTX 5090 D會(huì)穩(wěn)居最強(qiáng)消費(fèi)級(jí)顯卡的寶座，價(jià)格不會(huì)影響對(duì)其有需求用戶的購(gòu)買動(dòng)力。