性能更強(qiáng) 功耗更高! GeForce RTX 5090 D顯卡天梯榜首測(cè)
時(shí)隔兩年又三個(gè)多月,英偉達(dá)終于帶來了全新的GeForce RTX 50系顯卡。然而受到相關(guān)規(guī)定(滿足綜合運(yùn)算性能TPP不超過4800的限制)的影響,RTX 5090的命運(yùn)和RTX 4090一樣,化身RTX 5090 D進(jìn)入國(guó)內(nèi)市場(chǎng)。同時(shí),RTX 5090 D是沒有公版(Founder Edition)的,因此,高端玩家們就只能從一眾非公顯卡里面去挑選適合自己的那一款了。

而說起耕升的踏雪系列,可能大家第一時(shí)間更多會(huì)想到純白設(shè)計(jì)、中高端定位,很難會(huì)將過往最高只搭載過RTX 4070 TI SUPER芯片的它和旗艦顯卡聯(lián)想到一起。不過,當(dāng)英偉達(dá)正式進(jìn)入RTX 50系顯卡時(shí)代之后,踏雪也迎來的蛻變,出現(xiàn)在了耕升的RTX 5090 D的產(chǎn)品名單里面。在了解耕升 GeForce RTX 5090 D 踏雪之前,我們先來簡(jiǎn)單回顧一下英偉達(dá)RTX 50系顯卡到底有什么新的特點(diǎn)。
關(guān)于RTX 5090 D

相較于上一代RTX 4090 D來看,RTX 5090 D在芯片的規(guī)模上有了較大幅度的升級(jí)。雖然制程工藝不變,依然是定制的TSMC 4N,但是,憑借更大的芯片面積和新一代的Blackwell核心架構(gòu),后者的晶體管數(shù)量從763億個(gè)增加至922億個(gè),CUDA核心數(shù)量增加將近50%,而且同樣是12個(gè)GPC,RTX 5090 D每個(gè)GPC里的TPC和SM數(shù)量增多了,TPC從6個(gè)增至8個(gè),SM從12個(gè)增至16個(gè)。編解碼器同樣進(jìn)行了迭代加碼,新增了4:2:2色度采樣視頻編解碼的能力,節(jié)省CPU的負(fù)擔(dān),提升內(nèi)容創(chuàng)作者的工作效率。此外,RTX 5090 D還用上了容量更大、性能更強(qiáng)的GDDR7顯存,位寬也從384-bit增至512-bit。顯示輸出接口升級(jí)為3×DisplayPort 2.1b+1×HDMI 2.1b的配置,借助DSC技術(shù)最高支持4K@480Hz或8K@140Hz。
不過,這次的RTX 5090 D的命運(yùn)并不像RTX 4090 D一樣在核心規(guī)格作出調(diào)整。我們從表面參數(shù)上基本看不出與RTX 5090有什么區(qū)別,對(duì)游戲性能造成的影響肯定是遠(yuǎn)小于RTX 4090 D當(dāng)初的。至于AI性能嘛,RTX 5090 D則從RTX 5090的3352 AI TOPS降至2375 AI TOPS,降幅約29%。
Blackwell架構(gòu)有多牛
不斷壯大的核心規(guī)模

其實(shí),完全體的 Blackwell GB202共有12組GPC、24576個(gè)CUDA核心,RTX 5090 D上的GB202-250則用了其中的88.5%。從整體結(jié)構(gòu)圖上還能看到,GigaThread Engine調(diào)度器隔壁多了一個(gè)叫做AI-Management Processor(AI管理處理器,簡(jiǎn)稱AMP)的幫手。AMP是一個(gè)位于管線前端的RISC-V處理器,支持Windows硬件加速GPU計(jì)劃,能夠更自由地管理GPU。CUDA、RT Core和Tensor Core三大部分在它的帶領(lǐng)下可以協(xié)調(diào)工作,實(shí)現(xiàn)AI響應(yīng)速度提高的同時(shí),游戲畫面也不會(huì)受到影響。

GPC段中,它所包含的TPC從Ada Lovelace的6組擴(kuò)展到了8組。不過布局上還是一樣的,一個(gè)獨(dú)立的光柵引擎,兩個(gè)ROP分區(qū)(每個(gè)包含8個(gè)ROP單元),而每組TPC包含兩組SM。

SM段的變化是比較大的?,F(xiàn)在所有的32個(gè)CUDA核心都能執(zhí)行FP32/INT32運(yùn)算了,因此INT32的算力可以說是增加了一倍。不過在一個(gè)時(shí)鐘周期里面,核心只能二選一運(yùn)算。NVIDIA表示,這種設(shè)計(jì)是為神經(jīng)著色器優(yōu)化的。

Tensor Core和RT Core自然也有升級(jí)。第5代Tensor Core繼承了上一代架構(gòu)的特性,并新增了FP4、FP6的支持,還把FP8 Transformer Engine更新到了第二代。其中,F(xiàn)P4是個(gè)比較值得關(guān)注的點(diǎn),它相比常規(guī)的FP16模型需要的顯存更小,在TensorRT模型優(yōu)化器的支持下能夠做到幾乎沒有質(zhì)量損失。

現(xiàn)在,Blackwell上的SER(著色器重排序) 2.0還可以將神經(jīng)網(wǎng)絡(luò)的負(fù)載直接發(fā)送至Tensor Core處理,加速神經(jīng)網(wǎng)絡(luò)渲染,效率達(dá)到了Ada Lovelace上的2倍,降低開銷之余還能提高精準(zhǔn)度。

同時(shí)運(yùn)作的話,LLM的響應(yīng)時(shí)間變慢,游戲幀率也會(huì)受影響

而第4代RT Core中,新增的組件包括有Triangle Cluster Intersection Engine、Triangle Cluster Compression Engine以及Linear Swept Spheres。同時(shí),Blackwell提供了兩倍于上一代Ada Lovelace的Ray-Triangle交叉檢測(cè)吞吐量。它們的出現(xiàn),與Mega Geometry技術(shù)息息相關(guān),起到一個(gè)打基礎(chǔ)的作用。

Mega Geometry是在TLAS(頂層加速結(jié)構(gòu))和BLAS(底層加速結(jié)構(gòu))兩個(gè)層級(jí)的架構(gòu)上做改進(jìn)。BLAS一側(cè)的Cluster-level Acceleration Structures(CLAS,簇級(jí)加速結(jié)構(gòu))最多能把256個(gè)三角形簇打包好,并將其作為BVH的基礎(chǔ)部分輸入,最后組成BVH樹。同時(shí),CLAS不僅能在游戲里面按需創(chuàng)建,還能緩存到硬盤里面,后面的幀要用的話直接從硬盤加載。這樣一來,系統(tǒng)要處理的事情就少很多了。

TLAS還有個(gè)兄弟叫Partitioned Top-Level Acceleration Structure(PTLAS,分區(qū)頂層加速架構(gòu)),是針對(duì)復(fù)雜場(chǎng)景設(shè)計(jì)的。NVIDIA表示,在很多游戲里面,場(chǎng)景內(nèi)有不少物品比如建筑都是固定不變的,但是如果每一幀都要給它們構(gòu)建一次TLAS,肯定就不劃算。而正如名稱中的Partitioned分區(qū)所示,PTLAS把場(chǎng)景內(nèi)的物體分成了多個(gè)區(qū)域,一些用來放置靜態(tài)的物品,然后一個(gè)全局分區(qū)用于處理動(dòng)態(tài)的物品,同樣可以做到減輕了系統(tǒng)的壓力,提高運(yùn)算效率。

值得一提的是,所有RTX顯卡都能支持Mega Geometry,但跟所有新技術(shù)一樣,Blackwell是目前支持最好的。
魔法一般的神經(jīng)網(wǎng)絡(luò)渲染
鋪墊了這么多的硬件基礎(chǔ),英偉達(dá)實(shí)際上是為了更好地構(gòu)筑神經(jīng)網(wǎng)絡(luò)渲染這項(xiàng)技術(shù),應(yīng)用范圍包括RTX神經(jīng)網(wǎng)絡(luò)紋理壓縮、RTX神經(jīng)網(wǎng)絡(luò)材質(zhì)、神經(jīng)網(wǎng)絡(luò)輻射緩存(NRC)以及RTX神經(jīng)網(wǎng)絡(luò)皮膚/面部。
RTX神經(jīng)紋理壓縮:使用AI在不到一分鐘的時(shí)間內(nèi)壓縮數(shù)千種紋理,在相同的視覺質(zhì)量下可以節(jié)省高達(dá)7倍的顯存占用。
RTX神經(jīng)材質(zhì):使用AI壓縮通常保留給離線材質(zhì)的復(fù)雜著色器代碼,并且這些材質(zhì)由多層組成,處理速度可提升5倍。
RTX神經(jīng)網(wǎng)絡(luò)輻射緩存:使用在實(shí)時(shí)游戲數(shù)據(jù)上訓(xùn)練的神經(jīng)網(wǎng)絡(luò),能更準(zhǔn)確和高效地估計(jì)游戲場(chǎng)景中的間接光照,而大幅減少光線追蹤的計(jì)算量。
RTX神經(jīng)網(wǎng)絡(luò)皮膚/面部:能夠使光線完成射入皮膚內(nèi)的反射和折射,并且基于AI模型生成更真實(shí)的面部和表情,改善人物的身整體呈現(xiàn)和解決恐怖谷效應(yīng)的問題。

RTX神經(jīng)材質(zhì)

RTX神經(jīng)網(wǎng)絡(luò)輻射緩存

RTX神經(jīng)網(wǎng)絡(luò)皮膚

RTX神經(jīng)網(wǎng)絡(luò)面部
DLSS 4:幀生成PLUS

新一代Blackwell架構(gòu)GPU上引入了DLSS 4,提供了多幀生成功能,即在每個(gè)傳統(tǒng)渲染的幀之間生成多達(dá)三個(gè)額外的幀。這不僅基于Blackwell的幀生成模型比上一代快了40%、顯存占用降低30%的強(qiáng)大優(yōu)勢(shì),而且用于提供光流場(chǎng)信息的不再是RTX 40系列上的光流加速器,而是一個(gè)更高效的AI模型。

為了避免輸出幀畫面過多導(dǎo)致的順序亂套,英偉達(dá)還引入了Flip Metering功能,能夠?qū)交壿嫃腃PU轉(zhuǎn)移到GPU的顯示引擎上,讓GPU更精確地掌控顯示每一幀的節(jié)奏并降低幀時(shí)間。而剛好Blackwell的顯示引擎擁有較為出色的像素處理能力,可以以支持更高的分辨率和刷新率,從而實(shí)現(xiàn)帶有DLSS 4的Flip Metering。不過,由于DLSS 4多幀生成需要用到第5代Tensor Core的強(qiáng)勁算力去計(jì)算光流場(chǎng)和生成多幀,因此這個(gè)功能目前是Blackwell獨(dú)占的。

此外,超分辨率、光線重建、DLAA也獲得了更新,它們的模型從CNN換成了Transformer,是一個(gè)采用自注意力機(jī)制的神經(jīng)網(wǎng)絡(luò),能夠提高畫面的穩(wěn)定性,提升光照細(xì)節(jié),給予動(dòng)態(tài)物體更多細(xì)節(jié)。預(yù)計(jì)在未來數(shù)年里,圖像質(zhì)量會(huì)持續(xù)提升。

對(duì)于游戲和應(yīng)用,DLSS 4結(jié)合多幀生成、光線重建和超級(jí)分辨率技術(shù),將幀率提升至普通渲染的最高8倍,并在從幀生成升級(jí)到多幀生成時(shí),進(jìn)一步提高幀率高達(dá)1.7倍,性能提升效果非常地明顯。
延遲救星NVIDIA Reflex 2

這時(shí)可能會(huì)有朋友說到了,DLSS 4補(bǔ)幀這么猛,延遲不會(huì)大打折扣嗎?英偉達(dá)對(duì)此早已給出了對(duì)策——NVIDIA Reflex 2。它結(jié)合了Reflex低延遲模式和新的Frame Warp技術(shù),能夠把最新的鼠標(biāo)輸入指令同步給渲染幀,及時(shí)更新渲染的游戲幀并在渲染幀被發(fā)送到顯示器之前獲取最新的鼠標(biāo)信息,通過刷新渲染的游戲幀以進(jìn)一步減少延遲,將PC延遲進(jìn)一步降低多達(dá)75%。
NVENC和NVDEC新增YUV422支持
目前很多攝像機(jī)都支持錄制YUV422格式的視頻,這是有原因的:YUV422相比起YUV444更節(jié)省儲(chǔ)存空間,但是比起YUV420能保存更多的顏色,這樣一來就給后期調(diào)色留下了充足的空間。Blackwell這次新增了YUV422的編解碼支持,從而能提高創(chuàng)作者的效率,比如說導(dǎo)出時(shí)間減少,更流暢的多路回放等。NVIDIA表示,第6代NVDEC可同步解碼和播放多達(dá)8個(gè)4K60 YUV422視頻流。

而第9代NVENC則提升了HEVC和AV1的編碼質(zhì)量,為YUV422 H.264和HVEC編碼提供了支持。另外,還有一個(gè)全新的AV1 Ultra High Quality(UHQ)模式,它可以用更多的時(shí)間去獲得額外5%的質(zhì)量提升。NVIDIA還表示,這個(gè)模式在RTX 40系列上也可用,不過Blackwell的質(zhì)量是更好的。
顯卡解析:踏雪至山巔
我們把目光放回我們本次評(píng)測(cè)的主角——耕升 RTX 5090 D 踏雪。由于它是不帶OC的標(biāo)準(zhǔn)版,包括核心Boost頻率在內(nèi)的絕大部分參數(shù)都與英偉達(dá)官方標(biāo)稱一致。

外觀與包裝

耕升 RTX 4070 SUPER 踏雪
說實(shí)話,老踏雪給我的印象妥妥的是一張定位高端純白顯卡,如果將它的外觀直接搬到萬元級(jí)的RTX 5090 D上,多少是缺少誠(chéng)意的,重新設(shè)計(jì)是勢(shì)在必行。


雪花標(biāo)志依舊是踏雪系列顯卡的靈魂所在,從外包裝上,耕升就將此十分直接地展現(xiàn)出來,旁邊附易略帶古風(fēng)的“踏雪”字樣,給人一種磅礴凜冽之感。三年個(gè)人送保服務(wù)作為耕升引以為傲的優(yōu)勢(shì),自然也是會(huì)標(biāo)注在最顯眼的地方。



拿出顯卡本體后我們可以看到,RTX 5090 D 踏雪果然是沒有讓我們失望。純白外殼不僅與散熱鰭片盡可能地齊平貼合,而且尾部延伸至金屬背板,帶來非常不錯(cuò)的一體性觀感。三把第三代炫風(fēng)之刃風(fēng)扇(兩側(cè)100mm,中間90mm)采用了性能表現(xiàn)更好的環(huán)形連葉設(shè)計(jì),扇葉表面還有紋理加強(qiáng)導(dǎo)流。軸心處注入了標(biāo)志性的雪花logo,在同心圓金屬紋理的襯托之下倍顯質(zhì)感。






不僅如此,我們從顯卡的大部分地方都能看到大量的雪花圖案,充分展現(xiàn)“踏雪”之意。其中,最值得一提的就是側(cè)面的logo燈板了,轉(zhuǎn)角過渡的設(shè)計(jì)剛好對(duì)應(yīng)著常規(guī)安裝時(shí)的展示視角,給人一種曲面屏般的立體觀感。比起以往的踏雪系列顯卡,RTX 5090 D踏雪的顏值可謂是脫胎換骨了。
顯卡的供電接口從RTX 4090公版的12VHPWR升級(jí)成了更安全的12V-2×6,并且旋轉(zhuǎn)了180°,卡扣朝上,便于用戶拔插的同時(shí)減少插不牢的概率。在它的旁邊是ARGB燈光同步接口,配合附送的線材使用。
顯卡的顯示輸出接口和英偉達(dá)官方標(biāo)稱的一樣,為三個(gè)DP2.1b+一個(gè)HDMI2.1b的組合。PCIe擋板只給到了雙槽,其中一槽多是散熱開孔,剩余厚度位置被外殼所覆蓋。







尺寸方面,我們手動(dòng)測(cè)量的結(jié)果的328×122×61mm(不包含擋板凸出長(zhǎng)度和插槽),厚度大約是三槽多一點(diǎn),對(duì)常規(guī)的MATX主板和機(jī)箱來說不太友好。不過都上旗艦卡了,一般情況下用戶都會(huì)首先考慮大機(jī)箱。至于ITX用戶,就只能按自身的實(shí)際情況去判斷了。顯卡實(shí)測(cè)重量是1907g,份量不小,正常安裝方式下建議搭配顯卡支架使用,盡可能避免造成PCB彎曲。

而配件這邊,耕升也是附送了一個(gè)與顯卡相稱的銀白色顯卡金屬支架,底部帶有磁吸固定,安裝在機(jī)箱時(shí)不易脫落。另外就是常規(guī)的四8Pin轉(zhuǎn)12V-2×6供電線以及5V ARGB燈光控制線,后者可直接實(shí)現(xiàn)與主板燈效同步,無需在顯卡控制軟件內(nèi)部進(jìn)行額外的設(shè)置。
顯卡拆解




全新的雪魂散熱裝置配備了7根8mm復(fù)合式鍍鎳熱管,核心接觸面底座為VC均熱板,提供高效的散熱能力。供電元件、顯存芯片也覆蓋有導(dǎo)熱墊與散熱模塊上的一體式金屬中框充分接觸。






耕升 RTX 5090 D 踏雪采用了14層PCB設(shè)計(jì),供電配置給到了16+7+6相,主供電控制芯片放置在了PCB的左上角,為來自MPS的MP29816-A,所用的MOSFET全部是來自MPS的MP97993,最大支持電流為50A。

背面還有一顆型號(hào)為uS5650Q的供電控制芯片




風(fēng)扇PWM接口和5V ARGB燈光接口在PCB的右下方,三把風(fēng)扇現(xiàn)在是單獨(dú)控制。



GB202-250-A1核心在PCB的中心位置,周圍環(huán)繞著16顆三星的GDDR7芯片,每顆容量為2GB,位寬為32-bit,組成512-bit/32GB的規(guī)格。
顯卡背部元件不多,一眼看過去很干凈,基本都布局在了正面,可見這次耕升 RTX 5090 D 踏雪的硬件集成度非常高。
性能測(cè)試:“軟硬”兼施效果顯著
測(cè)試平臺(tái)與說明


為了能夠發(fā)揮出耕升 RTX 5090 D 踏雪的最佳表現(xiàn),測(cè)試平臺(tái)的CPU選用了當(dāng)下最強(qiáng)游戲CPU——AMD Ryzen 7 9800X3D;與之搭配的主板為微星 MPG X870E CARBON WIFI 暗黑,擁有18+2+1相110A SPS智能供電的它即便是帶旗艦級(jí)別的Ryzen 9 9950X也是不在話下,另外主板還配備了具有戰(zhàn)未來屬性的PICe 8Pin輔助供電接口,為顯卡提供穩(wěn)定,高效和持續(xù)的電力供應(yīng)(測(cè)試時(shí)并沒有接,主要是考慮到其他品牌主板沒有配備該接口,不進(jìn)行“作弊”);內(nèi)存輔以芝奇 Trident Z5 RGB 32GB雙通道DDR5-6000 CL30內(nèi)存,甜點(diǎn)頻率+低延遲的組合不僅對(duì)于絕大部分用戶都能夠?qū)崿F(xiàn),而且我們實(shí)測(cè)相比高頻在實(shí)際使用中差別非常小。
參加測(cè)試的顯卡除了耕升 RTX 5090 D 踏雪,還有作為對(duì)比的GeForce RTX 4090 D。測(cè)試兼顧2K和4K分辨率,包括基準(zhǔn)性能跑分、傳統(tǒng)光柵游戲以及光追游戲,DLSS測(cè)試部分加入了最新的DLSS 4。
基準(zhǔn)性能測(cè)試
首先是純理論跑分,會(huì)以3D Mark作為顯卡基準(zhǔn)性能測(cè)試,測(cè)試項(xiàng)目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Steel Nomad、Port Royal、以及Speed Way八個(gè)項(xiàng)目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個(gè)項(xiàng)目分別測(cè)試的是顯卡在DX11游戲中的1080P分辨率、2K分辨率和4K分辨率下的性能指數(shù),Time Spy、Time Spy Extreme兩個(gè)項(xiàng)目則是顯卡在DX12游戲中的2K分辨率和4K分辨率下的性能指數(shù),Port Royal是測(cè)試的顯卡實(shí)時(shí)光線追蹤的性能指數(shù)。另外還有去年推出的Steel Nomad,這是原有的Time Spy基準(zhǔn)測(cè)試的繼承者,屬于新的非光追顯卡基準(zhǔn)性能測(cè)試工具。而NVIDA DLSS測(cè)試項(xiàng)目中,由于我們拿到的是測(cè)試版本,可以對(duì)DLSS 4的性能表現(xiàn)進(jìn)行一個(gè)初步的預(yù)估,具有第一定的參考價(jià)值,具體設(shè)置為4K質(zhì)量擋位,幀生成選項(xiàng)提供了2X,3X和4X三擋切換,其中DLSS 4 2X其實(shí)就是DLSS 3 2X,即渲染1幀生成1幀。RTX 4090 D不支持DLSS 4,因此就沒有相關(guān)的成績(jī)了。
具體成績(jī)見下表,表中所列成績(jī)均為3D Mark顯卡單項(xiàng)的得分。

在3DMark測(cè)試中可以看到,耕升 RTX 5090 D 踏雪要比RTX 4090 D快35%~66.5%,其中,Steel Nomad、Port Royal和Speed Way三個(gè)測(cè)試中擁有相當(dāng)明顯的優(yōu)勢(shì),領(lǐng)先幅度都在50%以上,兩項(xiàng)考驗(yàn)DX12性能的Time Spy的測(cè)試?yán)锩嬉渤^了45%,代表DX11性能的Fire Strike則隨著分辨率的降低,領(lǐng)先幅度逐步縮小。

耕升 RTX 5090 D 踏雪憑借更出色的性能表現(xiàn)在原生畫質(zhì)中就拔得頭籌,再加上DLSS 4的助力,幀數(shù)的提升相當(dāng)夸張,4X時(shí)大約達(dá)到了原生的5.6倍。這不禁讓人更加期待它的實(shí)際游戲體驗(yàn)了。
游戲測(cè)試
在這次游戲測(cè)試環(huán)節(jié)中,我們?cè)?K分辨率選擇了7款光柵化游戲及光追游戲,2K分辨率選擇了4款光柵化游戲及光追游戲,另外還有3款DLSS 4游戲。一般情況下,游戲會(huì)選擇極高或者超高的預(yù)設(shè)畫質(zhì),光追游戲如果有路徑光追都會(huì)是優(yōu)先選項(xiàng),同時(shí)這些測(cè)試?yán)锒紱]有開啟DLSS。由于GeForce RTX 5090 D屬于旗艦顯卡,基本上都是以4K游戲?yàn)槟繕?biāo),2K游戲則選擇壓力較大的幾款大作,壓力非常小的1080P分辨率的參考意義較低,就不作測(cè)試。
4K分辨率 光柵游戲

光追游戲

在4K光柵游戲的環(huán)節(jié),除了《黑神話:悟空》勉強(qiáng)達(dá)到流暢之外,其余游戲在耕升 RTX 5090 D 踏雪面前基本算得上的游刃有余,相比RTX 4090 D有著較為明顯的幀數(shù)提升。
開啟光追之后,兩者依然保有一定的性能差距, RTX 5090 D均能做到30fps以上,而RTX 4090 D有4款游戲是低于30fps的。但總體來說,要想4K光追暢玩,新一代顯卡還是要依賴DLSS。
2K分辨率 光柵游戲

光追游戲

轉(zhuǎn)戰(zhàn)壓力較小的2K分辨率之后,耕升 RTX 5090 D 踏雪毫無意外是繼續(xù)領(lǐng)先。2K光柵對(duì)于它來說基本上是不成問題了,RTX 4090 D面對(duì)《黑神話:悟空》還是處于勉強(qiáng)過關(guān)的程度。2K光追的情況同樣如此,RTX 5090 D悉數(shù)踩著60fps的暢玩基礎(chǔ)線過關(guān),RTX 4090 D除了《心靈殺手2》外都只有40多fps。
總體來說,RTX 5090 D讓很多大作在高分辨率+光追+原生畫質(zhì)的條件下完成了從不可玩到可玩轉(zhuǎn)變,打好的原生幀數(shù)的基礎(chǔ),才能更好地發(fā)揮DLSS幀生成的優(yōu)勢(shì),提升游戲體驗(yàn)。
DLSS 4性能測(cè)試
在DLSS 4測(cè)試項(xiàng)目中,我們選擇了四款游戲,包括《賽博朋克2077》、《心靈殺手2》、《星球大戰(zhàn):亡命之徒》和《漫威爭(zhēng)鋒》。原本想測(cè)試更多支持DLSS 4的游戲,但是遇到了不穩(wěn)定等情況,而且時(shí)間有限。相信當(dāng)大家收到RTX 50系顯卡的時(shí)候,應(yīng)該就會(huì)有很多游戲獲得原生DLSS 4或DLSS優(yōu)化支持了。幀生成選項(xiàng)和3D Mark的DLSS測(cè)試項(xiàng)目一樣,提供了2X,3X和4X三擋切換,而RTX 40系顯卡是只有開關(guān)選項(xiàng),沒有給到增幅擋位。

在DLSS 4功能測(cè)試版的《賽博朋克2077》中,畫質(zhì)設(shè)置菜單里新增了超分辨率模型選擇,玩家可以選擇全新的Transformer或以前的CNN模型,雖然說是超分辨率,但其實(shí)光線重建的模型也會(huì)被一并切換。

NVIDIA App的設(shè)置跟游戲中的類似,也是分成模型選擇、幀生成倍數(shù)和超分辨率三個(gè)選項(xiàng)。一般來說因?yàn)槭球?qū)動(dòng)級(jí)設(shè)置,過程可能比游戲內(nèi)設(shè)置要略微多花一點(diǎn)時(shí)間,比如我們這次測(cè)試的《漫威爭(zhēng)鋒》,就需要先設(shè)置好再開游戲,而不能在游戲里實(shí)時(shí)設(shè)置。
測(cè)試內(nèi)容除了原生幀率外,我們嘗試了新舊兩種不同模型,以及不同倍數(shù)的設(shè)置,讓大家可以更好地去做對(duì)比。需要說明的是,《星球大戰(zhàn):亡命之徒》不支持DLSS新舊模型切換。



DLSS 4對(duì)于幀數(shù)的提升是肉眼可見的大,均是成倍地增加,同時(shí),多擋位以及雙模型的切換也為用戶提供了更多的選擇。大家最關(guān)心的延遲問題其實(shí)總體感覺還好,大部分情況下DLSS 4 和DLSS 2/3僅存在些許的差距,且明顯好于原生,實(shí)際體驗(yàn)的感知并不明顯。另外,畫質(zhì)方面這里給到大家Transformer和CNN兩個(gè)新舊模型的對(duì)比,所有的對(duì)比截圖均是在性能擋獲取的,屏幕分辨率為4K,渲染分辨率則是1920 x 1080。


CNN模型CNN模型Transformer模型Transformer模型


CNN模型CNN模型Transformer模型Transformer模型


CNN模型CNN模型Transformer模型Transformer模型


CNN模型CNN模型Transformer模型Transformer模型
顯而易見,Transformer在細(xì)節(jié)處理上要比CNN好上不少,不僅是正常的畫面,而且水面的倒影也是更加清晰。在畫面穩(wěn)定性這塊,新模型還顯著減少了物體邊緣處的閃爍以及偽影現(xiàn)象。
AI與生產(chǎn)力性能測(cè)試
AI生圖與大語(yǔ)言模型


前面也提到了,RTX 5090 D新增了FP4的支持,具體表現(xiàn)究竟會(huì)如何呢?在UL Procyon FLUX.1 AI生圖測(cè)試?yán)锩?,RTX 5090 D在FP4模式下僅用了4秒不到就生成了一張圖,而RTX 4090 D則是要花上將近20秒。在FP8模式里面,RTX 5090 D的速度依然是RTX 4090 D的1.7倍。


至于不少玩家關(guān)注常規(guī)FP16性能,我們也做了相應(yīng)的Stable Diffusion測(cè)試。需要提一下的是,在我們測(cè)試時(shí)公開的TensorRT加速庫(kù)還沒更新對(duì)RTX 50系列的支持,所以我們是用ONNX DirectML運(yùn)行時(shí)進(jìn)行測(cè)試的。在這個(gè)測(cè)試中,RTX 5090 D仍然處于領(lǐng)先位置。盡管RTX 5090 D在這個(gè)情況下的生成速度也挺快的了,要是有TensorRT的話,速度會(huì)更上一層樓。



LLM類別的測(cè)試中,涉及的模型要多不少,但在首Token延遲和輸出Token速度這些關(guān)鍵指標(biāo)上,RTX 5090 D在大部分模型里面要比RTX 4090 D好上約30%。
生產(chǎn)力創(chuàng)意軟件


3D創(chuàng)作有關(guān)的軟件中,V-Ray和Blender我們認(rèn)為是比較有代表性的,在這里面,RTX 5090 D相比RTX 4090 D獲得了超過25%的增幅。
溫度測(cè)試
我們的GPU散熱測(cè)試均在裸機(jī)狀態(tài)(如果安裝在機(jī)箱內(nèi),GPU溫度會(huì)高出5℃左右)下進(jìn)行測(cè)試,測(cè)試環(huán)境溫度約為23.5℃。待機(jī)溫度是開機(jī)以后記錄5分鐘,滿載溫度則是完成3DMark Speed Way壓力測(cè)試后記錄下,數(shù)據(jù)通過GPU-Z的Log to File功能記錄,以下為溫度測(cè)試曲線。


耕升 RTX 5090 D 踏雪支持低溫風(fēng)扇停轉(zhuǎn),所以待機(jī)溫度都是被動(dòng)散熱下的溫度,整體呈緩慢上升的趨勢(shì),直到最高的42.5℃依然是處于停轉(zhuǎn)狀態(tài)。滿載時(shí),顯卡的最高溫度大約在第6分鐘達(dá)到最高,為72.1℃。在此之后,風(fēng)扇轉(zhuǎn)速還是稍有增加,最高達(dá)到1844 RPM以更好地維持在相對(duì)較低的工作溫度范圍內(nèi)。
功耗測(cè)試
我們通過手中的PCAT套件,分別精確地測(cè)量顯卡PCIe、外接電源接口瓦特?cái)?shù),顯卡最大功耗在3DMark Speed Way壓力測(cè)試中獲得,待機(jī)功耗則是在進(jìn)入系統(tǒng)后記錄1分鐘取平均值。

統(tǒng)計(jì)功耗測(cè)試的結(jié)果算出,我們手上這張耕升 RTX 5090 D 踏雪顯卡的整卡平均待機(jī)功耗約為31W,滿載平均功耗在584W左右,峰值功耗達(dá)到了668W,已達(dá)到16-Pin 12V-2x6供電接口滿載狀態(tài)。這也就不難解釋為什么英偉達(dá)官方給到的電源瓦數(shù)建議從RTX 4090的850W提升至了1000W。
噪音測(cè)試
在GPU-Z的Log to File中我們同時(shí)記錄下了顯卡轉(zhuǎn)速情況。由于這次的RTX 5090 D顯卡風(fēng)扇均獨(dú)立控制,我們只標(biāo)出最速較高的一個(gè),為1844 RPM。接著我們把顯卡放進(jìn)了環(huán)境噪音小于10 dB(A)的消音實(shí)驗(yàn)室,把其風(fēng)扇還原同樣轉(zhuǎn)速,然后在30CM的距離上測(cè)試其噪音水平,由于顯卡在待機(jī)時(shí)風(fēng)扇是停轉(zhuǎn)的,所以就不用測(cè)試了。


耕升 RTX 5090 D 踏雪所測(cè)得的噪音值為44.4 dB(A),在開放平臺(tái)下會(huì)感受到些許聲響,如果按照正常用戶裝入機(jī)箱的使用習(xí)慣,應(yīng)該是感知不明顯的。
GW-SOUL控制軟件體驗(yàn)

前面我們有提到,耕升 RTX 5090 D 踏雪的三把風(fēng)扇現(xiàn)在是獨(dú)立控制的,舊版本的控制軟件是只能控制其中的兩把。而新版的GW-SOUL里面,風(fēng)扇調(diào)節(jié)一欄就明確顯示三把風(fēng)扇均單獨(dú)可調(diào)了。此外,軟件還提供了顯卡實(shí)時(shí)狀態(tài)信息、超頻和燈光調(diào)節(jié)功能,右上角給到了主板燈光同步開關(guān)。
總結(jié):難以撼動(dòng)的旗艦級(jí)性能表現(xiàn)

從耕升 RTX 5090 D 踏雪身上我們可以看到,英偉達(dá)的新一代旗艦顯卡主要是在核心規(guī)模和相關(guān)技術(shù)上取得明顯進(jìn)步,擁有符合現(xiàn)時(shí)市場(chǎng)競(jìng)爭(zhēng)狀況的代際提升幅度,游戲及AI生產(chǎn)力表現(xiàn)出色。尤其是極具戰(zhàn)未來意義的神經(jīng)網(wǎng)絡(luò)渲染與DLSS 4技術(shù),更是將一些有著極高性能需求的游戲馴服妥帖。不過,由于芯片制程工藝沒有變化,功耗增加是在所難免的,供電接口上引入了最新的12V-2×6正是為此而保駕護(hù)航,當(dāng)然,搭配1000W或以上的ATX 3電源使用也是必不可少的。
價(jià)格方面,英偉達(dá)官方給到的建議零售價(jià)雖為16499元,但耕升 RTX 5090 D 踏雪作為一張用料扎實(shí)又有純白外觀和全新設(shè)計(jì)加持的非公版顯卡實(shí)際上市的價(jià)格應(yīng)該會(huì)略有增加,同時(shí),首發(fā)的熱度所帶來的供需變化可能也會(huì)成為價(jià)格波動(dòng)的因素之一。盡管如此,由于主要競(jìng)爭(zhēng)對(duì)手AMD沒有給到足夠的壓力,相信在未來的好一段時(shí)間內(nèi),RTX 5090 D會(huì)穩(wěn)居最強(qiáng)消費(fèi)級(jí)顯卡的寶座,價(jià)格不會(huì)影響對(duì)其有需求用戶的購(gòu)買動(dòng)力。
相關(guān)文章

4K高刷暢玩光追游戲! 影馳GeFroce RTX5090D大將顯卡評(píng)測(cè)
影馳推出了GeForce RTX 5090 D大將這款顯卡,很多朋友想要知道這款顯卡性能如何?下面我們就來看看詳細(xì)測(cè)評(píng)2025-02-11
延續(xù)家族系列黑灰配色! 映眾RTX 5090 D曜夜X3顯卡開箱
年發(fā)布的RTX 50系列,可謂搶足風(fēng)頭,包括超級(jí)冰龍、曜夜和映雪三大子品牌,比如那個(gè)號(hào)稱頂配王者的是RTX5090 D曜夜X3,下面我們就來看看這款顯卡的開箱2025-01-24
高端發(fā)燒玩家的白色戀人! AX電競(jìng)叛客RTX 5090 D X3W顯卡開箱
今天我們就為大家送上來自柏能集團(tuán)旗下品牌AX電競(jìng)叛客的RTX 5090 D X3W顯卡的圖賞,近距離欣賞這款純白大作的魅力2025-01-24
七彩虹首張RTX 50系顯卡! iGame GeForce RTX 5090 D Advanced 32GB開箱
首款GeForce RTX 50系顯卡---GeForce RTX 5090D就要在國(guó)內(nèi)亮相啦,這款顯卡怎么樣?下面我們就來看看開箱體驗(yàn)2025-01-22
英偉達(dá)RTX 50系列顯卡性能大升級(jí): 5090旗艦級(jí)性能最高增幅70%
近期,關(guān)于英偉達(dá)即將推出的GeForce RTX 50系列顯卡的性能提升幅度,引起了廣泛關(guān)注,這一全新系列的顯卡在性能上將迎來顯著提升,其中旗艦產(chǎn)品RTX 5090的性能提升幅度預(yù)計(jì)2024-12-15






