欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

性能更強 功耗更高! GeForce RTX 5090 D顯卡天梯榜首測

  發(fā)布時間:2025-02-12 08:20:25   作者:佚名   我要評論
耕升RTX 5090 D踏雪憑借優(yōu)秀的硬件設(shè)計與軟硬結(jié)合的技術(shù)創(chuàng)新,定義了高性能顯卡的新標(biāo)準(zhǔn),詳細(xì)請看下文測評

時隔兩年又三個多月,英偉達終于帶來了全新的GeForce RTX 50系顯卡。然而受到相關(guān)規(guī)定(滿足綜合運算性能TPP不超過4800的限制)的影響,RTX 5090的命運和RTX 4090一樣,化身RTX 5090 D進入國內(nèi)市場。同時,RTX 5090 D是沒有公版(Founder Edition)的,因此,高端玩家們就只能從一眾非公顯卡里面去挑選適合自己的那一款了。

而說起耕升的踏雪系列,可能大家第一時間更多會想到純白設(shè)計、中高端定位,很難會將過往最高只搭載過RTX 4070 TI SUPER芯片的它和旗艦顯卡聯(lián)想到一起。不過,當(dāng)英偉達正式進入RTX 50系顯卡時代之后,踏雪也迎來的蛻變,出現(xiàn)在了耕升的RTX 5090 D的產(chǎn)品名單里面。在了解耕升 GeForce RTX 5090 D 踏雪之前,我們先來簡單回顧一下英偉達RTX 50系顯卡到底有什么新的特點。

關(guān)于RTX 5090 D

相較于上一代RTX 4090 D來看,RTX 5090 D在芯片的規(guī)模上有了較大幅度的升級。雖然制程工藝不變,依然是定制的TSMC 4N,但是,憑借更大的芯片面積和新一代的Blackwell核心架構(gòu),后者的晶體管數(shù)量從763億個增加至922億個,CUDA核心數(shù)量增加將近50%,而且同樣是12個GPC,RTX 5090 D每個GPC里的TPC和SM數(shù)量增多了,TPC從6個增至8個,SM從12個增至16個。編解碼器同樣進行了迭代加碼,新增了4:2:2色度采樣視頻編解碼的能力,節(jié)省CPU的負(fù)擔(dān),提升內(nèi)容創(chuàng)作者的工作效率。此外,RTX 5090 D還用上了容量更大、性能更強的GDDR7顯存,位寬也從384-bit增至512-bit。顯示輸出接口升級為3×DisplayPort 2.1b+1×HDMI 2.1b的配置,借助DSC技術(shù)最高支持4K@480Hz或8K@140Hz。

不過,這次的RTX 5090 D的命運并不像RTX 4090 D一樣在核心規(guī)格作出調(diào)整。我們從表面參數(shù)上基本看不出與RTX 5090有什么區(qū)別,對游戲性能造成的影響肯定是遠(yuǎn)小于RTX 4090 D當(dāng)初的。至于AI性能嘛,RTX 5090 D則從RTX 5090的3352 AI TOPS降至2375 AI TOPS,降幅約29%。

Blackwell架構(gòu)有多牛

不斷壯大的核心規(guī)模

其實,完全體的 Blackwell GB202共有12組GPC、24576個CUDA核心,RTX 5090 D上的GB202-250則用了其中的88.5%。從整體結(jié)構(gòu)圖上還能看到,GigaThread Engine調(diào)度器隔壁多了一個叫做AI-Management Processor(AI管理處理器,簡稱AMP)的幫手。AMP是一個位于管線前端的RISC-V處理器,支持Windows硬件加速GPU計劃,能夠更自由地管理GPU。CUDA、RT Core和Tensor Core三大部分在它的帶領(lǐng)下可以協(xié)調(diào)工作,實現(xiàn)AI響應(yīng)速度提高的同時,游戲畫面也不會受到影響。

GPC段中,它所包含的TPC從Ada Lovelace的6組擴展到了8組。不過布局上還是一樣的,一個獨立的光柵引擎,兩個ROP分區(qū)(每個包含8個ROP單元),而每組TPC包含兩組SM。

SM段的變化是比較大的?,F(xiàn)在所有的32個CUDA核心都能執(zhí)行FP32/INT32運算了,因此INT32的算力可以說是增加了一倍。不過在一個時鐘周期里面,核心只能二選一運算。NVIDIA表示,這種設(shè)計是為神經(jīng)著色器優(yōu)化的。

Tensor Core和RT Core自然也有升級。第5代Tensor Core繼承了上一代架構(gòu)的特性,并新增了FP4、FP6的支持,還把FP8 Transformer Engine更新到了第二代。其中,F(xiàn)P4是個比較值得關(guān)注的點,它相比常規(guī)的FP16模型需要的顯存更小,在TensorRT模型優(yōu)化器的支持下能夠做到幾乎沒有質(zhì)量損失。

現(xiàn)在,Blackwell上的SER(著色器重排序) 2.0還可以將神經(jīng)網(wǎng)絡(luò)的負(fù)載直接發(fā)送至Tensor Core處理,加速神經(jīng)網(wǎng)絡(luò)渲染,效率達到了Ada Lovelace上的2倍,降低開銷之余還能提高精準(zhǔn)度。

同時運作的話,LLM的響應(yīng)時間變慢,游戲幀率也會受影響

而第4代RT Core中,新增的組件包括有Triangle Cluster Intersection Engine、Triangle Cluster Compression Engine以及Linear Swept Spheres。同時,Blackwell提供了兩倍于上一代Ada Lovelace的Ray-Triangle交叉檢測吞吐量。它們的出現(xiàn),與Mega Geometry技術(shù)息息相關(guān),起到一個打基礎(chǔ)的作用。

Mega Geometry是在TLAS(頂層加速結(jié)構(gòu))和BLAS(底層加速結(jié)構(gòu))兩個層級的架構(gòu)上做改進。BLAS一側(cè)的Cluster-level Acceleration Structures(CLAS,簇級加速結(jié)構(gòu))最多能把256個三角形簇打包好,并將其作為BVH的基礎(chǔ)部分輸入,最后組成BVH樹。同時,CLAS不僅能在游戲里面按需創(chuàng)建,還能緩存到硬盤里面,后面的幀要用的話直接從硬盤加載。這樣一來,系統(tǒng)要處理的事情就少很多了。

TLAS還有個兄弟叫Partitioned Top-Level Acceleration Structure(PTLAS,分區(qū)頂層加速架構(gòu)),是針對復(fù)雜場景設(shè)計的。NVIDIA表示,在很多游戲里面,場景內(nèi)有不少物品比如建筑都是固定不變的,但是如果每一幀都要給它們構(gòu)建一次TLAS,肯定就不劃算。而正如名稱中的Partitioned分區(qū)所示,PTLAS把場景內(nèi)的物體分成了多個區(qū)域,一些用來放置靜態(tài)的物品,然后一個全局分區(qū)用于處理動態(tài)的物品,同樣可以做到減輕了系統(tǒng)的壓力,提高運算效率。

值得一提的是,所有RTX顯卡都能支持Mega Geometry,但跟所有新技術(shù)一樣,Blackwell是目前支持最好的。

魔法一般的神經(jīng)網(wǎng)絡(luò)渲染

鋪墊了這么多的硬件基礎(chǔ),英偉達實際上是為了更好地構(gòu)筑神經(jīng)網(wǎng)絡(luò)渲染這項技術(shù),應(yīng)用范圍包括RTX神經(jīng)網(wǎng)絡(luò)紋理壓縮、RTX神經(jīng)網(wǎng)絡(luò)材質(zhì)、神經(jīng)網(wǎng)絡(luò)輻射緩存(NRC)以及RTX神經(jīng)網(wǎng)絡(luò)皮膚/面部。

RTX神經(jīng)紋理壓縮:使用AI在不到一分鐘的時間內(nèi)壓縮數(shù)千種紋理,在相同的視覺質(zhì)量下可以節(jié)省高達7倍的顯存占用。

RTX神經(jīng)材質(zhì):使用AI壓縮通常保留給離線材質(zhì)的復(fù)雜著色器代碼,并且這些材質(zhì)由多層組成,處理速度可提升5倍。

RTX神經(jīng)網(wǎng)絡(luò)輻射緩存:使用在實時游戲數(shù)據(jù)上訓(xùn)練的神經(jīng)網(wǎng)絡(luò),能更準(zhǔn)確和高效地估計游戲場景中的間接光照,而大幅減少光線追蹤的計算量。

RTX神經(jīng)網(wǎng)絡(luò)皮膚/面部:能夠使光線完成射入皮膚內(nèi)的反射和折射,并且基于AI模型生成更真實的面部和表情,改善人物的身整體呈現(xiàn)和解決恐怖谷效應(yīng)的問題。

RTX神經(jīng)材質(zhì)

RTX神經(jīng)網(wǎng)絡(luò)輻射緩存

RTX神經(jīng)網(wǎng)絡(luò)皮膚

RTX神經(jīng)網(wǎng)絡(luò)面部

DLSS 4:幀生成PLUS

新一代Blackwell架構(gòu)GPU上引入了DLSS 4,提供了多幀生成功能,即在每個傳統(tǒng)渲染的幀之間生成多達三個額外的幀。這不僅基于Blackwell的幀生成模型比上一代快了40%、顯存占用降低30%的強大優(yōu)勢,而且用于提供光流場信息的不再是RTX 40系列上的光流加速器,而是一個更高效的AI模型。

為了避免輸出幀畫面過多導(dǎo)致的順序亂套,英偉達還引入了Flip Metering功能,能夠?qū)交壿嫃腃PU轉(zhuǎn)移到GPU的顯示引擎上,讓GPU更精確地掌控顯示每一幀的節(jié)奏并降低幀時間。而剛好Blackwell的顯示引擎擁有較為出色的像素處理能力,可以以支持更高的分辨率和刷新率,從而實現(xiàn)帶有DLSS 4的Flip Metering。不過,由于DLSS 4多幀生成需要用到第5代Tensor Core的強勁算力去計算光流場和生成多幀,因此這個功能目前是Blackwell獨占的。

此外,超分辨率、光線重建、DLAA也獲得了更新,它們的模型從CNN換成了Transformer,是一個采用自注意力機制的神經(jīng)網(wǎng)絡(luò),能夠提高畫面的穩(wěn)定性,提升光照細(xì)節(jié),給予動態(tài)物體更多細(xì)節(jié)。預(yù)計在未來數(shù)年里,圖像質(zhì)量會持續(xù)提升。

對于游戲和應(yīng)用,DLSS 4結(jié)合多幀生成、光線重建和超級分辨率技術(shù),將幀率提升至普通渲染的最高8倍,并在從幀生成升級到多幀生成時,進一步提高幀率高達1.7倍,性能提升效果非常地明顯。

延遲救星NVIDIA Reflex 2

這時可能會有朋友說到了,DLSS 4補幀這么猛,延遲不會大打折扣嗎?英偉達對此早已給出了對策——NVIDIA Reflex 2。它結(jié)合了Reflex低延遲模式和新的Frame Warp技術(shù),能夠把最新的鼠標(biāo)輸入指令同步給渲染幀,及時更新渲染的游戲幀并在渲染幀被發(fā)送到顯示器之前獲取最新的鼠標(biāo)信息,通過刷新渲染的游戲幀以進一步減少延遲,將PC延遲進一步降低多達75%。

NVENC和NVDEC新增YUV422支持

目前很多攝像機都支持錄制YUV422格式的視頻,這是有原因的:YUV422相比起YUV444更節(jié)省儲存空間,但是比起YUV420能保存更多的顏色,這樣一來就給后期調(diào)色留下了充足的空間。Blackwell這次新增了YUV422的編解碼支持,從而能提高創(chuàng)作者的效率,比如說導(dǎo)出時間減少,更流暢的多路回放等。NVIDIA表示,第6代NVDEC可同步解碼和播放多達8個4K60 YUV422視頻流。

而第9代NVENC則提升了HEVC和AV1的編碼質(zhì)量,為YUV422 H.264和HVEC編碼提供了支持。另外,還有一個全新的AV1 Ultra High Quality(UHQ)模式,它可以用更多的時間去獲得額外5%的質(zhì)量提升。NVIDIA還表示,這個模式在RTX 40系列上也可用,不過Blackwell的質(zhì)量是更好的。

顯卡解析:踏雪至山巔

我們把目光放回我們本次評測的主角——耕升 RTX 5090 D 踏雪。由于它是不帶OC的標(biāo)準(zhǔn)版,包括核心Boost頻率在內(nèi)的絕大部分參數(shù)都與英偉達官方標(biāo)稱一致。

外觀與包裝

耕升 RTX 4070 SUPER 踏雪

說實話,老踏雪給我的印象妥妥的是一張定位高端純白顯卡,如果將它的外觀直接搬到萬元級的RTX 5090 D上,多少是缺少誠意的,重新設(shè)計是勢在必行。

雪花標(biāo)志依舊是踏雪系列顯卡的靈魂所在,從外包裝上,耕升就將此十分直接地展現(xiàn)出來,旁邊附易略帶古風(fēng)的“踏雪”字樣,給人一種磅礴凜冽之感。三年個人送保服務(wù)作為耕升引以為傲的優(yōu)勢,自然也是會標(biāo)注在最顯眼的地方。

拿出顯卡本體后我們可以看到,RTX 5090 D 踏雪果然是沒有讓我們失望。純白外殼不僅與散熱鰭片盡可能地齊平貼合,而且尾部延伸至金屬背板,帶來非常不錯的一體性觀感。三把第三代炫風(fēng)之刃風(fēng)扇(兩側(cè)100mm,中間90mm)采用了性能表現(xiàn)更好的環(huán)形連葉設(shè)計,扇葉表面還有紋理加強導(dǎo)流。軸心處注入了標(biāo)志性的雪花logo,在同心圓金屬紋理的襯托之下倍顯質(zhì)感。

不僅如此,我們從顯卡的大部分地方都能看到大量的雪花圖案,充分展現(xiàn)“踏雪”之意。其中,最值得一提的就是側(cè)面的logo燈板了,轉(zhuǎn)角過渡的設(shè)計剛好對應(yīng)著常規(guī)安裝時的展示視角,給人一種曲面屏般的立體觀感。比起以往的踏雪系列顯卡,RTX 5090 D踏雪的顏值可謂是脫胎換骨了。

顯卡的供電接口從RTX 4090公版的12VHPWR升級成了更安全的12V-2×6,并且旋轉(zhuǎn)了180°,卡扣朝上,便于用戶拔插的同時減少插不牢的概率。在它的旁邊是ARGB燈光同步接口,配合附送的線材使用。

顯卡的顯示輸出接口和英偉達官方標(biāo)稱的一樣,為三個DP2.1b+一個HDMI2.1b的組合。PCIe擋板只給到了雙槽,其中一槽多是散熱開孔,剩余厚度位置被外殼所覆蓋。

尺寸方面,我們手動測量的結(jié)果的328×122×61mm(不包含擋板凸出長度和插槽),厚度大約是三槽多一點,對常規(guī)的MATX主板和機箱來說不太友好。不過都上旗艦卡了,一般情況下用戶都會首先考慮大機箱。至于ITX用戶,就只能按自身的實際情況去判斷了。顯卡實測重量是1907g,份量不小,正常安裝方式下建議搭配顯卡支架使用,盡可能避免造成PCB彎曲。

而配件這邊,耕升也是附送了一個與顯卡相稱的銀白色顯卡金屬支架,底部帶有磁吸固定,安裝在機箱時不易脫落。另外就是常規(guī)的四8Pin轉(zhuǎn)12V-2×6供電線以及5V ARGB燈光控制線,后者可直接實現(xiàn)與主板燈效同步,無需在顯卡控制軟件內(nèi)部進行額外的設(shè)置。

顯卡拆解

全新的雪魂散熱裝置配備了7根8mm復(fù)合式鍍鎳熱管,核心接觸面底座為VC均熱板,提供高效的散熱能力。供電元件、顯存芯片也覆蓋有導(dǎo)熱墊與散熱模塊上的一體式金屬中框充分接觸。

耕升 RTX 5090 D 踏雪采用了14層PCB設(shè)計,供電配置給到了16+7+6相,主供電控制芯片放置在了PCB的左上角,為來自MPS的MP29816-A,所用的MOSFET全部是來自MPS的MP97993,最大支持電流為50A。

背面還有一顆型號為uS5650Q的供電控制芯片

風(fēng)扇PWM接口和5V ARGB燈光接口在PCB的右下方,三把風(fēng)扇現(xiàn)在是單獨控制。

GB202-250-A1核心在PCB的中心位置,周圍環(huán)繞著16顆三星的GDDR7芯片,每顆容量為2GB,位寬為32-bit,組成512-bit/32GB的規(guī)格。

顯卡背部元件不多,一眼看過去很干凈,基本都布局在了正面,可見這次耕升 RTX 5090 D 踏雪的硬件集成度非常高。

性能測試:“軟硬”兼施效果顯著

測試平臺與說明

為了能夠發(fā)揮出耕升 RTX 5090 D 踏雪的最佳表現(xiàn),測試平臺的CPU選用了當(dāng)下最強游戲CPU——AMD Ryzen 7 9800X3D;與之搭配的主板為微星 MPG X870E CARBON WIFI 暗黑,擁有18+2+1相110A SPS智能供電的它即便是帶旗艦級別的Ryzen 9 9950X也是不在話下,另外主板還配備了具有戰(zhàn)未來屬性的PICe 8Pin輔助供電接口,為顯卡提供穩(wěn)定,高效和持續(xù)的電力供應(yīng)(測試時并沒有接,主要是考慮到其他品牌主板沒有配備該接口,不進行“作弊”);內(nèi)存輔以芝奇 Trident Z5 RGB 32GB雙通道DDR5-6000 CL30內(nèi)存,甜點頻率+低延遲的組合不僅對于絕大部分用戶都能夠?qū)崿F(xiàn),而且我們實測相比高頻在實際使用中差別非常小。

參加測試的顯卡除了耕升 RTX 5090 D 踏雪,還有作為對比的GeForce RTX 4090 D。測試兼顧2K和4K分辨率,包括基準(zhǔn)性能跑分、傳統(tǒng)光柵游戲以及光追游戲,DLSS測試部分加入了最新的DLSS 4。

基準(zhǔn)性能測試

首先是純理論跑分,會以3D Mark作為顯卡基準(zhǔn)性能測試,測試項目包括Fire Strike、Fire Strike Extreme、Fire Strike Ultra、Time Spy、Time Spy Extreme、Steel Nomad、Port Royal、以及Speed Way八個項目。其中Fire Strike、Fire Strike Extreme、Fire Strike Ultra三個項目分別測試的是顯卡在DX11游戲中的1080P分辨率、2K分辨率和4K分辨率下的性能指數(shù),Time Spy、Time Spy Extreme兩個項目則是顯卡在DX12游戲中的2K分辨率和4K分辨率下的性能指數(shù),Port Royal是測試的顯卡實時光線追蹤的性能指數(shù)。另外還有去年推出的Steel Nomad,這是原有的Time Spy基準(zhǔn)測試的繼承者,屬于新的非光追顯卡基準(zhǔn)性能測試工具。而NVIDA DLSS測試項目中,由于我們拿到的是測試版本,可以對DLSS 4的性能表現(xiàn)進行一個初步的預(yù)估,具有第一定的參考價值,具體設(shè)置為4K質(zhì)量擋位,幀生成選項提供了2X,3X和4X三擋切換,其中DLSS 4 2X其實就是DLSS 3 2X,即渲染1幀生成1幀。RTX 4090 D不支持DLSS 4,因此就沒有相關(guān)的成績了。

具體成績見下表,表中所列成績均為3D Mark顯卡單項的得分。

在3DMark測試中可以看到,耕升 RTX 5090 D 踏雪要比RTX 4090 D快35%~66.5%,其中,Steel Nomad、Port Royal和Speed Way三個測試中擁有相當(dāng)明顯的優(yōu)勢,領(lǐng)先幅度都在50%以上,兩項考驗DX12性能的Time Spy的測試?yán)锩嬉渤^了45%,代表DX11性能的Fire Strike則隨著分辨率的降低,領(lǐng)先幅度逐步縮小。

耕升 RTX 5090 D 踏雪憑借更出色的性能表現(xiàn)在原生畫質(zhì)中就拔得頭籌,再加上DLSS 4的助力,幀數(shù)的提升相當(dāng)夸張,4X時大約達到了原生的5.6倍。這不禁讓人更加期待它的實際游戲體驗了。

游戲測試

在這次游戲測試環(huán)節(jié)中,我們在4K分辨率選擇了7款光柵化游戲及光追游戲,2K分辨率選擇了4款光柵化游戲及光追游戲,另外還有3款DLSS 4游戲。一般情況下,游戲會選擇極高或者超高的預(yù)設(shè)畫質(zhì),光追游戲如果有路徑光追都會是優(yōu)先選項,同時這些測試?yán)锒紱]有開啟DLSS。由于GeForce RTX 5090 D屬于旗艦顯卡,基本上都是以4K游戲為目標(biāo),2K游戲則選擇壓力較大的幾款大作,壓力非常小的1080P分辨率的參考意義較低,就不作測試。

4K分辨率 光柵游戲

光追游戲

在4K光柵游戲的環(huán)節(jié),除了《黑神話:悟空》勉強達到流暢之外,其余游戲在耕升 RTX 5090 D 踏雪面前基本算得上的游刃有余,相比RTX 4090 D有著較為明顯的幀數(shù)提升。

開啟光追之后,兩者依然保有一定的性能差距, RTX 5090 D均能做到30fps以上,而RTX 4090 D有4款游戲是低于30fps的。但總體來說,要想4K光追暢玩,新一代顯卡還是要依賴DLSS。

2K分辨率 光柵游戲

光追游戲

轉(zhuǎn)戰(zhàn)壓力較小的2K分辨率之后,耕升 RTX 5090 D 踏雪毫無意外是繼續(xù)領(lǐng)先。2K光柵對于它來說基本上是不成問題了,RTX 4090 D面對《黑神話:悟空》還是處于勉強過關(guān)的程度。2K光追的情況同樣如此,RTX 5090 D悉數(shù)踩著60fps的暢玩基礎(chǔ)線過關(guān),RTX 4090 D除了《心靈殺手2》外都只有40多fps。

總體來說,RTX 5090 D讓很多大作在高分辨率+光追+原生畫質(zhì)的條件下完成了從不可玩到可玩轉(zhuǎn)變,打好的原生幀數(shù)的基礎(chǔ),才能更好地發(fā)揮DLSS幀生成的優(yōu)勢,提升游戲體驗。

DLSS 4性能測試

在DLSS 4測試項目中,我們選擇了四款游戲,包括《賽博朋克2077》、《心靈殺手2》、《星球大戰(zhàn):亡命之徒》和《漫威爭鋒》。原本想測試更多支持DLSS 4的游戲,但是遇到了不穩(wěn)定等情況,而且時間有限。相信當(dāng)大家收到RTX 50系顯卡的時候,應(yīng)該就會有很多游戲獲得原生DLSS 4或DLSS優(yōu)化支持了。幀生成選項和3D Mark的DLSS測試項目一樣,提供了2X,3X和4X三擋切換,而RTX 40系顯卡是只有開關(guān)選項,沒有給到增幅擋位。

在DLSS 4功能測試版的《賽博朋克2077》中,畫質(zhì)設(shè)置菜單里新增了超分辨率模型選擇,玩家可以選擇全新的Transformer或以前的CNN模型,雖然說是超分辨率,但其實光線重建的模型也會被一并切換。

NVIDIA App的設(shè)置跟游戲中的類似,也是分成模型選擇、幀生成倍數(shù)和超分辨率三個選項。一般來說因為是驅(qū)動級設(shè)置,過程可能比游戲內(nèi)設(shè)置要略微多花一點時間,比如我們這次測試的《漫威爭鋒》,就需要先設(shè)置好再開游戲,而不能在游戲里實時設(shè)置。

測試內(nèi)容除了原生幀率外,我們嘗試了新舊兩種不同模型,以及不同倍數(shù)的設(shè)置,讓大家可以更好地去做對比。需要說明的是,《星球大戰(zhàn):亡命之徒》不支持DLSS新舊模型切換。

DLSS 4對于幀數(shù)的提升是肉眼可見的大,均是成倍地增加,同時,多擋位以及雙模型的切換也為用戶提供了更多的選擇。大家最關(guān)心的延遲問題其實總體感覺還好,大部分情況下DLSS 4 和DLSS 2/3僅存在些許的差距,且明顯好于原生,實際體驗的感知并不明顯。另外,畫質(zhì)方面這里給到大家Transformer和CNN兩個新舊模型的對比,所有的對比截圖均是在性能擋獲取的,屏幕分辨率為4K,渲染分辨率則是1920 x 1080。

CNN模型CNN模型Transformer模型Transformer模型

CNN模型CNN模型Transformer模型Transformer模型

CNN模型CNN模型Transformer模型Transformer模型

CNN模型CNN模型Transformer模型Transformer模型

顯而易見,Transformer在細(xì)節(jié)處理上要比CNN好上不少,不僅是正常的畫面,而且水面的倒影也是更加清晰。在畫面穩(wěn)定性這塊,新模型還顯著減少了物體邊緣處的閃爍以及偽影現(xiàn)象。

AI與生產(chǎn)力性能測試

AI生圖與大語言模型

前面也提到了,RTX 5090 D新增了FP4的支持,具體表現(xiàn)究竟會如何呢?在UL Procyon FLUX.1 AI生圖測試?yán)锩?,RTX 5090 D在FP4模式下僅用了4秒不到就生成了一張圖,而RTX 4090 D則是要花上將近20秒。在FP8模式里面,RTX 5090 D的速度依然是RTX 4090 D的1.7倍。

至于不少玩家關(guān)注常規(guī)FP16性能,我們也做了相應(yīng)的Stable Diffusion測試。需要提一下的是,在我們測試時公開的TensorRT加速庫還沒更新對RTX 50系列的支持,所以我們是用ONNX DirectML運行時進行測試的。在這個測試中,RTX 5090 D仍然處于領(lǐng)先位置。盡管RTX 5090 D在這個情況下的生成速度也挺快的了,要是有TensorRT的話,速度會更上一層樓。

LLM類別的測試中,涉及的模型要多不少,但在首Token延遲和輸出Token速度這些關(guān)鍵指標(biāo)上,RTX 5090 D在大部分模型里面要比RTX 4090 D好上約30%。

生產(chǎn)力創(chuàng)意軟件

3D創(chuàng)作有關(guān)的軟件中,V-Ray和Blender我們認(rèn)為是比較有代表性的,在這里面,RTX 5090 D相比RTX 4090 D獲得了超過25%的增幅。

溫度測試

我們的GPU散熱測試均在裸機狀態(tài)(如果安裝在機箱內(nèi),GPU溫度會高出5℃左右)下進行測試,測試環(huán)境溫度約為23.5℃。待機溫度是開機以后記錄5分鐘,滿載溫度則是完成3DMark Speed Way壓力測試后記錄下,數(shù)據(jù)通過GPU-Z的Log to File功能記錄,以下為溫度測試曲線。

耕升 RTX 5090 D 踏雪支持低溫風(fēng)扇停轉(zhuǎn),所以待機溫度都是被動散熱下的溫度,整體呈緩慢上升的趨勢,直到最高的42.5℃依然是處于停轉(zhuǎn)狀態(tài)。滿載時,顯卡的最高溫度大約在第6分鐘達到最高,為72.1℃。在此之后,風(fēng)扇轉(zhuǎn)速還是稍有增加,最高達到1844 RPM以更好地維持在相對較低的工作溫度范圍內(nèi)。

功耗測試

我們通過手中的PCAT套件,分別精確地測量顯卡PCIe、外接電源接口瓦特數(shù),顯卡最大功耗在3DMark Speed Way壓力測試中獲得,待機功耗則是在進入系統(tǒng)后記錄1分鐘取平均值。

統(tǒng)計功耗測試的結(jié)果算出,我們手上這張耕升 RTX 5090 D 踏雪顯卡的整卡平均待機功耗約為31W,滿載平均功耗在584W左右,峰值功耗達到了668W,已達到16-Pin 12V-2x6供電接口滿載狀態(tài)。這也就不難解釋為什么英偉達官方給到的電源瓦數(shù)建議從RTX 4090的850W提升至了1000W。

噪音測試

在GPU-Z的Log to File中我們同時記錄下了顯卡轉(zhuǎn)速情況。由于這次的RTX 5090 D顯卡風(fēng)扇均獨立控制,我們只標(biāo)出最速較高的一個,為1844 RPM。接著我們把顯卡放進了環(huán)境噪音小于10 dB(A)的消音實驗室,把其風(fēng)扇還原同樣轉(zhuǎn)速,然后在30CM的距離上測試其噪音水平,由于顯卡在待機時風(fēng)扇是停轉(zhuǎn)的,所以就不用測試了。

耕升 RTX 5090 D 踏雪所測得的噪音值為44.4 dB(A),在開放平臺下會感受到些許聲響,如果按照正常用戶裝入機箱的使用習(xí)慣,應(yīng)該是感知不明顯的。

GW-SOUL控制軟件體驗

前面我們有提到,耕升 RTX 5090 D 踏雪的三把風(fēng)扇現(xiàn)在是獨立控制的,舊版本的控制軟件是只能控制其中的兩把。而新版的GW-SOUL里面,風(fēng)扇調(diào)節(jié)一欄就明確顯示三把風(fēng)扇均單獨可調(diào)了。此外,軟件還提供了顯卡實時狀態(tài)信息、超頻和燈光調(diào)節(jié)功能,右上角給到了主板燈光同步開關(guān)。

總結(jié):難以撼動的旗艦級性能表現(xiàn)

從耕升 RTX 5090 D 踏雪身上我們可以看到,英偉達的新一代旗艦顯卡主要是在核心規(guī)模和相關(guān)技術(shù)上取得明顯進步,擁有符合現(xiàn)時市場競爭狀況的代際提升幅度,游戲及AI生產(chǎn)力表現(xiàn)出色。尤其是極具戰(zhàn)未來意義的神經(jīng)網(wǎng)絡(luò)渲染與DLSS 4技術(shù),更是將一些有著極高性能需求的游戲馴服妥帖。不過,由于芯片制程工藝沒有變化,功耗增加是在所難免的,供電接口上引入了最新的12V-2×6正是為此而保駕護航,當(dāng)然,搭配1000W或以上的ATX 3電源使用也是必不可少的。

價格方面,英偉達官方給到的建議零售價雖為16499元,但耕升 RTX 5090 D 踏雪作為一張用料扎實又有純白外觀和全新設(shè)計加持的非公版顯卡實際上市的價格應(yīng)該會略有增加,同時,首發(fā)的熱度所帶來的供需變化可能也會成為價格波動的因素之一。盡管如此,由于主要競爭對手AMD沒有給到足夠的壓力,相信在未來的好一段時間內(nèi),RTX 5090 D會穩(wěn)居最強消費級顯卡的寶座,價格不會影響對其有需求用戶的購買動力。

相關(guān)文章

最新評論