盡享極致游戲體驗! 索泰GeForce RTX 4090 D TRINITY顯卡評測

在眾所周知的原因推動下,想要以理想的價格買到GeForce RTX 4090已然不太現(xiàn)實,所幸黃氏刀法著實精準(zhǔn),用GeForce RTX 4090 D實現(xiàn)了合規(guī)與性能之間的新平衡點。并且由于沒有Founders Edition版本,國內(nèi)發(fā)售的重任落到了幾家AIC品牌上,作為NVIDIA好基友的索泰自然是其中之一。
手握GeForce RTX 4090 D GPU的索泰自然不會閑著,索泰GeForce RTX 4090 D PGF、索泰GeForce RTX 4090 D AMP AIRO、索泰GeForce RTX 4090 D天啟、索泰GeForce RTX 4090 D TRINITY 月白上齊一套,其中索泰GeForce RTX 4090 D TRINITY 月白不僅上架電商,在眾友商定價中,也是頗具性價比的一款。
那么GeForce RTX 4090 D的表現(xiàn)究竟如何?評測就此奉上。
AD102的新篇章
與GeForce RTX 4090所使用的AD102-300-A1不同,索泰GeForce RTX 4090 D TRINITY 月白采用的GPU型號為AD102-250-A1。兩款GPU均源自相同的AD102,并以此為基礎(chǔ)向下屏蔽單元,實現(xiàn)不同的性能定位。
從整體上看,完整的AD102包含了12個圖形處理集群(Graphics Processing Clusters,GPC),72個紋理處理簇(Texture Processing Clusters,TPC),144個流式多處理器(Streaming Multiprocessors,SM),以及搭配了12個32-bit控制器的顯存接口,共計384-bit。
同時每個GPC獨立使用1個光柵引擎(Raster Engine,RE),6個TPC,2個光柵處理分區(qū)(Raster Operations partitions)。其中每個光柵處理分區(qū)包含8個光柵處理單元(Raster Operations,ROP),因此總共16個ROP。
每個TPC下包含2個流式多處理器(Streaming Multiprocessors,SM)。從Maxwell架構(gòu)開始,SM之下細分出了處理塊(Sub-Core)概念,AD102中每個SM包含4個處理塊,每個處理塊包含1個64KB寄存器堆,1個L0指令緩存,1個Warp調(diào)度器,1個調(diào)度單元,4個加載/存儲單元,1個特殊功能單元(Special Function Unit,SFU)用于執(zhí)行超越函數(shù)指令(比如正弦、余弦、倒數(shù)、平方根等)和圖形差值算法指令。包含16個專門用于FP32的CUDA Core,16個可以在FP32和INT32之間切換的CUDA Core,因此共計32個CUDA。
此外每個SM還包含1個第三代RT Core,4個第四代Tensor Core,4個紋理單元(Texture Units),256KB寄存器堆,以及可根據(jù)需求進行配置的128KB L1共享緩存。
有意思的是,你會發(fā)現(xiàn)無論GeForce RTX 4090還是GeForce RTX 4090 D其實都沒有用到完整的AD102核心,而是通過禁用GPC或者TPC的數(shù)量從而實現(xiàn)不同的定位。而GeForce RTX 4090 D相當(dāng)于在GeForce RTX 4090的基礎(chǔ)上再屏蔽1組GPC實現(xiàn)。
因此索泰GeForce RTX 4090 D TRINITY 月白總共包含57個TPC,114個SM,14592個CUDA Core,456個第四代Tensor Core,114個第三代RT Core。大致對比如下:
可以看到在顯存配置和GPU頻率上,GeForce RTX 4090 D沒有做出刪減,同樣保持了24GB GDDR6X 384-bit顯存,等效21Gbps頻率,1008GB/s的顯存帶寬。另外L2緩存容量也維持在了72MB,GPU頻率2.52GHz。大容量顯存和L2緩存的配置,都仍然能夠給后續(xù)的游戲,特別是AI加速性能提供優(yōu)秀的基礎(chǔ)。
在72MB超大L2緩存的加持下,第三代RT Core和第四代Tenor Core作為提升游戲特效性能的主力也有了更多的用武之地。其中,第三代RT Core不僅可以通過L2緩存在路徑追蹤從中獲得巨大收益,本身相對第二代RT Core也提升了射線/三角形求交測試吞吐量,并引入透明度微圖引擎(Opacity Micro-Map,OMM)和位移式微型網(wǎng)面引擎(Displaced Micro-Mesh,DMM)。
第四代Tenor Core則是當(dāng)下火熱的DLSS 3以及開始普及的DLSS 3.5的重要組成部分。這是一套利用光流加速器實現(xiàn)像素級的測量,并通過云端的夜以繼日的尋找提升高質(zhì)量圖像的途徑,這使得GPU擺脫了渲染重建高分辨率方法,讓渲染工作大幅度減少,以兩幀為例,DLSS 3會承擔(dān)起第一幀的3/4的工作和第二幀的所有工作,實際上GPU只需要完成其中的1/8的渲染即可,從而節(jié)省了大量的計算資源。
而接下來的DLSS 3.5則能同時包含DLSS幀生成(FG)與光線重建(RR, Ray Reconstruction)技術(shù)搭配,再加上超分辨率(Super Resolution)、DLAA、幀生成(Frame Generation)多種技術(shù)融合。最終構(gòu)建出一套高效的運行方式,但所有的前提都依靠第四代Tenor Core和光流加速器配合實現(xiàn)的。
此外,索泰GeForce RTX 4090 D TRINITY 月白還包括第八代NVENC和第五代NVDEC編解碼器對媒體提供支持,從而在諸如AV1編解碼加速上獲得更好的體驗。
全副武裝的TRINITY
讓我們把焦點放回顯卡本身,索泰GeForce RTX 4090 D TRINITY提供了月白和黑色兩種顏色可選,在散熱上主要選擇了IceStorm 3.0散熱系統(tǒng),優(yōu)化了空氣散熱效能,并支持SPECTRA 2.0 ARGB燈效。
其中IceStorm 3.0散熱系統(tǒng)提升了散熱效能,提供了3個110mm的盾鱗2.0風(fēng)扇,在提升扇葉面積的同時,也優(yōu)化了每一片扇葉的曲率和鱗狀仿生條紋,從而實現(xiàn)提升風(fēng)扇風(fēng)量、風(fēng)壓和風(fēng)流的效果。
風(fēng)扇下方提供了一塊大面積VC均熱板覆蓋GPU核心,以實現(xiàn)快速導(dǎo)熱至熱管陣列。表面拋光工藝可進一步減少與GPU接觸間隙,使導(dǎo)熱效率更高。而顯卡本身的厚度也達到了3.5個槽位,原因在于內(nèi)置加厚、加高的鍍鎳散熱鰭片模組,從而實現(xiàn)更好的導(dǎo)熱能力。
另外熱管部分也進行了升級,增加熱管壁厚度和內(nèi)壁脈絡(luò)狀導(dǎo)液溝槽,升級替換更高導(dǎo)熱系數(shù)的導(dǎo)熱介質(zhì),加大冷凝液與熱管內(nèi)壁接觸面積的同時,進一步加快冷凝液導(dǎo)熱循環(huán)。
索泰采用的背板、散熱器多點分布安裝的方式,讓結(jié)構(gòu)得以加強。并使用了鋁合金加固骨骼結(jié)構(gòu)件形式,確保PCB均勻受力,減少彎曲。另外合金背板本身也提升了顯卡的靜電防護能力。
GPU背面則使用了加固和背板裸露的形式,科技感拉滿。同時支架沒有上保修貼,也方便顯卡后期的改裝。
因此在壓力測試下,索泰GeForce RTX 4090 D TRINITY 月白的GPU可以保持再65℃左右的清涼狀態(tài)。如果用紅外線檢測,在室溫22℃的環(huán)境中,也可以看到整張顯卡的發(fā)熱量不高,長時間高負荷工作是沒有問題的。
SPECTRA 2.0 ARGB燈效系統(tǒng)本身支持1600萬色ARGB和多種燈效模式,并且可以通過軟件調(diào)節(jié)變換預(yù)設(shè)燈效。
有意思的是,在索泰GeForce RTX 4090 D TRINITY 月白電源后方還提供了一個5V 3pin的RGB接口,還可以給通過顯卡制造RGB同步效果,做到在游戲中即刻感受到隨時變換的RGB氛圍。
在周邊配件上,索泰GeForce RTX 4090 D TRINITY 月白則顯得比較簡約,包括紙質(zhì)說明文檔、1個二次元立牌,1個顯卡支架和1根RGB同步線,以及1根16pin(12VHPWR)轉(zhuǎn)8pin x4的電源線。
除了使用16pin(12VHPWR)電源口,顯示接口包括3個DisplayPort 1.4a和1個HDMI 2.1接口。
實踐見真章
現(xiàn)在讓我們進入實戰(zhàn)環(huán)節(jié)。測試平臺包括了Core i9-14900K、ROG MAXIMUS Z790 DARK HERO、G.SKILL Trident Z5 DDR5-7200 16GBx2,并配以1250W電源作為支持。
在基礎(chǔ)性能測試中,主要參考檢測DirectX 11和DirectX 12性能的3DMark Time Spy,3DMark Time Spy Extreme,3DMark Fire Strike Extreme,3DMark Fire Strike Ultra,Port Royal。能顧看到索泰GeForce RTX 4090 D TRINITY 月白表現(xiàn)是非常強勁的,相對RTX 4080 SUPER可以有20%乃至30%的性能提升,距離RTX 4090只有3%到6%的差距。
在常規(guī)的DLSS 2游戲中,索泰GeForce RTX 4090 D TRINITY 月白自然也表現(xiàn)出了強勁的戰(zhàn)斗力,在4K分辨率最高畫質(zhì)并且開啟光線追蹤的前提下,提升超過30%以上。相對RTX 3080 Ti性能則超過110%乃至更多了。
前面提到,GeForce RTX 40系列帶來的DLSS 3和DLSS 3.5技術(shù)才是將游戲體驗拉開差距的一套算法。如果用3DMark DLSS 3 Feature作為比較,就會看到明顯的提升差距,索泰GeForce RTX 4090 D TRINITY 月白表現(xiàn)非常突出,在8K分辨率下也能輕松達到97FPS以上,這是絕大多數(shù)GPU不敢想象的。
因此在DLSS 3游戲中,索泰GeForce RTX 4090 D TRINITY 月白的戰(zhàn)斗力立馬就展現(xiàn)出來了,相對RTX 4080 SUPER提升有35%到40%,而相對RTX 3080 Ti提升120%以上,最高可以超過300%。
同時DLSS 3.5也帶來了更好的畫質(zhì)表現(xiàn),得益于光線重建(RR, Ray Reconstruction)加入,游戲畫面得到更明顯的提升。比如在《賽博朋克2077》畫面進行對比,無論是車燈在地面的漫反射,還是遠處的霓虹燈光,在DLSS 3.5光線重建加持下獲得更為自然的效果,重點這是在獲得更高幀率前提下實現(xiàn)的。
另外索泰GeForce RTX 4090 D TRINITY 月白帶來的DLSS 3本身也融合了Reflex技術(shù),可以更有效的降低游戲時候的系統(tǒng)響應(yīng)延遲。比如在1080p分辨率下,索泰GeForce RTX 4090 D TRINITY 月白能夠讓《CS2》、《APEX英雄》等競技游戲獲得遠高于顯示器刷新率的幀率同時,還將系統(tǒng)延遲降低到10ms以下,這也是GeForce RTX 40的傳統(tǒng)藝能了。
AI與創(chuàng)作一把手
毋庸置疑,了24GB GDDR6X 384-bit顯存的索泰GeForce RTX 4090 D TRINITY 月白厲害的地方還在于內(nèi)容創(chuàng)作和生成式AI上的表現(xiàn)。例如近段時間火熱的Stable Diffusion XL本身運行需要依靠Transformer變換器和卷積神經(jīng)網(wǎng)絡(luò)實現(xiàn),這兩者均需要GPU進行大規(guī)模并行計算,這無疑是NVIDIA最擅長的事情。也正因為如此,近幾年AI的飛速發(fā)展,很大程度上就是NVIDIA GPU技術(shù)發(fā)展所推進的。
其中Stable Diffusion XL在模型體量上相當(dāng)Stable Diffusion 1.5擴大了3倍,從而導(dǎo)致計算的數(shù)據(jù)量提升,但也帶來了更好的畫質(zhì)。這里以Stable Diffusion Web UI + TensorRT進行配置,用更短的語言描述生成10張分辨率為768x768的星際航行圖片,每次運算1張圖片,即總共執(zhí)行10次,采樣步數(shù)設(shè)置為50。
文字描述部分為:epic space battle over a water planet, many ships, cinematic lighting, Depth of Field, hyper-detailed, beautifully color-coded, 8k, many details, chiaroscuro lighting。通過記錄時間,推算出每分鐘推算圖片效率,參考公式為60 / (TotalTime / (BatchSize * BatchCount)) = Images Per Minute。
得益于更大的內(nèi)存,索泰GeForce RTX 4090 D TRINITY 月白領(lǐng)先幅度是其他GPU無法比擬的,哪怕是RTX 4080 SUPER也能有翻倍的提升,并且與RTX 4090相當(dāng)接近。
而就在最近,UL Benchmark旗下的Procyon正式在AI Image Generation Benchmark子項中加入了Stable Diffusion 1.5和Stable Diffusion XL支持,測試過程有效避免了初次運行時的數(shù)據(jù)干擾,讓實際測試性能變得更具有參考性。
可以看到索泰GeForce RTX 4090 D TRINITY 月白在AI Image Generation Benchmark的Stable Diffusion 1.5和Stable Diffusion XL基準(zhǔn)測試下,戰(zhàn)斗力是非常驚人的。Stable Diffusion 1.5(FP16)可以做到1.299s/image,Stable Diffusion XL(FP16)則可以做到11.535s/image,也就是在短短數(shù)秒內(nèi)就可以完成一張文生圖,并且整體評分與RTX 4090差距不大,同時比RTX 4080 SUPER,RTX 4070 Ti SUPER都拉出了明顯的距離。
同樣,DLSS 3.5也已經(jīng)作為AI加速部分應(yīng)用于專業(yè)軟件中,D5渲染器已經(jīng)率先展開了支持。DLSS 3.5在D5渲染器中比DLSS 3多出了5倍的訓(xùn)練量,因此也可以更好的識別光線追蹤效果,在時間、空間數(shù)據(jù)中做出更合理的判斷,從而實現(xiàn)高效率的擴展。
這里不妨讓我們做一下效果對比,窗戶上的光斑自然度,以及噪點控制,DLSS 3.5下都給予了更好的畫質(zhì)。
同時DLSS 3.5也給D5渲染器帶來了更流暢的幀率。索泰GeForce RTX 4090 D TRINITY 月白可以輕松在復(fù)雜的建筑場景中以高于75FPS的幀率運行。這意味著就算是高負荷的渲染場景,索泰GeForce RTX 4090 D TRINITY 月白也能給予類似于游戲的順暢感。
AI加速的另一個應(yīng)用是利用ON1 Resize AI 2022對圖片分辨率進行提升,這里使用五個場景進行測試并記錄平均時間。也可以看到索泰GeForce RTX 4090 D TRINITY 月白節(jié)省了更多的AI推算時間,比RTX 4080 SUPER快上12%左右。
然后是傳統(tǒng)的內(nèi)容創(chuàng)作環(huán)節(jié)。Blender Benchmark引入的Moster、Junkshop、Classroom三個參考場景中,索泰GeForce RTX 4090 D TRINITY 月白可以相對RTX 4080 SUPER提升20%到30%。
同樣在V-Ray 5 Benchmark中,分別對CUDA Core和RTX進行檢測,借助更多的CUDA Core數(shù)量,索泰GeForce RTX 4090 D TRINITY 月白的領(lǐng)先幅度也近乎是翻倍的。
Octane Render RTX則是用來測試GPU的光線追蹤性能表現(xiàn),在復(fù)雜場景下考驗GPU每秒產(chǎn)生的樣本率,索泰GeForce RTX 4090 D TRINITY 月白相對RTX 4080 SUPER的領(lǐng)先幅度也達到了30%。
SPECviewperf用來考驗OpenGL和Direct X API的3D圖形性能,測試場景包括3dsmax、Catia、Creo、Energy、Maya、Medical、SNX、Solidworks。索泰GeForce RTX 4090 D TRINITY 月白已經(jīng)能夠輕松應(yīng)付所有專業(yè)軟件的運行,大顯存和海量CUDA起到了絕對性的優(yōu)勢。
寫在最后:旗艦級優(yōu)選
憑借著強勁的性能,索泰GeForce RTX 4090 D TRINITY 月白給人留下了頗為深刻的印象。特別是在RTX 4090難以購買的現(xiàn)況下,索泰GeForce RTX 4090 D TRINITY 月白已經(jīng)能夠很好的充當(dāng)替代品,雖然在理論數(shù)據(jù)上相差在3%到6%之間,但從實際的游戲、AI創(chuàng)作感受來看,體感差別不大。
重點在于,索泰GeForce RTX 4090 D TRINITY 月白并沒有在技術(shù)上做任何刪減,同樣是基于性能金字塔頂端的Ada Lovelace的AD102 GPU打造,支持最新的DLSS 3.5和更高效能的路徑追蹤特效,超大的顯存不做任何刪減,維持住了最高水平的單卡AI性能,甚至實際功耗還要比RTX 4090低一些。
同時索泰一如既往優(yōu)質(zhì)的做工讓索泰GeForce RTX 4090 D TRINITY 月白的散熱表現(xiàn)、個性化都表現(xiàn)的非常出色,并且在一眾RTX 4090 D中維持著較低的售價,比較之下,性價比已然凸顯。如果你是一個性能控、AI重度用戶、影音工作者,不要猶豫,索泰GeForce RTX 4090 D TRINITY 月白就是很好的選擇之一,特別是搭配Core i9-14900K,大容量DDR5內(nèi)存,配合4TB SSD以上存儲空間,想必也會成為每一個電競男生今年的終極夢想。
特別是在未來新品更新還有很長一段時間,價格日趨穩(wěn)定的情況下,一步到位上到頂配,興許才是最具性價比的解決方案之一。如果你已經(jīng)攢好了錢,那么不必由于,在RTX 4090 D中,索泰GeForce RTX 4090 D TRINITY 月白確實是非常值得考慮的那一款。
相關(guān)文章
- NVIDIA推出的4090D顯卡,作為品牌旗下的高端力作,緊隨旗艦級4090顯卡之后,占據(jù)了性能排行的次席位置,鑒于英偉達在全球市場的獨特銷售策略,使得高性能的4090顯卡在國內(nèi)市2024-07-18
4090顯卡怎么選? 2024年最新RTX4090顯卡推薦排行榜
4090顯卡哪張比較好?有那么多品牌有4090顯卡,每個品牌又能細分出不同的型號,選起來真的是讓人頭都大了,在這種情況下,看4090顯卡推薦度排行榜就很有必要了,詳細請看下2024-05-16為什么RTX4090的規(guī)格是RTX4070顯卡的將近3倍性能卻只有2倍?
RTX 4090的核心規(guī)模是RTX 4070的2.78倍,顯存帶寬是RTX 4070的2倍,顯存容量也是RTX 4070的2倍,越是分辨率高的游戲,帶寬的影響就越明顯2024-05-16RTX4080Super和RTX4090差距大嗎 RTX4080Super和RTX4090對比詳解
NVIDIA在過去半年發(fā)布了基于新Ada Lovelace 架構(gòu)的RTX 4080 Super 和 RTX 4090,兩款顯卡的性能比它們的前身強大的不是一點點,下面小編帶來RTX4080Super和RTX4090區(qū)別對比2024-01-11- RTX4090是英偉達發(fā)布的40系列顯卡中性能最強的,因此,許多用戶對這款顯卡非常關(guān)注,但一些不了解顯卡的用戶仍然不了解這款顯卡,讓我們來介紹一下RTX4090顯卡,需要的朋友可2023-11-16
- 這篇文章主要介紹了rtx4090顯卡怎么樣 rtx4090顯卡詳細評測的相關(guān)資料,需要的朋友可以參考下,希望對大家有所幫助2023-06-08
- 這篇文章主要介紹了rtx4090ti多少錢 rtx4090ti顯卡價格介紹的相關(guān)資料,需要的朋友可以參考下,希望對大家有所幫助2023-06-08
網(wǎng)友曝:七彩虹 RTX 4090 顯卡在 3D 測試中打破 3.825GHz 超頻紀(jì)錄
推特用戶 CENS 使用七彩虹的 RTX 4090 LAB 顯卡在 3D 應(yīng)用測試中打破了 3.825GHz 超頻紀(jì)錄,詳細請看下文介紹2023-05-114090 同款設(shè)計! 影馳 GeForce RTX 4070 星曜 OC顯卡首發(fā)評測
影馳 GeForce RTX 4070 星曜 OC顯卡怎么樣?RTX 4070顯卡在昨天正式解禁性能,今天我們評測是型號是來自影馳的非公 RTX 4070顯卡:影馳 RTX 4070星曜 OC2023-04-14RTX4090和RX7900XT哪個好 RTX4090和RX7900XT對比介紹
這篇文章主要介紹了RTX4090和RX7900XT哪個好 RTX4090和RX7900XT對比介紹的相關(guān)資料,需要的朋友可以參考下,希望對大家有所幫助2023-02-27