DLSS 4讓幀數(shù)突破顯示極限! 技嘉RTX 5080超級雕顯卡評測

發(fā)布時間：2025-02-17 08:26:44 作者：佚名

今天繼續(xù)為大家?guī)鞟ORUS Geforce RTX 5080 MASTER 16G的顯卡評測，此前沒有關注RTX 5080首測的朋友，可以再詳細的了解一下

RTX 50系的游戲旗艦RTX 5080顯卡已經(jīng)于1月29日解禁，也就是大年初一。不過相信彼時大家正沉浸在新春佳節(jié)的氛圍中，鮮有人關注顯卡評測。今天繼續(xù)為大家?guī)鞟ORUS Geforce RTX 5080 MASTER 16G的顯卡評測，此前沒有關注RTX 5080首測的朋友，可以再詳細的了解一下。

本代RTX 5080顯卡依然定位4K高分辨率下的高幀光追游戲，并且在Blackwell架構中新引入了DLSS 4，不僅可以做到電競級幀率，甚至部分游戲中，能夠超越300幀，甚至400幀！

另外作為每一代的準旗艦級產(chǎn)品，不僅游戲方面實力強大，同時憑借大顯存，亦可擔當生產(chǎn)力工具，是萬元以下最具實力的多面手。

在整個RTX 50系顯卡中，AI的比重都有著明顯提升，不管在架構層面、游戲領域，還是內容創(chuàng)作，AI已經(jīng)做到各個應用領域的底層覆蓋，包括任何級別顯卡都可使用的DLSS 4 AI多幀生成、針對內容創(chuàng)作的神經(jīng)網(wǎng)絡渲染，以及直播會議應用NVIDIA Broadcast。AI不再局限于文生圖和語言問答那么顯而易見，而是融入到了我們的日常生活中。

本次我們評測的顯卡為AORUS MASTER超級雕，是技嘉的高端旗艦系列，不管是用料規(guī)格還是實際的性能跑分都無愧于超級雕的名號，下面我們先來看看AORUS Geforce RTX 5080 MASTER 16G這張顯卡的外觀。

AORUS Geforce RTX 5080 MASTER 16G概覽

AORUS Geforce RTX 5080 MASTER 16G的包裝依然沿襲了家族風格設計，正面除了高端AORUS系列的logo標志外，還有象征著旗艦地位的MASTER超級雕圖騰，主視覺下方則是NVIDIA的規(guī)范色調和型號標志。

配件方面AORUS Geforce RTX 5080 MASTER 16G除了擁有標準的顯卡支架、和8pin*3轉16pin（12+4）轉接線。不過最醒目的要數(shù)這個散熱風扇，下面我們也會詳細說明它的用法。

AORUS Geforce RTX 5080 MASTER 16G的整體外觀設計與RTX 40系的風格相仿，不過在細節(jié)上仍有較大的變化。整體尺寸為360×150×75mm，采用3.5槽設計。

AORUS Geforce RTX 5080 MASTER 16G整體采用純黑色設計，不過相比前代更具有立體感。飾邊的彩虹色流暢線條營造出廣闊的空間感，同時也為純黑色的導流罩增添了一絲活力。

風扇周圍的圖案和漩渦靈感設計突出了動態(tài) 三環(huán)燈效，營造出迷人的光線和運動相互作用。正面采用分層紋理，具有不同的飾面，將力量與優(yōu)雅完美融合。

AORUS Geforce RTX 5080 MASTER 16G的主動散熱部分，采用仿生風扇設計。葉片設計靈感來源于鷹的翅膀空氣動力學，有效降低了風阻和噪音，在低噪音表現(xiàn)的同時，可將風壓提升高達53.6%，風量提升12.5%。同時正逆轉的運行方式，可減少相鄰風扇之間的擾流并提高氣流壓力。

內部采用雙滾珠軸承結構，比傳統(tǒng)結構具有更好的耐熱性和效率，使用壽命更長。并且當GPU溫度較低或處于較低負載時，風扇將會自動停止運轉，提供零噪音的舒適體驗。

AORUS Geforce RTX 5080 MASTER 16G依然采用了上一代的RGB炫彩光輪設計，可通過GCC軟件選擇燈光效果或與GCC中的其他設備同步。不過這種光輪設計，必須要在顯卡有一定負載的情況下才能看到。

在顯卡側面，LCD顯示屏不僅顯示顯卡信息，還可自定義文本、圖片和 GIF。還可以通過 GCC（技嘉智能管家）調整燈光效果。

在視頻輸出接口上，AORUS Geforce RTX 5080 MASTER16G采用了HDMI 2.1b*1 + DP2.1b*3的四接口設計。

其中DP 2.1b接口為UHBR20規(guī)格，可達 80Gbps 帶寬，最高支持8K (7680x4320)@165Hz（DSC）；4K (3840x2160)@480Hz（DSC）。另外需要注意的是，要達到 80Gbps 帶寬需要DP80LL認證的線材。

本次AORUS Geforce RTX 5080 MASTER 16G的TDP官方給出的為360W，搭載單16pin（12+4）輔助供電，建議電源850W。

AORUS Geforce RTX 5080 MASTER 16G的電源接口設計具備指示燈提示功能，用于提高使用安全性并避免因連接問題導致的隱患：熄滅表示電源連接正常；亮起表示電源線未連接；閃爍則表示電源異常。

另外這張顯卡的電源接口同樣有著人性化設計，它的連接位置下凹，遠離顯卡邊緣，這樣在裝入機箱中，可增加線材與機箱擋板的空間，減少電源線彎折的風險，提升16pin電源接口的兼容性和安全性。

AORUS Geforce RTX 5080 MASTER 16G采用了一體化金屬背板，放射性的線條由AORUS的圖騰延伸至I/O區(qū)邊緣，而右側為大面積裸露的散熱鰭片。

同時在內部散熱系統(tǒng)上，采用了大型均熱板直接與 GPU 接觸，再加上復合式熱管，可快速將 GPU 和 VRAM 的熱量傳遞到散熱器。

AORUS Geforce RTX 5080 MASTER 16G采用了彎角鰭片設計，棱角分明且不等的鰭片高度設計有效地引導鰭片之間的氣流，從而增加與空氣的接觸表面積并提高散熱效率。

包裝內附贈的散熱風扇可置于背板尾部，裸露的散熱鰭片上方，增加主動散熱效果，有助于將鰭片熱量快速帶走。在風扇底部有橡膠墊，可沿背板的輪廓扣入，豎裝顯卡也無需擔心掉落。不過風扇的連接線均需要裝在主板上，對于主板針腳接口緊張的用戶不太友好。

GCC（技嘉智能管家）

GCC（技嘉智能管家）是適用于GIGABYTE產(chǎn)品的統(tǒng)一軟件。它提供更加直觀的界面，允許用戶實時調整核心頻率、電壓、風扇模式和功耗。

在GCC燈效界面，如果使用配套的技嘉主板，默認則會開啟燈光同步，此時無法單獨調節(jié)顯卡風扇燈效，需斷開同步。

單獨調節(jié)顯卡燈效后可分別調節(jié)風扇、背板以及側面的燈光效果，默認情況三處燈光會同時改變，燈效共有多達12種。如果想實時預覽的話，可以打開烤機軟件讓顯卡負載，否則風扇不轉的情況下燈光是不亮的。

在性能界面，可分別監(jiān)控和調節(jié)板卡的參數(shù)，不過這更多的是為進階玩家準備的。普通用戶看看就好，也盡量不要調節(jié)。

最后在LCD Panel界面，可調節(jié)顯卡側面屏幕的顯示效果，除了預設的幾種效果，也可自定義GIF或圖片進行上傳。

NVIDIA RTX Blackwell架構

GeForce RTX 50系顯卡由全新的NVIDIA BlackWell架構打造，本次評測的RTX 5080則采用GB203核心，配備10752個CUDA，84個RT Cores；336個Tensor Cores和336個紋理單元。

完整的GB202核心包括12個圖形處理集群（GPCs）；96個紋理處理集群（TPCs）；192個流式多處理器（SMs），和一個512bit總位寬，包含16個32bit內存控制器的內存接口。

對應到我們熟悉的數(shù)字，則是24576個CUDA，192個RT Cores；768個Tensor Cores以及768個紋理單元。由于第5代Tensor Cores采用了更高速的FP4運算，完整的GB202可達到恐怖的4000 AI TOPS；而第4代RT Cores采用的新的幾何運算模型，也讓它可以達到360 RT TFLOPS。

RTX 5090 PCB

另外，每個SM單元中還包含兩個FP64內核，總共384個。FP64內核主要目的是確保帶有FP64代碼的程序可正常運行，并確保準其確性。這對于某些專業(yè)領域來說至關重要，比如醫(yī)學或專業(yè)計算領域。

GPC是GPU中占據(jù)主導地位的高級模塊，所有關鍵的圖形處理單元都位于GPC中。在RTX 50系中，GPC整體的布局變化不大。

每個GPC包含一個專用的光柵引擎，兩個ROP分區(qū)。每個分區(qū)包含8個單獨的ROP單元和8個TPC，每個TPC包含1個變形引擎和兩個SM單元。

完整的GB202核心還包含128MB的L2緩存。大緩存的變更自RTX 40系顯卡便已開始，所有程序都可以受益于這個高速大容量的緩存池，而光線跟蹤（特別是路徑跟蹤）等復雜操作將產(chǎn)生巨大的好處。

SM單元是GPU架構中的核心組件，在GPU并行處理中發(fā)揮著關鍵作用，它通過其各種核心（CUDA，Tensor，RT），高效的warp調度，內存管理以及對AI等現(xiàn)代工作負載的支持實現(xiàn)大規(guī)模并行。本代RTX 50系顯卡中SM單元的變化非常大，下面我們詳細來了解一下。

完整的GB202核心包含192個SM單元，每個SM包含128個CUDA核心；1個第4代RT Core；4個第5代Tensor Core；4個紋理單元。1個256KB的寄存器文件和128KB的L1共享緩存，它可以根據(jù)圖形和計算工作負載的需要配置不同的大小。

在Blackwell架構的SM單元中，INT32整數(shù)運算的數(shù)量增加了一倍。與Ada架構的SM單元相比，實現(xiàn)了INT32與FP32內核的完全統(tǒng)一。不過在時鐘周期內，統(tǒng)一內核只能作為FP32或INT32內核運行。

與Blackwell架構一同推出的還有GDDR7顯存，采用pam3信號技術，它有著更高頻率與更低電壓的特點。

本代RTX 5090配備28 Gbps GDDR7顯存，峰值顯存帶寬可達1792GB/s/秒，而RTX 5080配備更高的30 Gbps時鐘頻率的GDDR7顯存，峰值內存帶寬可達960 GB/秒。結合新的引腳編碼方案，GDDR7實現(xiàn)了顯著增強的信噪比（SNR）。

通過增加信道密度、改進的pam3信噪比、先進的均衡方案、重新設計的時鐘架構和增強的I/O訓練，GDDR7提供了更高的帶寬。這些進步還顯著提高了能源效率，提供了更好的性能和延長電池壽命，特別是在移動端，或功率受限的系統(tǒng)中。

Blackwell 第4代RT Core

在第4代RT Core中，簡單來說它相比Ada架構，在渲染光線追蹤場景時，提供了兩倍光線三角形相交測試吞吐量，并引入了Mega Geometry的結構算法。

Opacity Micromap Engine

不透明微引擎在Ada架構中已經(jīng)引入，這里不再過多講述，它主要的作用是優(yōu)化光線追蹤渲染，可大幅減輕著色器的工作負擔。

比如樹葉之類的復雜物體，不同的光線都會影響它的表現(xiàn)狀態(tài)，以及樹葉之間的光線反彈，所以對于光線追蹤的計算量是巨大的。

不過Opacity Micromap Engine可以將光線追蹤特性烘焙到不透明蒙版中，所以那些不規(guī)則形狀和半透明的對象，也就能夠更快更精準的渲染出來，從而極大減輕著色器的工作負擔。

RTX Mega Geometry

除了上面提到的Opacity Micromap Engine，在BlackWell架構中，還引入了Mega Geometry（大型幾何）的運算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。

新的Blackwell RT核心包含一個Triangle ClusterIntersection Engine三角形群集交集引擎，它能夠進一步加速大型幾何的光線追蹤，同時它的工作還包含標準的光線三角形交集測試。Linear Swept Spheres則主要用于光線追蹤中精細的幾何形狀，比如發(fā)絲。

RTX Mega Geometry的理念與虛幻5引擎的Nanite虛擬微多邊形幾何體系統(tǒng)相同，在現(xiàn)代游戲中，模型更加細致，需要渲染的工作量大幅增加，如果全部按照最精細的級別處理，將會耗費極大的計算資源，所以將LOD分級便應運而生。

簡單來說，就是根據(jù)一個物體距離攝像機的遠近，來調節(jié)物體的細節(jié)水平。此前《黑神話：悟空》便應用了這樣的技術，它消除了LOD的繁瑣任務，可以掃描并導入極高精細程度的模型。并且，這不會影響性能。仍然可以獲得實時幀速率。

在RTX Mega Geometry中提供了新的BVH構建功能，它采用三角形集群作為一級基元。新的集群加速結構Cluster-level Acceleration Structures（CLAS）可以從256個三角形空間緊湊批次中生成，然后使用CLAS集合作為輸入來構建最終的BVH。

不過虛幻5引擎并非專為Blackwell而設計，RTX Mega Geometry的工作只是更高效的讓游戲引擎調用API。由于其輸入?yún)?shù)完全由GPU內存驅動，游戲引擎可以在GPU上更高效的運行LOD選擇、動畫、剔除等邏輯。同時最大限度減少對CPU的往返，進而減少與BVH管理相關的CPU開銷。

然而在更加精細化的游戲引擎中，按照傳統(tǒng)的流程，應用程序必須從場景中的每一幀的所有對象中構建一個頂層加速結構。而隨著更大的世界規(guī)模以及繁雜的場景物體，僅靠LOD分級仍然難以實現(xiàn)質的變化。

為了解決這個問題，RTX Mega Geometry引入了一種新型的頂層加速結構（TLAS），稱為分區(qū)頂層加速結構（PTLAS）。

它無需在每一幀都從頭開始構建一個新的TLAS，PTLAS能夠辨別從一幀到另一幀，哪些對象是靜態(tài)的。

應用程序通過將對象聚合到分區(qū)中，并僅更新那些已更改的對象來節(jié)省開銷。

例如，游戲可以將靜態(tài)游戲世界的各個部分放入所屬的分區(qū)中，同時將動態(tài)對象分離到每幀重建的“全局分區(qū)”中。與傳統(tǒng)的TLAS相比，請求的分區(qū)更新越少，節(jié)省的運行時開銷就越大。

另外好消息是，RTX Mega Geometry可通過底層API進行擴展支持，適用于所有支持光線追蹤的NVIDIA GPU，也就是從圖靈架構（Turing）開始。

不過Blackwell的第4代RT Core是專門為RTXMega Geometry而設計的，硬件中的特殊集群引擎實現(xiàn)了幾何和BVH數(shù)據(jù)的新壓縮方案，同時是第3代RT Core光線三角形相交率的2倍。因此，Blackwell架構可以實現(xiàn)用更小的顯存，更高效的處理這些內容。

Linear Swept Spheres (LSS)

LSS（線性掃描球體）是Blackwell架構中新增的圖形語言，它極大地簡化了復雜頭發(fā)和毛發(fā)的渲染開銷，并能提升質量。

此前渲染頭發(fā)仍然需要最基礎的三角形來表達物體，如圖所示，發(fā)絲中的一個線段需要6個三角形，而一根頭發(fā)便需要無數(shù)個三角形來確保其精度。比如我們的頭發(fā)則需要600萬個三角形來表達。

Blackwell架構的RT Core引入了LSS新語言的支持，它類似于鑲嵌曲線，允許靈活地近似各種鏈型。并且球體也更適合發(fā)行構建。

LSS的引入可以讓發(fā)型構建，減少3倍的數(shù)據(jù)量，速度大約快了2倍，并可以使用更少的顯存，獲得更高的幀數(shù)。

Blackwell 第5代Tensor Core

本代架構除了RT Core進行了改進升級，專門負責AI及高性能計算的Tensor Core也迎來了重大升級。

與NVIDIA Ada Tensor Cores一樣，Blackwell架構的Tensor Cores支持FP16、BF16、TF32、INT8、INT4和Hopper的FP8 Transformer Engine。

Blackwell還增加了對FP4和FP6 Tensor Core操作的新支持，以及新的第二代FP8 Transformer Engine。

FP4精度支持

FP4提供了一種較低的量化方法，類似于文件壓縮，可以減小模型大小，提升生成速度。與FP16精度（大多數(shù)型號發(fā)布的默認方法）相比，F(xiàn)P4只需要不到一半的顯存。FP4使用NVIDIA TensorRT提供的量化方法，幾乎沒有質量損失。

例如，目前最強的AI繪畫模型FLUX.dev ，在FP16上需要超過23GB的顯存，而這意味著它只能由每一代的期間產(chǎn)品RTX 4090，RTX 5090和專業(yè)GPU來支持。

而對于FP4，F(xiàn)LUX.dev測試對顯存的需求將少于10GB，讓更多80級和70級的顯卡均能在本地運行。

在性能和效果對比上，使用帶有FP16的RTX 4090，F(xiàn)LUX.dev模型可以通過30個步驟在15秒內生成圖像。使用帶有FP4的RTX 5090，只需5秒多一點就可以生成圖像。

DLSS 4

DLSS 4是本代RTX 50系顯卡帶來的重大更新，對于玩家來說它也是最能實際感受到的。最新版本DLSS 4帶來了新的多幀生成（MFG），具有更快的性能和更低的顯存使用等特性。包含超分辨率（SR），光線重建（RR）和深度學習抗鋸齒（DLAA）模型，可進一步增強圖像質量和穩(wěn)定性。

這些新技術由RTX 50系GPU和第5代Tensor Cores支持，并由云端的NVIDIA Al超級計算機提供支持。不過對于手持RTX 40系或更早期顯卡的玩家還無緣體會。DLSS 4新增的多幀生成，目前僅支持RTX 50系顯卡。

Multi Frame Generation（多幀生成）

DLSS多幀生成能夠通過每個傳統(tǒng)渲染幀，生成多達三幀的額外幀來提高FPS。新的幀生成AI模型相比之前的幀生成方法快40%，使用的顯存減少30%，并且每個渲染幀只需要運行一次就可以生成多個幀。高效的AI模型代替了上一代的硬件光流模型，從而加快了光流場的生成速度，并顯著降低了生成額外幀的計算成本。

從生成幀的層面來說，上一代DLSS 3幀生成基于CPU的幀節(jié)奏，而這種方式可能會讓生成的幀與額外的幀混合在一起，導致每幀之間的幀節(jié)奏不太一致，影響平滑性。

為了解決生成多幀的復雜性，Blackwell架構將幀節(jié)奏邏輯轉移到顯示引擎，使GPU能夠更精確地管理顯示時序，從而避免與額外幀混合的情況，進而提升幀生成的準確性及穩(wěn)定性。

而第5代Tensor Cores擁有更高的計算能力，這使得它們能夠更快地執(zhí)行計算光流和生成多幀的一系列AI模型。并更好地調度DLSS AI處理、圖形渲染和幀速度算法。

Transformer模型

此前DLSS所用的模型為Convolutional Neural Network，即我們熟悉的卷積神經(jīng)網(wǎng)絡（CNN），CNN的工作原理是將像素局部聚集在一起，并以樹的形式從低到高地進行分析數(shù)據(jù)。這種結構的計算效率很高，這也是為什么它被稱為卷積神經(jīng)網(wǎng)絡。

而DLSS 4引入了基于Transformer的AI模型，用于DLSS超分辨率、DLSS光線重建和深度學習抗鋸齒（DLAA），從而提高圖像質量和渲染平滑度?；赥ransformer模型體系結構的神經(jīng)網(wǎng)絡，擅長處理涉及順序和結構化數(shù)據(jù)的任務。簡單來說，就是Transformer能夠抓住“重點”，可以更好地理解和渲染復雜場景。

與CNN模型相比，Transformer更容易在更大的像素窗口中識別更遠距離的模式，具有一定的學習能力和“前瞻性”。

本代DLSS 4將基于CNN的神經(jīng)網(wǎng)絡結構，轉變?yōu)榛赥ransformer的神經(jīng)網(wǎng)絡結構，在許多場景下圖像質量都有著顯著提升。

Shader Execution Reordering (SER) 2.0

Shader Execution Reordering（著色器重排序）是在RTX 40系架構中引入的一項技術，它可以使帶有光追的程序有效地重組GPU上的大量并行線程，以最大限度地利用硬件。

因為連貫執(zhí)行神經(jīng)工作負載的線程可以直接發(fā)送到Tensor Core，所以SER也顯著加速了神經(jīng)著色。在Blackwell架構中，SER的核心重排序邏輯效率是原來的兩倍，減少了重排序開銷并提高了精度。從而進一步提高了該功能的有效性。這項功能更多地是為應用程序開發(fā)者而設計，它僅需一個小的API改動，即可執(zhí)行重排序操作，進而提升總體項目的負載性能。

測試平臺簡介

首先介紹一下測試平臺，為了保障AORUS Geforce RTX 5080 MASTER 16G的性能發(fā)揮，我們的平臺也再次進行了全面更新。

除了AORUS Geforce RTX 5080 MASTER 16G這張顯卡，處理器選擇了AMD R7 9800X3D游戲神U。

為了方便觀察DLSS 4在畫質上的提升和4K高幀率帶來的游戲變化。我們選擇了技嘉FO32U2P OLED顯示器，這款顯示器采用了4K@240Hz的高分高刷規(guī)格，可完美適配DLSS 4的多幀生成。而99%的DCI-P3色域覆蓋，更可細致入微地觀察Transformer模型帶來的細節(jié)提升。

本次RTX 50系顯卡采用了帶寬速率更高的PCIe5.0x16，應用于顯卡的PCIe5.0x16帶寬速度高達128GB/s，用于固態(tài)硬盤的PCIe5.0x4也高達32GB/s，致態(tài)TiPro9000，實測順序讀寫速度高達14526.95MB/s和13869.24MB/s，達到“滿血”級別，可大幅提升操作系統(tǒng)/大型游戲/創(chuàng)作軟件的響應和加載速度。

首先看一下GPU-Z的參數(shù)，最新的2.62版本已經(jīng)能夠識別GPU信息。AORUSGeforce RTX 5080 MASTER 16G采用GB203核心，采用與上一代相同的TSMC 4nm定制工藝（TSMC 4nm 4N NVIDIACustomProcess），芯片面積378mm2，相比于RTX 5090的750mm2小了一半。值得注意的是，在RTX 50系顯卡中，使用了PCIE×165.0帶寬。

顯卡擁有10752個CUDA，Boost頻率達到了2805MHz，相比公版的2617MHz，提升非常大。采用16GB GDDR7顯存，位寬為256bit，實際的顯存帶寬達到了960 GB/s，光柵單元和紋理單元為112/336。

理論性能測試

下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝：FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能，取顯卡分數(shù)實際測試結果如下：

在針對顯卡DX11性能的3DMARK FS套裝測試中，AORUS Geforce RTX 5080 MASTER 16G的提升對比RTX 4080 SUPER，在三檔分辨率中的提升分別為，15%/24%/26%，綜合提升約為22%。

而在針對DX12環(huán)境下的Time Spy和Time Spy Extreme測試中，AORUS Geforce RTX 5080 MASTER 16G相較RTX 4080 SUPER的提升分別為：TS提升18%；TSE提升18%，綜合提升約為18%。

PortRoyal是3DMARK中專門針對光追性能的測試項，AORUS Geforce RTX 5080 MASTER 16G相較RTX 4080 SUPER的提升約為26%。

綜合來看，AORUS Geforce RTX 5080 MASTER 16G的理論性能相較RTX 4080 SUPER的提升約為22%。

下面我們再來看看3DMARK中新增的一些具體應用場景的測試。

Speed Way這項測試結合了實時光線追蹤和傳統(tǒng)渲染技術來測量顯卡性能。場景含有光線追蹤反射、實時全局光照、網(wǎng)格著色器、體積照明、粒子和后處理效果。所以SW的測試基本可以看做次世代3A游戲基準。

AORUS Geforce RTX 5080 MASTER 16G對比RTX 4080 SUPER，提升為25%。

在DLSS的理論測試中，有著較大變化，共分為兩種模型。DLSS 2及DLSS 3采用上一代的CNN模型，而最新的多幀生成，則采用了Transformer模型，并且多幀生成可調節(jié)生成幀的數(shù)量。

從測試結果來看，DLSS 4 2X基本可以看作是DLSS 3的幀生成，而相比上一代DLSS 3，DLSS 4 4X模式下，幀數(shù)綜合提升在75%左右，其中在4K和8K提升非常大，在79%左右。而8K分辨率，80及顯卡也是史無前例的達到163幀的成績。

通過DLSS的理論測試，不難發(fā)現(xiàn)8K高刷對于RTX 50系顯卡來說早已不是觸不可及的目標，而在4K分辨率下，更是突破目前旗艦顯示器的上限，達到306幀。

下面我們先實際測試DLSS 4在游戲中的表現(xiàn)如何，能否達到理論測試的提升效果。

DLSS 4性能測試

本次DLSS 4在解禁首日，便可支持75款游戲或應用。除了游戲中首發(fā)支持外，對于尚未集成的游戲，可在NVIDIA app中進行直接調節(jié)非常方便。

在DLSS 4的測試中，首先來看《賽博朋克2077》，目前該游戲隨著RTX 50系顯卡的性能解禁，也已經(jīng)更新了DLSS 4，如果首發(fā)買了顯卡，也可自行測試一番。

《賽博朋克2077》

下面的測試中我們會進行多角度對比，來看看不同DLSS的設置下，三檔畫質的幀數(shù)表現(xiàn)。

在所有測試中，為保證縮放比例固定，我們均選擇在DLSS 質量模式下進行。

傳統(tǒng)DLSS 2的測試中，使用CNN模型DLSS，可以看到即便是AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下，光追超級畫質也僅有69幀，而在光追超速模式下為43幀，無法做到流暢運行。

DLSS 3的測試依然為CNN模型，增加幀生成。可以看到DLSS 3已經(jīng)可以大幅提升幀數(shù)，相較DLSS 2，在4K超級畫質/光追超級/光追加速的提升分別為63%/62%/70%，綜合提升65%。

在DLSS 4的測試中，模型更改為Transformer，開啟多幀生成，首先測試3X下的表現(xiàn)。

AORUS Geforce RTX 5080 MASTER 16G在4K超級畫質/光追超級/光追加速中，相較DLSS 3幀生成的提升分別為27%/37%/42%，將幀率再次拉至新高度，即便在光追超級畫質下，也能達到153幀的電競級幀率。

另外注意，在1080p分辨率的超級畫質中，已經(jīng)達到了驚人的477幀！雖然僅僅是超級畫質，但這依然是標準的3A游戲《賽博朋克2077》。

DLSS 4最后的測試為Transformer模型4X幀生成模式，在4K超級畫質/光追超級/光追加速中，相較DLSS 4的3X幀生成的提升分別為26%/26%/29%，即便在光追加速畫質中，此時光追加速畫質也已經(jīng)來到了127幀。

除了幀數(shù)上的提升，DLSS 4對于畫質表現(xiàn)如何，下面我們來看看實機截圖對比。

可以看到在采用Transformer模型的DLSS 4中，物體表面的紋理細節(jié)更清晰。即便是沒有模型面覆蓋的銹跡，DLSS 4依然能精準還原。

同理，墻上的裂紋在DLSS 4中有更明顯的痕跡。并且整體畫面相較于DLSS 3，更通透明亮。大家也可下載4K圖片自行比對。

《漫威爭鋒》

《漫威爭鋒》是近期大火的FPS+MOBA類網(wǎng)游，最初被看作《守望先鋒》的替代品，但實際游玩效果，無論畫面還是玩法，都更勝一籌。

截至目前，Steam已經(jīng)有超過18萬評價，整體為特別好評。而且《漫威爭鋒》是免費網(wǎng)游，大家下載嘗鮮DLSS 4。

對于一款競技網(wǎng)游來說，高幀率比畫面更重要，使用AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下，DLSS 2質量模式已經(jīng)能夠達到114幀的高幀率。

在4K分辨率下的DLSS 3幀生成模式中，相比DLSS 2在質量模式中提升了31%，達到149幀的電競級幀率。

而在DLSS 4 4X多幀生成中，4K分辨率相比DLSS 3質量模式再提升89%，達到281幀。至于大部分超高刷的1080p FPS電競顯示器，544幀也已經(jīng)完全能夠頂格跑滿了。

在畫面對比中，DLSS 4 4X的四檔畫質也很難看出區(qū)別，角色的頭發(fā)、衣服，遠處的建筑涂繪，基本都和原生畫質分毫不差。

《霍格沃茲之遺》

《霍格沃茲之遺》同樣新增了對DLSS 4的支持，測試分為超高畫質，與打開光追后的超高畫質兩種參數(shù)。在無光追的情況下，AORUS Geforce RTX 5080 MASTER 16G運行這款游戲毫無壓力，即便均為DLSS質量模式下，4K DLSS 4 4X模式也有347幀。

打開光追后，這款游戲對于配置要求激增，不過可以看到在1080p分辨率下與2K分辨率幀數(shù)基本相同，應該是低分辨率下優(yōu)化尚存在問題。

打開光追后，雖然對于配置要求激增，但同樣畫面表現(xiàn)有著明顯區(qū)別，其中最明顯的則是水體，能夠明顯看出隨著深度不同，水體顏色的變化。

另外光線重建則能夠修復一些畫面的細節(jié)表現(xiàn)，比如圖中圈出的部位，開啟光線重建后，建筑的光影層次更分明。

《Alan Wake 2》

在《Alan Wake 2（心靈殺手2）》的測試中，我們選擇默認高畫質，不過可以注意到并非所有選項都開至最高，如體積光和體積聚光燈質量。

《Alan Wake 2（心靈殺手2）》是被譽為次世代最強畫面的游戲，對于配置需求極高，但同時畫面表現(xiàn)堪稱完美。AORUS Geforce RTX 5080 MASTER 16G在不開啟光追的情況下，4K分辨率DLSS 4 4X 質量模式下，可達250幀左右。

而在開啟光追極致畫面后，即便有著DLSS 4多幀生成的加持，AORUS Geforce RTX 5080 MASTER 16G也只有114幀左右。

《Alan Wake 2》整體畫面較為昏暗，但光影氛圍刻畫非常到位。在開啟光追后，陰影的表現(xiàn)更清晰，更符合真實的物理表現(xiàn)，同時水體與《霍格沃茲之遺》相同，均能夠表現(xiàn)出水潭的深淺，相比原生畫質，游戲的代入感更強。

常規(guī)游戲性能測試

除了支持DLSS 4的游戲，我們同樣測試了一些主流的3A大作和支持DLSS 3的游戲，為更多玩家提供參考方向。

《黑神話：悟空》是一款婦孺皆知的國產(chǎn)虛幻5巨制，自帶DLSS 3幀生成。我們的兩項測試也全部開啟幀生成，均為影視級畫質。實測AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下最高已經(jīng)達到了133幀。

在《黑神話：悟空》中，開啟全景光追后，部分幀數(shù)反而更高，這一問題至少目前在benchmark中并未修復。

從AORUS Geforce RTX 5080 MASTER 16G這張卡的實測結果來看，4K分辨率下開關光追在超級性能模式中幀數(shù)差別不大，而從我們此前的測試來看，使用虛幻5引擎的《黑神話：悟空》不同DLSS檔位下的畫質幾乎沒有差距。

如果扔想獲得比較高的畫質，可以選擇性能模式游玩，對于很多風景黨來說，可既享受高幀率的同時，又不損失畫質。

《燕云十六聲》是網(wǎng)易開發(fā)的一款國產(chǎn)武俠大作，在DLSS 2的測試中，2K與4K的成績幾乎完全相同。這絕對是目前游戲優(yōu)化尚不完善，至少在低分辨率下AORUS Geforce RTX 5080 MASTER 16G的表現(xiàn)應該更好。

而在DLSS 3的測試中，仍然出現(xiàn)了DLSS 2中的問題。不過在4K分辨率下AORUS Geforce RTX 5080 MASTER 16G大部分DLSS成績均在200幀左右徘徊，超級性能更是達到了231幀。

近來同樣大火的《三角洲行動》測試中，DLSS 2的優(yōu)化同樣有些問題。不過AORUS Geforce RTX 5080 MASTER 16G在4K分辨率DLSS質量模式下，達到172幀的電競級幀率，性能模式更是達到206幀。

加入幀生成的測試后，低分辨率下的幀數(shù)表現(xiàn)恢復了正常。并且AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下的成績，均在200幀以上。不管是大戰(zhàn)場還是戰(zhàn)役，都無足為懼。

《地平線5》也是顯卡測試的常駐游戲，其憑借出色的優(yōu)化，在原生效果下即可跑出優(yōu)秀的成績。AORUS Geforce RTX 5080 MASTER 16G在DLSS 3 4K分辨率下再創(chuàng)新高，達到194幀的成績。

在《刺客信條：幻景》中，我們關閉游戲的自適應幀率，分別測試DLSS不同擋位與原生畫質下的差異。

AORUS Geforce RTX 5080 MASTER 16G在4K分辨率原生畫質下即可達到百幀的成績，而在DLSS超級性能擋位中，達到185幀。

在《無主之地3》中，AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分別為：1080p提升5%；2K提升11%；4K提升19%，綜合提升12%。在純光柵化游戲幀數(shù)對比中，《無主之地3》比較能概括RTX 5080與RTX 4080 SUPER的光柵化性能的綜合差距。

《光明記憶：無限》的光追測試軟件是獨立于游戲的測試工具，比游戲中用到的光線追蹤技術更多，雖然游戲較老，但對于性能要求卻非常高，本次測試條件為“RTX最高/DLSS質量”。

性能方面，AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分別為：1080p提升14%；2K提升18%；4K提升21%，綜合提升18%。

專業(yè)軟件測試

本代RTX 5080擁有16GB的顯存，而且新架構對于內容創(chuàng)作軟件同樣有優(yōu)化，下面我們分別測試了不同類別的專業(yè)軟件，來看看實際效果。

V-Ray6

V-Ray6對于GPU的測試分為RTX與CUDA，這里主要看RTX成績，其中RTX測試相比RTX 4080 SUPER（7047）首測時提升35%左右。

UL Procyon

本次測試UL提供了FLUX.1 Dev繪畫模型的FP4測試，該模型在FP16上運行需要超過23GB的顯存，而這意味著它只能由每一代的期間產(chǎn)品RTX 4090，RTX 5090和專業(yè)GPU來支持。但FP4只需要不到一半的顯存。而且FP4使用NVIDIA TensorRT提供的量化方法，幾乎沒有質量損失。更小的顯存消耗讓更多80級和70級的顯卡均能在本地運行。

Blackwell架構新的Tensor Core特性不僅讓生成所需的顯存顯著減少，在生成時間也有大幅降低，平均4張圖片即可節(jié)省20秒時間。

FP4渲染生成圖片

FP8渲染生成圖片

在結果對比中，F(xiàn)P8和FP4所生成的圖片效果是相同的，在細節(jié)和圖片精度上均有著良好表現(xiàn)。

Keyshot 2024

Keyshot是一款專注于模擬光線追蹤的渲染軟件，并可分別調用CPU或GPU進行渲染，下面我們看下最終的渲染時間和結果。

使用AORUS Geforce RTX 5080 MASTER 16G渲染一張4K分辨率，采樣率為1000的圖片，最終用時99秒左右。

而使用CPU渲染（AMD R7 9800X3D），則需要1小時35分鐘左右。并且從圖片細節(jié)來看，兩種渲染方式幾乎沒有不同。所以GPU對于內容創(chuàng)作者來說，效率的提升是不言而喻的。

NVIDIA Broadcast

NVIDIA Broadcast是一款用于直播或會議的AI軟件，目前隨著RTX 50系的發(fā)布，也進行了版本更新。

新版NVIDIA Broadcast界面更小巧，縱向布局也更方便視頻直播中調節(jié)選項。

NVIDIA Broadcast一些經(jīng)典效果更方便開啟，其中目光接觸功能非常適合遠程會議，即便眼睛盯著屏幕，也能讓參與人員時刻注意到你的眼睛，并且還有一定“大眼”效果。

虛擬補光仍是測試版功能，它可以在光線較暗的情況下進行面部的AI補光，看你看起來仍然處于光線較好的環(huán)境中。

在新的NVIDIA Broadcast中，還增加了GPU利用率的顯示，當軟件中功能全部打開時，對于GPU的占用率還是非常高的，比較適合會議等不需要過多GPU參與的場景。而如果是游戲直播，則可適當關閉AI效果，以降低GPU利用率。

不過目前新版NVIDIA Broadcast仍處于測試階段，實際效果與GPU開銷應以正式版為準。

NVIDIA App

新版的NVIDIA app代替了原來的GFE軟件，并且功能更強大，使用起來也更方便。最主要的是，它不用登陸了，即下即用。

在NVIDIA app首頁除了顯示最新的驅動信息，還新增了NVIDIA周邊軟件的下載，比如AI繪畫Canvas；圖像視頻對比工具ICAT；性能測試工具FrameView等等，不用再去NVIDIA官網(wǎng)尋找。

從APP中強制開啟DLSS 4的功能上面已有介紹，不過目前并不是所有游戲和軟件均支持此功能。

系統(tǒng)界面中則更多的是調試類功能，如顯示器、視頻、超頻等。

其中性能界面提供了較為詳細的監(jiān)控和超頻選項，需要注意的是新手如果想嘗試超頻，盡量不要改變電壓，這個選項輕則掉驅動，重則燒毀顯卡。

另外玩家可放心大膽地使用NVIDIA app中的性能自動調優(yōu)功能，經(jīng)過NVIDIA反復驗證過的參數(shù)都是在安全范圍內，并且出現(xiàn)問題的話，這張卡仍然具備保修資格。

NVIDIA信息浮窗是游戲中很好的輔助工具，要開啟此功能，需要在APP主界面的設置一欄中，開啟按鈕，之后按【ALT+Z】即可呼出邊欄。

按【ALT+R】可呼出統(tǒng)計數(shù)據(jù)的浮窗，功能設置和自由度的調節(jié)也非常豐富，最主要的是相當簡便。

功耗及溫度測試

功耗測試中，我們選擇FurMark2軟件進行拷機測試，并采用AIDA64檢測信息。

FurMark軟件截至目前，尚無法檢測到GPU信息，部分溫度識別有誤。我們主要看藍色的AIDA64信息。AORUS Geforce RTX 5080 MASTER 16G在1小時左右的烤機測試中GPU溫度為71℃；顯存溫度為70℃。另外可以看到在TDP 100%的滿載情況下，整卡功耗為360W。

除了滿載烤機，我們也實測了游戲中顯卡的真實數(shù)據(jù)表現(xiàn)。測試選擇《賽博朋克2077》benchmark，4K分辨率下光追加速畫質，并開啟DLSS 4 4X多幀生成，將顯卡性能拉滿?？梢钥吹紸ORUS Geforce RTX 5080 MASTER 16G的平均功耗為328W。

進行功耗檢測的同時，我們也調出了延遲數(shù)據(jù)，在DLSS 4 4X多幀生成的環(huán)境下，游戲平均延遲為63ms左右。證明即便有多張AI生成幀參與到游戲中，我們依然能獲得比較“跟手”的操作體驗。

DLSS 4讓幀數(shù)突破顯示極限！

在RTX 50系NVIDIA Blackwell架構中，大家可以明顯感受到內部結構的調整，不僅僅是簡單的CUDA數(shù)量增加、FP算力增強。NVIDIA讓更多的計算單元或引擎，均開始為AI“服務”，讓算力成為AI模型的后盾。這一點其實與此前所有的GPU均不同，包括NVIDIA自己的RTXGPU。

如果說RTX 30系和RTX40系顯卡是靠硬件算力來推動AI工作，那么RTX 50系顯卡的硬件算力則成為了AI應用的“保障性”條件，一切的改變都是為了讓AI有更充足的“后盾”。而相輔相成的，AI技術的應用，也讓計算有了更低的開銷。

其中最顯著的就是DLSS 4的多幀生成，在仍保持較低延遲的體驗中，幀數(shù)能夠提升數(shù)倍。本次DLSS 4之所以有如此大的改變，除了架構本身的變動，另一方面則是從CNN替換到Transformer模型，讓AI從中發(fā)揮更多作用，不再只是單純的計算，更利用AI的長處，做到宏觀把控，進一步增強生成幀的穩(wěn)定性和質量。

并且從長遠來看，后續(xù)70和60級別的產(chǎn)品，憑借DLSS 4的多幀生成，都可以做到暴力的越級體驗。讓主流顯卡體驗2K或4K高幀游戲不再是夢想。

而從顯示器行業(yè)的角度來說，過去高分高刷顯示器的性能嚴重過剩，幾乎沒有游戲能碰到上限。但隨著DLSS 4的推出也鞭策著顯示器行業(yè)有了更大的進步空間。至少從理論測試來看，8K 150幀已經(jīng)不是問題了。

除了游戲方面，F(xiàn)P4運算的引入，也讓內容創(chuàng)作進一步提速。更少的顯存需求、更快的運算速度，以及無可挑剔的生成質量，都可以讓過去常規(guī)的任務，提速增量。而對于規(guī)模更大的項目，也讓不可能變?yōu)榭赡堋?/p>

本次評測的AORUS Geforce RTX 5080 MASTER 16G是技嘉旗艦系列顯卡，坦白講，外觀設計相比RTX 40系順眼了許多，雖然仍然都是黑色，但整體的層次感和小裝飾，起到了畫龍點睛的作用。

另外則是隨卡附帶的散熱風扇，雖然此前也有類似的設計，但更多的還是裝飾意義較大。而AORUSGeforce RTX 5080 MASTER 16G這個散熱風扇則是實打實的好用。滿載烤機溫度59℃，對于一張RTX 5080而且是高頻率的顯卡來說，簡直是奇跡。通常只有采用水冷散熱才能達到這個效果。

可能有玩家會覺得，這個風扇裝上去沒有那么美觀，但它方便的地方就在于可以隨時拆卸，而且風扇針腳和燈光針腳都可以熱插拔，日常使用高溫的情況下救急也是非常方便的。

本次評測的AORUS Geforce RTX 5080 MASTER 16G顯卡已經(jīng)在技嘉各大官方電商有售，想率先體驗DLSS 4的爆炸性能，可以關注一下。

Tag：評測顯卡超級雕技嘉 RTX5080

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

DLSS 4讓幀數(shù)突破顯示極限! 技嘉RTX 5080超級雕顯卡評測

AORUS Geforce RTX 5080 MASTER 16G概覽

GCC（技嘉智能管家）

NVIDIA RTX Blackwell架構

RTX 5090 PCB

Blackwell 第4代RT Core

Opacity Micromap Engine

RTX Mega Geometry

Linear Swept Spheres (LSS)

Blackwell 第5代Tensor Core

FP4精度支持

DLSS 4

Multi Frame Generation（多幀生成）

Transformer模型

Shader Execution Reordering (SER) 2.0

測試平臺簡介

理論性能測試

DLSS 4性能測試

《賽博朋克2077》

《漫威爭鋒》

《霍格沃茲之遺》

《Alan Wake 2》

常規(guī)游戲性能測試

專業(yè)軟件測試

V-Ray6

UL Procyon

Keyshot 2024

NVIDIA Broadcast

NVIDIA App

功耗及溫度測試

DLSS 4讓幀數(shù)突破顯示極限！

相關文章

最新評論

文章分類

大家感興趣的內容

最近更新的內容

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

DLSS 4讓幀數(shù)突破顯示極限! 技嘉RTX 5080超級雕顯卡評測

AORUS Geforce RTX 5080 MASTER 16G概覽

GCC（技嘉智能管家）

NVIDIA RTX Blackwell架構

RTX 5090 PCB

Blackwell 第4代RT Core

Opacity Micromap Engine

RTX Mega Geometry

Linear Swept Spheres (LSS)

Blackwell 第5代Tensor Core

FP4精度支持

DLSS 4

Multi Frame Generation（多幀生成）

Transformer模型

Shader Execution Reordering (SER) 2.0

測試平臺簡介

理論性能測試

DLSS 4性能測試

《賽博朋克2077》

《漫威爭鋒》

《霍格沃茲之遺》

《Alan Wake 2》

常規(guī)游戲性能測試

專業(yè)軟件測試

V-Ray6

UL Procyon

Keyshot 2024

NVIDIA Broadcast

NVIDIA App

功耗及溫度測試

DLSS 4讓幀數(shù)突破顯示極限！

相關文章

最新評論

文章分類

大家感興趣的內容

最近更新的內容

DLSS 4讓幀數(shù)突破顯示極限！