欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

DLSS 4讓幀數(shù)突破顯示極限! 技嘉RTX 5080超級雕顯卡評測

  發(fā)布時間:2025-02-17 08:26:44   作者:佚名   我要評論
今天繼續(xù)為大家?guī)鞟ORUS Geforce RTX 5080 MASTER 16G的顯卡評測,此前沒有關(guān)注RTX 5080首測的朋友,可以再詳細的了解一下

RTX 50系的游戲旗艦RTX 5080顯卡已經(jīng)于1月29日解禁,也就是大年初一。不過相信彼時大家正沉浸在新春佳節(jié)的氛圍中,鮮有人關(guān)注顯卡評測。今天繼續(xù)為大家?guī)鞟ORUS Geforce RTX 5080 MASTER 16G的顯卡評測,此前沒有關(guān)注RTX 5080首測的朋友,可以再詳細的了解一下。

本代RTX 5080顯卡依然定位4K高分辨率下的高幀光追游戲,并且在Blackwell架構(gòu)中新引入了DLSS 4,不僅可以做到電競級幀率,甚至部分游戲中,能夠超越300幀,甚至400幀!

另外作為每一代的準旗艦級產(chǎn)品,不僅游戲方面實力強大,同時憑借大顯存,亦可擔當生產(chǎn)力工具,是萬元以下最具實力的多面手。

在整個RTX 50系顯卡中,AI的比重都有著明顯提升,不管在架構(gòu)層面、游戲領域,還是內(nèi)容創(chuàng)作,AI已經(jīng)做到各個應用領域的底層覆蓋,包括任何級別顯卡都可使用的DLSS 4 AI多幀生成、針對內(nèi)容創(chuàng)作的神經(jīng)網(wǎng)絡渲染,以及直播會議應用NVIDIA Broadcast。AI不再局限于文生圖和語言問答那么顯而易見,而是融入到了我們的日常生活中。

本次我們評測的顯卡為AORUS MASTER超級雕,是技嘉的高端旗艦系列,不管是用料規(guī)格還是實際的性能跑分都無愧于超級雕的名號,下面我們先來看看AORUS Geforce RTX 5080 MASTER 16G這張顯卡的外觀。

AORUS Geforce RTX 5080 MASTER 16G概覽

AORUS Geforce RTX 5080 MASTER 16G的包裝依然沿襲了家族風格設計,正面除了高端AORUS系列的logo標志外,還有象征著旗艦地位的MASTER超級雕圖騰,主視覺下方則是NVIDIA的規(guī)范色調(diào)和型號標志。

配件方面AORUS Geforce RTX 5080 MASTER 16G除了擁有標準的顯卡支架、和8pin*3轉(zhuǎn)16pin(12+4)轉(zhuǎn)接線。不過最醒目的要數(shù)這個散熱風扇,下面我們也會詳細說明它的用法。

AORUS Geforce RTX 5080 MASTER 16G的整體外觀設計與RTX 40系的風格相仿,不過在細節(jié)上仍有較大的變化。整體尺寸為360×150×75mm,采用3.5槽設計。

AORUS Geforce RTX 5080 MASTER 16G整體采用純黑色設計,不過相比前代更具有立體感。飾邊的彩虹色流暢線條營造出廣闊的空間感,同時也為純黑色的導流罩增添了一絲活力。

風扇周圍的圖案和漩渦靈感設計突出了動態(tài) 三環(huán)燈效,營造出迷人的光線和運動相互作用。正面采用分層紋理,具有不同的飾面,將力量與優(yōu)雅完美融合。

AORUS Geforce RTX 5080 MASTER 16G的主動散熱部分,采用仿生風扇設計。葉片設計靈感來源于鷹的翅膀空氣動力學,有效降低了風阻和噪音,在低噪音表現(xiàn)的同時,可將風壓提升高達53.6%,風量提升12.5%。同時正逆轉(zhuǎn)的運行方式,可減少相鄰風扇之間的擾流并提高氣流壓力。

內(nèi)部采用雙滾珠軸承結(jié)構(gòu),比傳統(tǒng)結(jié)構(gòu)具有更好的耐熱性和效率,使用壽命更長。并且當GPU溫度較低或處于較低負載時,風扇將會自動停止運轉(zhuǎn),提供零噪音的舒適體驗。

AORUS Geforce RTX 5080 MASTER 16G依然采用了上一代的RGB炫彩光輪設計,可通過GCC軟件選擇燈光效果或與GCC中的其他設備同步。不過這種光輪設計,必須要在顯卡有一定負載的情況下才能看到。

在顯卡側(cè)面,LCD顯示屏不僅顯示顯卡信息,還可自定義文本、圖片和 GIF。還可以通過 GCC(技嘉智能管家) 調(diào)整燈光效果。

在視頻輸出接口上,AORUS Geforce RTX 5080 MASTER16G采用了HDMI 2.1b*1 + DP2.1b*3的四接口設計。

其中DP 2.1b接口為UHBR20規(guī)格,可達 80Gbps 帶寬,最高支持8K (7680x4320)@165Hz(DSC);4K (3840x2160)@480Hz(DSC)。另外需要注意的是,要達到 80Gbps 帶寬需要DP80LL認證的線材。

本次AORUS Geforce RTX 5080 MASTER 16G的TDP官方給出的為360W,搭載單16pin(12+4)輔助供電,建議電源850W。

AORUS Geforce RTX 5080 MASTER 16G的電源接口設計具備指示燈提示功能,用于提高使用安全性并避免因連接問題導致的隱患:熄滅表示電源連接正常;亮起表示電源線未連接;閃爍則表示電源異常。

另外這張顯卡的電源接口同樣有著人性化設計,它的連接位置下凹,遠離顯卡邊緣,這樣在裝入機箱中,可增加線材與機箱擋板的空間,減少電源線彎折的風險,提升16pin電源接口的兼容性和安全性。

AORUS Geforce RTX 5080 MASTER 16G采用了一體化金屬背板,放射性的線條由AORUS的圖騰延伸至I/O區(qū)邊緣,而右側(cè)為大面積裸露的散熱鰭片。

同時在內(nèi)部散熱系統(tǒng)上,采用了大型均熱板直接與 GPU 接觸,再加上復合式熱管,可快速將 GPU 和 VRAM 的熱量傳遞到散熱器。

AORUS Geforce RTX 5080 MASTER 16G采用了彎角鰭片設計,棱角分明且不等的鰭片高度設計有效地引導鰭片之間的氣流,從而增加與空氣的接觸表面積并提高散熱效率。

包裝內(nèi)附贈的散熱風扇可置于背板尾部,裸露的散熱鰭片上方,增加主動散熱效果,有助于將鰭片熱量快速帶走。在風扇底部有橡膠墊,可沿背板的輪廓扣入,豎裝顯卡也無需擔心掉落。不過風扇的連接線均需要裝在主板上,對于主板針腳接口緊張的用戶不太友好。

GCC(技嘉智能管家)

GCC(技嘉智能管家)是適用于GIGABYTE產(chǎn)品的統(tǒng)一軟件。它提供更加直觀的界面,允許用戶實時調(diào)整核心頻率、電壓、風扇模式和功耗。

在GCC燈效界面,如果使用配套的技嘉主板,默認則會開啟燈光同步,此時無法單獨調(diào)節(jié)顯卡風扇燈效,需斷開同步。

單獨調(diào)節(jié)顯卡燈效后可分別調(diào)節(jié)風扇、背板以及側(cè)面的燈光效果,默認情況三處燈光會同時改變,燈效共有多達12種。如果想實時預覽的話,可以打開烤機軟件讓顯卡負載,否則風扇不轉(zhuǎn)的情況下燈光是不亮的。

在性能界面,可分別監(jiān)控和調(diào)節(jié)板卡的參數(shù),不過這更多的是為進階玩家準備的。普通用戶看看就好,也盡量不要調(diào)節(jié)。

最后在LCD Panel界面,可調(diào)節(jié)顯卡側(cè)面屏幕的顯示效果,除了預設的幾種效果,也可自定義GIF或圖片進行上傳。

NVIDIA RTX Blackwell架構(gòu)

GeForce RTX 50系顯卡由全新的NVIDIA BlackWell架構(gòu)打造,本次評測的RTX 5080則采用GB203核心,配備10752個CUDA,84個RT Cores;336個Tensor Cores和336個紋理單元。

完整的GB202核心包括12個圖形處理集群(GPCs);96個紋理處理集群(TPCs);192個流式多處理器(SMs),和一個512bit總位寬,包含16個32bit內(nèi)存控制器的內(nèi)存接口。

對應到我們熟悉的數(shù)字,則是24576個CUDA,192個RT Cores;768個Tensor Cores以及768個紋理單元。由于第5代Tensor Cores采用了更高速的FP4運算,完整的GB202可達到恐怖的4000 AI TOPS;而第4代RT Cores采用的新的幾何運算模型,也讓它可以達到360 RT TFLOPS。

RTX 5090 PCB

另外,每個SM單元中還包含兩個FP64內(nèi)核,總共384個。FP64內(nèi)核主要目的是確保帶有FP64代碼的程序可正常運行,并確保準其確性。這對于某些專業(yè)領域來說至關(guān)重要,比如醫(yī)學或?qū)I(yè)計算領域。

GPC是GPU中占據(jù)主導地位的高級模塊,所有關(guān)鍵的圖形處理單元都位于GPC中。在RTX 50系中,GPC整體的布局變化不大。

每個GPC包含一個專用的光柵引擎,兩個ROP分區(qū)。每個分區(qū)包含8個單獨的ROP單元和8個TPC,每個TPC包含1個變形引擎和兩個SM單元。

完整的GB202核心還包含128MB的L2緩存。大緩存的變更自RTX 40系顯卡便已開始,所有程序都可以受益于這個高速大容量的緩存池,而光線跟蹤(特別是路徑跟蹤)等復雜操作將產(chǎn)生巨大的好處。

SM單元是GPU架構(gòu)中的核心組件,在GPU并行處理中發(fā)揮著關(guān)鍵作用,它通過其各種核心(CUDA,Tensor,RT),高效的warp調(diào)度,內(nèi)存管理以及對AI等現(xiàn)代工作負載的支持實現(xiàn)大規(guī)模并行。本代RTX 50系顯卡中SM單元的變化非常大,下面我們詳細來了解一下。

完整的GB202核心包含192個SM單元,每個SM包含128個CUDA核心;1個第4代RT Core;4個第5代Tensor Core;4個紋理單元。1個256KB的寄存器文件和128KB的L1共享緩存,它可以根據(jù)圖形和計算工作負載的需要配置不同的大小。

在Blackwell架構(gòu)的SM單元中,INT32整數(shù)運算的數(shù)量增加了一倍。與Ada架構(gòu)的SM單元相比,實現(xiàn)了INT32與FP32內(nèi)核的完全統(tǒng)一。不過在時鐘周期內(nèi),統(tǒng)一內(nèi)核只能作為FP32或INT32內(nèi)核運行。

與Blackwell架構(gòu)一同推出的還有GDDR7顯存,采用pam3信號技術(shù),它有著更高頻率與更低電壓的特點。

本代RTX 5090配備28 Gbps GDDR7顯存,峰值顯存帶寬可達1792GB/s/秒,而RTX 5080配備更高的30 Gbps時鐘頻率的GDDR7顯存,峰值內(nèi)存帶寬可達960 GB/秒。結(jié)合新的引腳編碼方案,GDDR7實現(xiàn)了顯著增強的信噪比(SNR)。

通過增加信道密度、改進的pam3信噪比、先進的均衡方案、重新設計的時鐘架構(gòu)和增強的I/O訓練,GDDR7提供了更高的帶寬。這些進步還顯著提高了能源效率,提供了更好的性能和延長電池壽命,特別是在移動端,或功率受限的系統(tǒng)中。

Blackwell 第4代RT Core

在第4代RT Core中,簡單來說它相比Ada架構(gòu),在渲染光線追蹤場景時,提供了兩倍光線三角形相交測試吞吐量,并引入了Mega Geometry的結(jié)構(gòu)算法。

Opacity Micromap Engine

不透明微引擎在Ada架構(gòu)中已經(jīng)引入,這里不再過多講述,它主要的作用是優(yōu)化光線追蹤渲染,可大幅減輕著色器的工作負擔。

比如樹葉之類的復雜物體,不同的光線都會影響它的表現(xiàn)狀態(tài),以及樹葉之間的光線反彈,所以對于光線追蹤的計算量是巨大的。

不過Opacity Micromap Engine可以將光線追蹤特性烘焙到不透明蒙版中,所以那些不規(guī)則形狀和半透明的對象,也就能夠更快更精準的渲染出來,從而極大減輕著色器的工作負擔。

RTX Mega Geometry

除了上面提到的Opacity Micromap Engine,在BlackWell架構(gòu)中,還引入了Mega Geometry(大型幾何)的運算概念。其中包含了Triangle ClusterIntersection Engine、Linear Swept Spheres等新硬件。

新的Blackwell RT核心包含一個Triangle ClusterIntersection Engine三角形群集交集引擎,它能夠進一步加速大型幾何的光線追蹤,同時它的工作還包含標準的光線三角形交集測試。Linear Swept Spheres則主要用于光線追蹤中精細的幾何形狀,比如發(fā)絲。

RTX Mega Geometry的理念與虛幻5引擎的Nanite虛擬微多邊形幾何體系統(tǒng)相同,在現(xiàn)代游戲中,模型更加細致,需要渲染的工作量大幅增加,如果全部按照最精細的級別處理,將會耗費極大的計算資源,所以將LOD分級便應運而生。

簡單來說,就是根據(jù)一個物體距離攝像機的遠近,來調(diào)節(jié)物體的細節(jié)水平。此前《黑神話:悟空》便應用了這樣的技術(shù),它消除了LOD的繁瑣任務,可以掃描并導入極高精細程度的模型。并且,這不會影響性能。仍然可以獲得實時幀速率。

在RTX Mega Geometry中提供了新的BVH構(gòu)建功能,它采用三角形集群作為一級基元。新的集群加速結(jié)構(gòu)Cluster-level Acceleration Structures(CLAS)可以從256個三角形空間緊湊批次中生成,然后使用CLAS集合作為輸入來構(gòu)建最終的BVH。

不過虛幻5引擎并非專為Blackwell而設計,RTX Mega Geometry的工作只是更高效的讓游戲引擎調(diào)用API。由于其輸入?yún)?shù)完全由GPU內(nèi)存驅(qū)動,游戲引擎可以在GPU上更高效的運行LOD選擇、動畫、剔除等邏輯。同時最大限度減少對CPU的往返,進而減少與BVH管理相關(guān)的CPU開銷。

然而在更加精細化的游戲引擎中,按照傳統(tǒng)的流程,應用程序必須從場景中的每一幀的所有對象中構(gòu)建一個頂層加速結(jié)構(gòu)。而隨著更大的世界規(guī)模以及繁雜的場景物體,僅靠LOD分級仍然難以實現(xiàn)質(zhì)的變化。

為了解決這個問題,RTX Mega Geometry引入了一種新型的頂層加速結(jié)構(gòu)(TLAS),稱為分區(qū)頂層加速結(jié)構(gòu)(PTLAS)。

它無需在每一幀都從頭開始構(gòu)建一個新的TLAS,PTLAS能夠辨別從一幀到另一幀,哪些對象是靜態(tài)的。

應用程序通過將對象聚合到分區(qū)中,并僅更新那些已更改的對象來節(jié)省開銷。

例如,游戲可以將靜態(tài)游戲世界的各個部分放入所屬的分區(qū)中,同時將動態(tài)對象分離到每幀重建的“全局分區(qū)”中。與傳統(tǒng)的TLAS相比,請求的分區(qū)更新越少,節(jié)省的運行時開銷就越大。

另外好消息是,RTX Mega Geometry可通過底層API進行擴展支持,適用于所有支持光線追蹤的NVIDIA GPU,也就是從圖靈架構(gòu)(Turing)開始。

不過Blackwell的第4代RT Core是專門為RTXMega Geometry而設計的,硬件中的特殊集群引擎實現(xiàn)了幾何和BVH數(shù)據(jù)的新壓縮方案,同時是第3代RT Core光線三角形相交率的2倍。因此,Blackwell架構(gòu)可以實現(xiàn)用更小的顯存,更高效的處理這些內(nèi)容。

Linear Swept Spheres (LSS)

LSS(線性掃描球體)是Blackwell架構(gòu)中新增的圖形語言,它極大地簡化了復雜頭發(fā)和毛發(fā)的渲染開銷,并能提升質(zhì)量。

此前渲染頭發(fā)仍然需要最基礎的三角形來表達物體,如圖所示,發(fā)絲中的一個線段需要6個三角形,而一根頭發(fā)便需要無數(shù)個三角形來確保其精度。比如我們的頭發(fā)則需要600萬個三角形來表達。

Blackwell架構(gòu)的RT Core引入了LSS新語言的支持,它類似于鑲嵌曲線,允許靈活地近似各種鏈型。并且球體也更適合發(fā)行構(gòu)建。

LSS的引入可以讓發(fā)型構(gòu)建,減少3倍的數(shù)據(jù)量,速度大約快了2倍,并可以使用更少的顯存,獲得更高的幀數(shù)。

Blackwell 第5代Tensor Core

本代架構(gòu)除了RT Core進行了改進升級,專門負責AI及高性能計算的Tensor Core也迎來了重大升級。

與NVIDIA Ada Tensor Cores一樣,Blackwell架構(gòu)的Tensor Cores支持FP16、BF16、TF32、INT8、INT4和Hopper的FP8 Transformer Engine。

Blackwell還增加了對FP4和FP6 Tensor Core操作的新支持,以及新的第二代FP8 Transformer Engine。

FP4精度支持

FP4提供了一種較低的量化方法,類似于文件壓縮,可以減小模型大小,提升生成速度。與FP16精度(大多數(shù)型號發(fā)布的默認方法)相比,F(xiàn)P4只需要不到一半的顯存。FP4使用NVIDIA TensorRT提供的量化方法,幾乎沒有質(zhì)量損失。

例如,目前最強的AI繪畫模型FLUX.dev ,在FP16上需要超過23GB的顯存,而這意味著它只能由每一代的期間產(chǎn)品RTX 4090,RTX 5090和專業(yè)GPU來支持。

而對于FP4,F(xiàn)LUX.dev測試對顯存的需求將少于10GB,讓更多80級和70級的顯卡均能在本地運行。

在性能和效果對比上,使用帶有FP16的RTX 4090,F(xiàn)LUX.dev模型可以通過30個步驟在15秒內(nèi)生成圖像。使用帶有FP4的RTX 5090,只需5秒多一點就可以生成圖像。

DLSS 4

DLSS 4是本代RTX 50系顯卡帶來的重大更新,對于玩家來說它也是最能實際感受到的。最新版本DLSS 4帶來了新的多幀生成(MFG),具有更快的性能和更低的顯存使用等特性。包含超分辨率(SR),光線重建(RR)和深度學習抗鋸齒(DLAA)模型,可進一步增強圖像質(zhì)量和穩(wěn)定性。

這些新技術(shù)由RTX 50系GPU和第5代Tensor Cores支持,并由云端的NVIDIA Al超級計算機提供支持。不過對于手持RTX 40系或更早期顯卡的玩家還無緣體會。DLSS 4新增的多幀生成,目前僅支持RTX 50系顯卡。

Multi Frame Generation(多幀生成)

DLSS多幀生成能夠通過每個傳統(tǒng)渲染幀,生成多達三幀的額外幀來提高FPS。新的幀生成AI模型相比之前的幀生成方法快40%,使用的顯存減少30%,并且每個渲染幀只需要運行一次就可以生成多個幀。高效的AI模型代替了上一代的硬件光流模型,從而加快了光流場的生成速度,并顯著降低了生成額外幀的計算成本。

從生成幀的層面來說,上一代DLSS 3幀生成基于CPU的幀節(jié)奏,而這種方式可能會讓生成的幀與額外的幀混合在一起,導致每幀之間的幀節(jié)奏不太一致,影響平滑性。

為了解決生成多幀的復雜性,Blackwell架構(gòu)將幀節(jié)奏邏輯轉(zhuǎn)移到顯示引擎,使GPU能夠更精確地管理顯示時序,從而避免與額外幀混合的情況,進而提升幀生成的準確性及穩(wěn)定性。

而第5代Tensor Cores擁有更高的計算能力,這使得它們能夠更快地執(zhí)行計算光流和生成多幀的一系列AI模型。并更好地調(diào)度DLSS AI處理、圖形渲染和幀速度算法。

Transformer模型

此前DLSS所用的模型為Convolutional Neural Network,即我們熟悉的卷積神經(jīng)網(wǎng)絡(CNN),CNN的工作原理是將像素局部聚集在一起,并以樹的形式從低到高地進行分析數(shù)據(jù)。這種結(jié)構(gòu)的計算效率很高,這也是為什么它被稱為卷積神經(jīng)網(wǎng)絡。

而DLSS 4引入了基于Transformer的AI模型,用于DLSS超分辨率、DLSS光線重建和深度學習抗鋸齒(DLAA),從而提高圖像質(zhì)量和渲染平滑度。基于Transformer模型體系結(jié)構(gòu)的神經(jīng)網(wǎng)絡,擅長處理涉及順序和結(jié)構(gòu)化數(shù)據(jù)的任務。簡單來說,就是Transformer能夠抓住“重點”,可以更好地理解和渲染復雜場景。

與CNN模型相比,Transformer更容易在更大的像素窗口中識別更遠距離的模式,具有一定的學習能力和“前瞻性”。

本代DLSS 4將基于CNN的神經(jīng)網(wǎng)絡結(jié)構(gòu),轉(zhuǎn)變?yōu)榛赥ransformer的神經(jīng)網(wǎng)絡結(jié)構(gòu),在許多場景下圖像質(zhì)量都有著顯著提升。

Shader Execution Reordering (SER) 2.0

Shader Execution Reordering(著色器重排序)是在RTX 40系架構(gòu)中引入的一項技術(shù),它可以使帶有光追的程序有效地重組GPU上的大量并行線程,以最大限度地利用硬件。

因為連貫執(zhí)行神經(jīng)工作負載的線程可以直接發(fā)送到Tensor Core,所以SER也顯著加速了神經(jīng)著色。在Blackwell架構(gòu)中,SER的核心重排序邏輯效率是原來的兩倍,減少了重排序開銷并提高了精度。從而進一步提高了該功能的有效性。這項功能更多地是為應用程序開發(fā)者而設計,它僅需一個小的API改動,即可執(zhí)行重排序操作,進而提升總體項目的負載性能。

測試平臺簡介

首先介紹一下測試平臺,為了保障AORUS Geforce RTX 5080 MASTER 16G的性能發(fā)揮,我們的平臺也再次進行了全面更新。

除了AORUS Geforce RTX 5080 MASTER 16G這張顯卡,處理器選擇了AMD R7 9800X3D游戲神U。

為了方便觀察DLSS 4在畫質(zhì)上的提升和4K高幀率帶來的游戲變化。我們選擇了技嘉FO32U2P OLED顯示器,這款顯示器采用了4K@240Hz的高分高刷規(guī)格,可完美適配DLSS 4的多幀生成。而99%的DCI-P3色域覆蓋,更可細致入微地觀察Transformer模型帶來的細節(jié)提升。

本次RTX 50系顯卡采用了帶寬速率更高的PCIe5.0x16,應用于顯卡的PCIe5.0x16帶寬速度高達128GB/s,用于固態(tài)硬盤的PCIe5.0x4也高達32GB/s,致態(tài)TiPro9000,實測順序讀寫速度高達14526.95MB/s和13869.24MB/s,達到“滿血”級別,可大幅提升操作系統(tǒng)/大型游戲/創(chuàng)作軟件的響應和加載速度。

首先看一下GPU-Z的參數(shù),最新的2.62版本已經(jīng)能夠識別GPU信息。AORUSGeforce RTX 5080 MASTER 16G采用GB203核心,采用與上一代相同的TSMC 4nm定制工藝(TSMC 4nm 4N NVIDIACustomProcess),芯片面積378mm2,相比于RTX 5090的750mm2小了一半。值得注意的是,在RTX 50系顯卡中,使用了PCIE×165.0帶寬。

顯卡擁有10752個CUDA,Boost頻率達到了2805MHz,相比公版的2617MHz,提升非常大。采用16GB GDDR7顯存,位寬為256bit,實際的顯存帶寬達到了960 GB/s,光柵單元和紋理單元為112/336。

理論性能測試

下面先進行的是用來衡量顯卡DX11理論性能的3DMARKFS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數(shù)實際測試結(jié)果如下:

在針對顯卡DX11性能的3DMARK FS套裝測試中,AORUS Geforce RTX 5080 MASTER 16G的提升對比RTX 4080 SUPER,在三檔分辨率中的提升分別為,15%/24%/26%,綜合提升約為22%。

而在針對DX12環(huán)境下的Time Spy和Time Spy Extreme測試中,AORUS Geforce RTX 5080 MASTER 16G相較RTX 4080 SUPER的提升分別為:TS提升18%;TSE提升18%,綜合提升約為18%。

PortRoyal是3DMARK中專門針對光追性能的測試項,AORUS Geforce RTX 5080 MASTER 16G相較RTX 4080 SUPER的提升約為26%。

綜合來看,AORUS Geforce RTX 5080 MASTER 16G的理論性能相較RTX 4080 SUPER的提升約為22%。

下面我們再來看看3DMARK中新增的一些具體應用場景的測試。

Speed Way這項測試結(jié)合了實時光線追蹤和傳統(tǒng)渲染技術(shù)來測量顯卡性能。場景含有光線追蹤反射、實時全局光照、網(wǎng)格著色器、體積照明、粒子和后處理效果。所以SW的測試基本可以看做次世代3A游戲基準。

AORUS Geforce RTX 5080 MASTER 16G對比RTX 4080 SUPER,提升為25%。

在DLSS的理論測試中,有著較大變化,共分為兩種模型。DLSS 2及DLSS 3采用上一代的CNN模型,而最新的多幀生成,則采用了Transformer模型,并且多幀生成可調(diào)節(jié)生成幀的數(shù)量。

從測試結(jié)果來看,DLSS 4 2X基本可以看作是DLSS 3的幀生成,而相比上一代DLSS 3,DLSS 4 4X模式下,幀數(shù)綜合提升在75%左右,其中在4K和8K提升非常大,在79%左右。而8K分辨率,80及顯卡也是史無前例的達到163幀的成績。

通過DLSS的理論測試,不難發(fā)現(xiàn)8K高刷對于RTX 50系顯卡來說早已不是觸不可及的目標,而在4K分辨率下,更是突破目前旗艦顯示器的上限,達到306幀。

下面我們先實際測試DLSS 4在游戲中的表現(xiàn)如何,能否達到理論測試的提升效果。

DLSS 4性能測試

本次DLSS 4在解禁首日,便可支持75款游戲或應用。除了游戲中首發(fā)支持外,對于尚未集成的游戲,可在NVIDIA app中進行直接調(diào)節(jié)非常方便。

在DLSS 4的測試中,首先來看《賽博朋克2077》,目前該游戲隨著RTX 50系顯卡的性能解禁,也已經(jīng)更新了DLSS 4,如果首發(fā)買了顯卡,也可自行測試一番。

《賽博朋克2077》

下面的測試中我們會進行多角度對比,來看看不同DLSS的設置下,三檔畫質(zhì)的幀數(shù)表現(xiàn)。

在所有測試中,為保證縮放比例固定,我們均選擇在DLSS 質(zhì)量模式下進行。

傳統(tǒng)DLSS 2的測試中,使用CNN模型DLSS,可以看到即便是AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下,光追超級畫質(zhì)也僅有69幀,而在光追超速模式下為43幀,無法做到流暢運行。

DLSS 3的測試依然為CNN模型,增加幀生成??梢钥吹紻LSS 3已經(jīng)可以大幅提升幀數(shù),相較DLSS 2,在4K超級畫質(zhì)/光追超級/光追加速 的提升分別為63%/62%/70%,綜合提升65%。

在DLSS 4的測試中,模型更改為Transformer,開啟多幀生成,首先測試3X下的表現(xiàn)。

AORUS Geforce RTX 5080 MASTER 16G在4K超級畫質(zhì)/光追超級/光追加速中,相較DLSS 3幀生成的提升分別為27%/37%/42%,將幀率再次拉至新高度,即便在光追超級畫質(zhì)下,也能達到153幀的電競級幀率。

另外注意,在1080p分辨率的超級畫質(zhì)中,已經(jīng)達到了驚人的477幀!雖然僅僅是超級畫質(zhì),但這依然是標準的3A游戲《賽博朋克2077》。

DLSS 4最后的測試為Transformer模型4X幀生成模式,在4K超級畫質(zhì)/光追超級/光追加速中,相較DLSS 4的3X幀生成的提升分別為26%/26%/29%,即便在光追加速畫質(zhì)中,此時光追加速畫質(zhì)也已經(jīng)來到了127幀。

除了幀數(shù)上的提升,DLSS 4對于畫質(zhì)表現(xiàn)如何,下面我們來看看實機截圖對比。

可以看到在采用Transformer模型的DLSS 4中,物體表面的紋理細節(jié)更清晰。即便是沒有模型面覆蓋的銹跡,DLSS 4依然能精準還原。

同理,墻上的裂紋在DLSS 4中有更明顯的痕跡。并且整體畫面相較于DLSS 3,更通透明亮。大家也可下載4K圖片自行比對。

《漫威爭鋒》

《漫威爭鋒》是近期大火的FPS+MOBA類網(wǎng)游,最初被看作《守望先鋒》的替代品,但實際游玩效果,無論畫面還是玩法,都更勝一籌。

截至目前,Steam已經(jīng)有超過18萬評價,整體為特別好評。而且《漫威爭鋒》是免費網(wǎng)游,大家下載嘗鮮DLSS 4。

對于一款競技網(wǎng)游來說,高幀率比畫面更重要,使用AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下,DLSS 2質(zhì)量模式已經(jīng)能夠達到114幀的高幀率。

在4K分辨率下的DLSS 3幀生成模式中,相比DLSS 2在質(zhì)量模式中提升了31%,達到149幀的電競級幀率。

而在DLSS 4 4X多幀生成中,4K分辨率相比DLSS 3質(zhì)量模式再提升89%,達到281幀。至于大部分超高刷的1080p FPS電競顯示器,544幀也已經(jīng)完全能夠頂格跑滿了。

在畫面對比中,DLSS 4 4X的四檔畫質(zhì)也很難看出區(qū)別,角色的頭發(fā)、衣服,遠處的建筑涂繪,基本都和原生畫質(zhì)分毫不差。

《霍格沃茲之遺》

《霍格沃茲之遺》同樣新增了對DLSS 4的支持,測試分為超高畫質(zhì),與打開光追后的超高畫質(zhì)兩種參數(shù)。在無光追的情況下,AORUS Geforce RTX 5080 MASTER 16G運行這款游戲毫無壓力,即便均為DLSS質(zhì)量模式下,4K DLSS 4 4X模式也有347幀。

打開光追后,這款游戲?qū)τ谂渲靡蠹ぴ觯贿^可以看到在1080p分辨率下與2K分辨率幀數(shù)基本相同,應該是低分辨率下優(yōu)化尚存在問題。

打開光追后,雖然對于配置要求激增,但同樣畫面表現(xiàn)有著明顯區(qū)別,其中最明顯的則是水體,能夠明顯看出隨著深度不同,水體顏色的變化。

另外光線重建則能夠修復一些畫面的細節(jié)表現(xiàn),比如圖中圈出的部位,開啟光線重建后,建筑的光影層次更分明。

《Alan Wake 2》

在《Alan Wake 2(心靈殺手2)》的測試中,我們選擇默認高畫質(zhì),不過可以注意到并非所有選項都開至最高,如體積光和體積聚光燈質(zhì)量。

《Alan Wake 2(心靈殺手2)》是被譽為次世代最強畫面的游戲,對于配置需求極高,但同時畫面表現(xiàn)堪稱完美。AORUS Geforce RTX 5080 MASTER 16G在不開啟光追的情況下,4K分辨率DLSS 4 4X 質(zhì)量模式下,可達250幀左右。

而在開啟光追極致畫面后,即便有著DLSS 4多幀生成的加持,AORUS Geforce RTX 5080 MASTER 16G也只有114幀左右。

《Alan Wake 2》整體畫面較為昏暗,但光影氛圍刻畫非常到位。在開啟光追后,陰影的表現(xiàn)更清晰,更符合真實的物理表現(xiàn),同時水體與《霍格沃茲之遺》相同,均能夠表現(xiàn)出水潭的深淺,相比原生畫質(zhì),游戲的代入感更強。

常規(guī)游戲性能測試

除了支持DLSS 4的游戲,我們同樣測試了一些主流的3A大作和支持DLSS 3的游戲,為更多玩家提供參考方向。

《黑神話:悟空》是一款婦孺皆知的國產(chǎn)虛幻5巨制,自帶DLSS 3幀生成。我們的兩項測試也全部開啟幀生成,均為影視級畫質(zhì)。實測AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下最高已經(jīng)達到了133幀。

在《黑神話:悟空》中,開啟全景光追后,部分幀數(shù)反而更高,這一問題至少目前在benchmark中并未修復。

從AORUS Geforce RTX 5080 MASTER 16G這張卡的實測結(jié)果來看,4K分辨率下開關(guān)光追在超級性能模式中幀數(shù)差別不大,而從我們此前的測試來看,使用虛幻5引擎的《黑神話:悟空》不同DLSS檔位下的畫質(zhì)幾乎沒有差距。

如果扔想獲得比較高的畫質(zhì),可以選擇性能模式游玩,對于很多風景黨來說,可既享受高幀率的同時,又不損失畫質(zhì)。

《燕云十六聲》是網(wǎng)易開發(fā)的一款國產(chǎn)武俠大作,在DLSS 2的測試中,2K與4K的成績幾乎完全相同。這絕對是目前游戲優(yōu)化尚不完善,至少在低分辨率下AORUS Geforce RTX 5080 MASTER 16G的表現(xiàn)應該更好。

而在DLSS 3的測試中,仍然出現(xiàn)了DLSS 2中的問題。不過在4K分辨率下AORUS Geforce RTX 5080 MASTER 16G大部分DLSS成績均在200幀左右徘徊,超級性能更是達到了231幀。

近來同樣大火的《三角洲行動》測試中,DLSS 2的優(yōu)化同樣有些問題。不過AORUS Geforce RTX 5080 MASTER 16G在4K分辨率DLSS質(zhì)量模式下,達到172幀的電競級幀率,性能模式更是達到206幀。

加入幀生成的測試后,低分辨率下的幀數(shù)表現(xiàn)恢復了正常。并且AORUS Geforce RTX 5080 MASTER 16G在4K分辨率下的成績,均在200幀以上。不管是大戰(zhàn)場還是戰(zhàn)役,都無足為懼。

《地平線5》也是顯卡測試的常駐游戲,其憑借出色的優(yōu)化,在原生效果下即可跑出優(yōu)秀的成績。AORUS Geforce RTX 5080 MASTER 16G在DLSS 3 4K分辨率下再創(chuàng)新高,達到194幀的成績。

在《刺客信條:幻景》中,我們關(guān)閉游戲的自適應幀率,分別測試DLSS不同擋位與原生畫質(zhì)下的差異。

AORUS Geforce RTX 5080 MASTER 16G在4K分辨率原生畫質(zhì)下即可達到百幀的成績,而在DLSS超級性能擋位中,達到185幀。

在《無主之地3》中,AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分別為:1080p提升5%;2K提升11%;4K提升19%,綜合提升12%。在純光柵化游戲幀數(shù)對比中,《無主之地3》比較能概括RTX 5080與RTX 4080 SUPER的光柵化性能的綜合差距。

《光明記憶:無限》的光追測試軟件是獨立于游戲的測試工具,比游戲中用到的光線追蹤技術(shù)更多,雖然游戲較老,但對于性能要求卻非常高,本次測試條件為“RTX最高/DLSS質(zhì)量”。

性能方面,AORUS Geforce RTX 5080 MASTER 16G相比RTX 4080 SUPER的提升分別為:1080p提升14%;2K提升18%;4K提升21%,綜合提升18%。

專業(yè)軟件測試

本代RTX 5080擁有16GB的顯存,而且新架構(gòu)對于內(nèi)容創(chuàng)作軟件同樣有優(yōu)化,下面我們分別測試了不同類別的專業(yè)軟件,來看看實際效果。

V-Ray6

V-Ray6對于GPU的測試分為RTX與CUDA,這里主要看RTX成績,其中RTX測試相比RTX 4080 SUPER(7047)首測時提升35%左右。

UL Procyon

本次測試UL提供了FLUX.1 Dev繪畫模型的FP4測試,該模型在FP16上運行需要超過23GB的顯存,而這意味著它只能由每一代的期間產(chǎn)品RTX 4090,RTX 5090和專業(yè)GPU來支持。但FP4只需要不到一半的顯存。而且FP4使用NVIDIA TensorRT提供的量化方法,幾乎沒有質(zhì)量損失。更小的顯存消耗讓更多80級和70級的顯卡均能在本地運行。

Blackwell架構(gòu)新的Tensor Core特性不僅讓生成所需的顯存顯著減少,在生成時間也有大幅降低,平均4張圖片即可節(jié)省20秒時間。

FP4渲染生成圖片

FP8渲染生成圖片

在結(jié)果對比中,F(xiàn)P8和FP4所生成的圖片效果是相同的,在細節(jié)和圖片精度上均有著良好表現(xiàn)。

Keyshot 2024

Keyshot是一款專注于模擬光線追蹤的渲染軟件,并可分別調(diào)用CPU或GPU進行渲染,下面我們看下最終的渲染時間和結(jié)果。

使用AORUS Geforce RTX 5080 MASTER 16G渲染一張4K分辨率,采樣率為1000的圖片,最終用時99秒左右。

而使用CPU渲染(AMD R7 9800X3D),則需要1小時35分鐘左右。并且從圖片細節(jié)來看,兩種渲染方式幾乎沒有不同。所以GPU對于內(nèi)容創(chuàng)作者來說,效率的提升是不言而喻的。

NVIDIA Broadcast

NVIDIA Broadcast是一款用于直播或會議的AI軟件,目前隨著RTX 50系的發(fā)布,也進行了版本更新。

新版NVIDIA Broadcast界面更小巧,縱向布局也更方便視頻直播中調(diào)節(jié)選項。

NVIDIA Broadcast一些經(jīng)典效果更方便開啟,其中目光接觸功能非常適合遠程會議,即便眼睛盯著屏幕,也能讓參與人員時刻注意到你的眼睛,并且還有一定“大眼”效果。

虛擬補光仍是測試版功能,它可以在光線較暗的情況下進行面部的AI補光,看你看起來仍然處于光線較好的環(huán)境中。

在新的NVIDIA Broadcast中,還增加了GPU利用率的顯示,當軟件中功能全部打開時,對于GPU的占用率還是非常高的,比較適合會議等不需要過多GPU參與的場景。而如果是游戲直播,則可適當關(guān)閉AI效果,以降低GPU利用率。

不過目前新版NVIDIA Broadcast仍處于測試階段,實際效果與GPU開銷應以正式版為準。

NVIDIA App

新版的NVIDIA app代替了原來的GFE軟件,并且功能更強大,使用起來也更方便。最主要的是,它不用登陸了,即下即用。

在NVIDIA app首頁除了顯示最新的驅(qū)動信息,還新增了NVIDIA周邊軟件的下載,比如AI繪畫Canvas;圖像視頻對比工具ICAT;性能測試工具FrameView等等,不用再去NVIDIA官網(wǎng)尋找。

從APP中強制開啟DLSS 4的功能上面已有介紹,不過目前并不是所有游戲和軟件均支持此功能。

系統(tǒng)界面中則更多的是調(diào)試類功能,如顯示器、視頻、超頻等。

其中性能界面提供了較為詳細的監(jiān)控和超頻選項,需要注意的是新手如果想嘗試超頻,盡量不要改變電壓,這個選項輕則掉驅(qū)動,重則燒毀顯卡。

另外玩家可放心大膽地使用NVIDIA app中的性能自動調(diào)優(yōu)功能,經(jīng)過NVIDIA反復驗證過的參數(shù)都是在安全范圍內(nèi),并且出現(xiàn)問題的話,這張卡仍然具備保修資格。

NVIDIA信息浮窗是游戲中很好的輔助工具,要開啟此功能,需要在APP主界面的設置一欄中,開啟按鈕,之后按【ALT+Z】即可呼出邊欄。

按【ALT+R】可呼出統(tǒng)計數(shù)據(jù)的浮窗,功能設置和自由度的調(diào)節(jié)也非常豐富,最主要的是相當簡便。

功耗及溫度測試

功耗測試中,我們選擇FurMark2軟件進行拷機測試,并采用AIDA64檢測信息。

FurMark軟件截至目前,尚無法檢測到GPU信息,部分溫度識別有誤。我們主要看藍色的AIDA64信息。AORUS Geforce RTX 5080 MASTER 16G在1小時左右的烤機測試中GPU溫度為71℃;顯存溫度為70℃。另外可以看到在TDP 100%的滿載情況下,整卡功耗為360W。

除了滿載烤機,我們也實測了游戲中顯卡的真實數(shù)據(jù)表現(xiàn)。測試選擇《賽博朋克2077》benchmark,4K分辨率下光追加速畫質(zhì),并開啟DLSS 4 4X多幀生成,將顯卡性能拉滿。可以看到AORUS Geforce RTX 5080 MASTER 16G的平均功耗為328W。

進行功耗檢測的同時,我們也調(diào)出了延遲數(shù)據(jù),在DLSS 4 4X多幀生成的環(huán)境下,游戲平均延遲為63ms左右。證明即便有多張AI生成幀參與到游戲中,我們依然能獲得比較“跟手”的操作體驗。

DLSS 4讓幀數(shù)突破顯示極限!

在RTX 50系NVIDIA Blackwell架構(gòu)中,大家可以明顯感受到內(nèi)部結(jié)構(gòu)的調(diào)整,不僅僅是簡單的CUDA數(shù)量增加、FP算力增強。NVIDIA讓更多的計算單元或引擎,均開始為AI“服務”,讓算力成為AI模型的后盾。這一點其實與此前所有的GPU均不同,包括NVIDIA自己的RTXGPU。

如果說RTX 30系和RTX40系顯卡是靠硬件算力來推動AI工作,那么RTX 50系顯卡的硬件算力則成為了AI應用的“保障性”條件,一切的改變都是為了讓AI有更充足的“后盾”。而相輔相成的,AI技術(shù)的應用,也讓計算有了更低的開銷。

其中最顯著的就是DLSS 4的多幀生成,在仍保持較低延遲的體驗中,幀數(shù)能夠提升數(shù)倍。本次DLSS 4之所以有如此大的改變,除了架構(gòu)本身的變動,另一方面則是從CNN替換到Transformer模型,讓AI從中發(fā)揮更多作用,不再只是單純的計算,更利用AI的長處,做到宏觀把控,進一步增強生成幀的穩(wěn)定性和質(zhì)量。

并且從長遠來看,后續(xù)70和60級別的產(chǎn)品,憑借DLSS 4的多幀生成,都可以做到暴力的越級體驗。讓主流顯卡體驗2K或4K高幀游戲不再是夢想。

而從顯示器行業(yè)的角度來說,過去高分高刷顯示器的性能嚴重過剩,幾乎沒有游戲能碰到上限。但隨著DLSS 4的推出也鞭策著顯示器行業(yè)有了更大的進步空間。至少從理論測試來看,8K 150幀已經(jīng)不是問題了。

除了游戲方面,F(xiàn)P4運算的引入,也讓內(nèi)容創(chuàng)作進一步提速。更少的顯存需求、更快的運算速度,以及無可挑剔的生成質(zhì)量,都可以讓過去常規(guī)的任務,提速增量。而對于規(guī)模更大的項目,也讓不可能變?yōu)榭赡堋?/p>

本次評測的AORUS Geforce RTX 5080 MASTER 16G是技嘉旗艦系列顯卡,坦白講,外觀設計相比RTX 40系順眼了許多,雖然仍然都是黑色,但整體的層次感和小裝飾,起到了畫龍點睛的作用。

另外則是隨卡附帶的散熱風扇,雖然此前也有類似的設計,但更多的還是裝飾意義較大。而AORUSGeforce RTX 5080 MASTER 16G這個散熱風扇則是實打?qū)嵉暮糜?。滿載烤機溫度59℃,對于一張RTX 5080而且是高頻率的顯卡來說,簡直是奇跡。通常只有采用水冷散熱才能達到這個效果。

可能有玩家會覺得,這個風扇裝上去沒有那么美觀,但它方便的地方就在于可以隨時拆卸,而且風扇針腳和燈光針腳都可以熱插拔,日常使用高溫的情況下救急也是非常方便的。

本次評測的AORUS Geforce RTX 5080 MASTER 16G顯卡已經(jīng)在技嘉各大官方電商有售,想率先體驗DLSS 4的爆炸性能,可以關(guān)注一下。

相關(guān)文章

最新評論