4K光追新王者! 索泰 RTX4080 SUPER顯卡全面測評

發(fā)布時間：2024-08-02 11:06:54 作者：佚名

索泰帶著極致硬核的RTX 40 SUPER系顯卡系列驚艷亮相，為觀眾帶來了一場視覺與體驗的盛宴，下面我們就來看看詳細測評

暑期大促相信對于眾多 DIY 玩家來說是個攢硬件的好日子，作為裝機大頭的顯卡應(yīng)該有不少朋友都在關(guān)注。而作為老黃家的次旗艦 nvdida RTX 4080 SUPER ，想來也有不少小伙伴既想入手，又糾結(jié)于性能價格是否對等。

有鑒于此，我也利用手頭的索泰 RTX 4080 SUPER 顯卡做了幾項測試，順便分享下個人對 RTX 4080 SUPER 定位看法。

快問快答NVIDIA Ada Lovelace 架構(gòu)優(yōu)勢何在

RTX 40 系列顯卡這次采用了全新的 NVIDIA Ada Lovelace 架構(gòu)，以早期計算先驅(qū)Ada Lovelace 的名字命名。工藝采用定制 TSMC 4N NVIDIA工藝，核心面積從上一代的 628.4mm² 縮小到 608.5mm²，晶體管數(shù)量從上一代的 283 億個提升至 763 億個。最恐怖的是核心面積一直在縮小的同時晶體管數(shù)目保持夸張的增長速度，同時功耗也持平甚至更低于上代。

全景光線追蹤：Ada Lovelace 架構(gòu)引入了新的全景光線追蹤技術(shù)，包括新的 RT 核心、更多的著色器以及新的 Tensor 核心，這些技術(shù)的結(jié)合使得光線追蹤的性能得到顯著提升。
光流加速器：架構(gòu)中增加了光流加速器的運算性能，從Ampere架構(gòu)的 126 TFLOPS增加到 300 TFLOPS，這使得DLSS 3能夠預測場景中的運動，提高幀率同時保持圖像質(zhì)量。
DLSS 3技術(shù)：DLSS 3 包括幀生成技術(shù)、DLSS 2 超分辨率技術(shù)和 NVIDIA Reflex 技術(shù)，為游戲體驗的流暢度、延遲和畫質(zhì)提供全方位的提升。
編碼器升級：NVIDIA 編碼器 (NVENC) 升級到了第八代，開始支持 A V1 編碼，其效率比 H.264 高 40%，減少了數(shù)據(jù)量需求，同時提高畫面質(zhì)量。
第四代Tensor Core：Ada架構(gòu)搭載了新的第四代Tensor Core，支持FP8數(shù)據(jù)類型，增加了INT4支持，同時去掉了 FP64 的支持，提供更高的AI計算性能。
第三代RT Core：Ada 架構(gòu)的第三代 RT Core 將光線與三角形求交性能提高了一倍，同時 RT-TFLOP 峰值性能也提高了一倍，引入了 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎，大幅提升了光線追蹤的速度和效率。
著色器執(zhí)行重排序（SER）：SER 技術(shù)能夠動態(tài)調(diào)整工作負載的順序，最高可將光線追蹤操作的著色器性能提升2倍，或?qū)⒂螒驇侍嵘?25%。
架構(gòu)規(guī)模增大：Ada Lovelace 的GPC數(shù)量從Ampere的最大7個增加到12個，二級緩存規(guī)模是上一代的 16倍，顯著提升了性能。
顯存帶寬和PCIe支持：支持 1TB/s 的 GDDR6X 顯存帶寬和 PCIe GEN4 ，提供更高的數(shù)據(jù)傳輸速率。
NVIDIA RTX 6000 GPU：基于 Ada Lovelace 架構(gòu)的 RTX 6000 GPU 為NVIDIA Omniverse™ Enterprise 平臺提供了卓越的圖形、AI 和計算性能，促進了協(xié)作、內(nèi)容創(chuàng)作和仿真的發(fā)展。

RTX 4080 SUPER到底升級了啥？

不同于上代 4080 殘血 AD103 - 300 核心，4080S 是真滿血版本 AD103 - 400 ，擁有完整的 80 組 SM 單元、流處理器多了 512 顆。此外顯存位寬不變的情況下，顯存頻率提升到了 23Gbps（22.4Gbps），帶寬上升到了 736GB/s（717GB/s）。

從數(shù)據(jù)方面來看，RTX 4080 SUPER 領(lǐng)先 4080 大概 5% 左右，不過反映到實際游戲場景，提升大概在 2% ~ 3% 左右。不過這都不是重點，重點是RTX 4080 SUPER的發(fā)售價比RTX 4080 還低了約 16.7%，增量降價沒跑了

哪些用戶是否需要 RTX 4080 SUPER

經(jīng)常有朋友問我這個問題，所以單獨拿出來說一說

先說結(jié)論

2K 分辨率，主流單機大作采用中高畫質(zhì)，4060TI 級別的顯卡完全沒問題
4K分辨率，主流單機大作采用高畫質(zhì)，4070TI / SUPER 級別的顯卡都可以應(yīng)對，游戲性能大概比 4070Ti 強 11% 追求高刷就開 DLSS3 性能檔，或者關(guān)閉幾個影響畫質(zhì)的選項
整個 SUPER 系列，我最推薦的就是 4080 SUPER
4070 SUPER 性能上提升最大，但顯存拉了后腿，適合預算有限的朋友
4070TI SUPER 要好很多，顯存來到了 16GB，玩游戲不容易爆顯存；支持雙視頻編碼器協(xié)同工作，我之前做過與 30900TI 的達芬奇輸出測試，速度會提升一倍以上，但是性價比最低
4080 SUPER 的優(yōu)勢在于滿血 AD103 - 400 核心，等效頻率 22.4GHz ，甚至超過了 RTX 4090 的 21GHz。算力方面提供了高達 52 TFLOPS、121 RT TFLOPS 以及 836 AI TOPS，可以更好的滿足游戲生產(chǎn)力用戶。最重要的是 618 期間價格已經(jīng)干到 8K 以內(nèi)，相比 4070 SUPER 價差不大但性能提升巨大。

再來談?wù)勑吞栠x購，就我看來，一線品牌性能釋放都差不多，SUPER 系列在功耗上也和 40 系保持一致，像 4080 SUPER 滿載也不過 320W，散熱壓力并不大，所以我認為選購時性價比是最應(yīng)該考慮的因素，其次下來則是品牌口碑、售后、散熱以及設(shè)計等因素。

下圖是網(wǎng)上搜集的各品牌 4080 SUPER 用料表（并未涵蓋所有）

本次測試的主角是索泰 RTX 4080 SUPER 16GB TRINITY OC 月白，推薦理由里很簡單。

首先是品牌靠譜，畢竟后面站著的是 NVIDIA 核心伙伴栢能，性能、品質(zhì)口碑都是一流，但又比御三家的價格更加親民。

其次月白這個系列我前前后后入手過 4060TI、4070TI，總結(jié)就是不算堆料但性能釋放相當出色，溫度控制的也很好。正如我前面所說，40 系顯卡尤其是高端系列都屬于規(guī)格溢出，反而是月白這種供電散熱不存在短板，同時又保持了親民的價格定位。

此外，推薦它的原因是顏值高。眾所周知，純白系顯卡本來可選余地就小，而能把設(shè)計感做的到位更是鳳毛麟角，索泰月白系列算是少有的高顏值白色系顯卡，對于搭建純白主機很有優(yōu)勢。

對了，索泰月白系列還有個優(yōu)點 ~ 身材纖細、長度適中，對小尺寸機箱兼容性較好。

純白圓潤，不夸張但實用的機體造型

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白，和天啟系列同為它家次旗艦（再往上就是 AMP 和 PGF ）。相比公版卡來說基頻相同，但核心頻率提升到了 2565MHz。由于沒有進行過于激進的官方超頻，因此，這塊卡可能是目前市場上價格最實惠的白色 RTX 4080 SUPER 顯卡之一。

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白基于三風扇設(shè)計，純白配色，轉(zhuǎn)角采用曲線過渡顯得較為圓潤。三只直徑 90mm 的“仿生盾鱗2.0”風扇，不僅加大了扇葉面積，而且利用鱗狀仿生條紋和特殊定制的曲率，優(yōu)化風扇的進氣風道，起到增加風壓、減小亂流的效果。

風扇支持支持智能啟停技術(shù)，可以在高、低溫度和負載之間讓風扇智能啟停，減小噪音，增加顯卡壽命。同時，用戶還可以利用索泰的 FireStorm 軟件來自定義風扇的轉(zhuǎn)速和性能曲線，以適應(yīng)不同的使用場景和個人喜好。

顯卡頂部設(shè)計了一個醒目的鏤空品牌標識，內(nèi)部鋪設(shè)了名為“虹橋幻影”的大型 RGB 燈帶，高達 1670 萬種顏色的自定義設(shè)置，可以通過 FireStorm 軟件進行個性化調(diào)整，以滿足不同場景下的工作模式需求。

顯卡內(nèi)部是索泰自家的 IceStorm3.0 散熱系統(tǒng)，由仿生盾鱗 2.0 三風扇、7 條 6mm 鍍鎳熱管以及加厚型散熱模組構(gòu)成，配合 11 + 2 相的供電設(shè)計，可以很輕松壓制顯卡產(chǎn)生的熱量。

顯卡背部是從一體成型合金背板，金屬背板不僅增強了顯卡的結(jié)構(gòu)穩(wěn)定性和電氣性能，特殊的尾部的通風孔設(shè)計有助于提高散熱器的空氣流動，從而提升散熱效率。

30.7 * 59 * 12cm 的尺寸、2.5 卡槽占用，在同規(guī)格顯卡陣營堪稱纖細，可以更好的適配小尺寸機箱。

4K 毫無壓力，開啟光追更輕松

本次測試平臺如下，處理器是 Intel Core™ i7 14700KF，搭配 Z790 小雕，足以保證不拉后腿。

游戲加加性能跑分，總體得分 190056、工作站性能 M-374557。CPU單核性能評分 39492分、CPU多核性能評分 583500分、GPU性能評分 148380分、得到了“S”級評價。

首先是 3D Mark Fire Strike，這是一項適用于高性能游戲電腦和超頻系統(tǒng)的 DirectX 11 基準測試，其統(tǒng) 一的打分機制對于不同設(shè)備的性能比較很有參考。實測下來，索泰 RTX 4080 SUPER 16GB TRINITY OC 月白的總得分為 51976 分，其中顯卡分數(shù) 64417分，預估在【荒野大鏢客2】游戲最高畫質(zhì)下可跑到 130+FPS 以上的好成績。

而 4K 版本的 Fire Strike Ultra，顯卡得到了17959 分，，其中顯卡分數(shù) 17469分，預估在【荒野大鏢客2】游戲最高畫質(zhì)下可跑到 105+FPS 以上的好成績。此時 GPU 最高溫度 45.04°C，GPU 負載 38.99%，GPU 時鐘頻率 2760MHz.

Time Spy 則是針對 DirectX 12 游戲設(shè)計的基準測試，支持原生 API 功能，比如如異步計算，多顯卡適配器技術(shù)和多線程。實測下來，索泰 RTX 4080 SUPER 16GB TRINITY OC 得分為 27470 分，其中顯卡分數(shù)為 28339 分，預估【戰(zhàn)地5】最高畫質(zhì)下可以跑到 200+FPS 。

Time Spy Extreme 作為進階版，看重的是 4K 分辨率下 DirectX 12 的游戲性能測試。實測下來顯卡得分為 6297 分，其中顯卡分數(shù)為 6068分，預估【戰(zhàn)地5】最高畫質(zhì)下可以跑到 135+FPS ，

針對實時光線追蹤的【Port Royal】總分 18110分，大力水手關(guān)閉 40.21FPS，開啟能跑到 134.79FPS，提升極為明顯。

賽博朋克作為少有的同時支持 INA 三家超分辨率技術(shù)，以及光追與 DLSS 3 技術(shù)的單機大作，自然不能錯過測試。在默認的 4K 分辨率 / 超級光追模式下平均幀率能做到 113.90FPS，最小幀率都能跑到 80FPS 以上。

設(shè)置不變，僅將“大力水手”切換到性能檔，平均幀率來到 148.81FPS，最小幀率也來到了 128FPS 以上。

極限競速：地平線 5 在 4K 分辨率，預設(shè)極端模式下，平均幀率 122FPS，最低幀率 113FPS

原設(shè)置不變，開啟NVIDIA DLSS AI 超分辨率（超高性能）、DLAA關(guān)閉、開啟幀生成技術(shù)，平均幀率 166幀，最低幀率，主打流暢二字。

育碧的 3A 大作刺客信條.幻境，這游戲的優(yōu)化著實喜人，但最高只支持 nvdida DLSS2 技術(shù).雖然有國外網(wǎng)友開發(fā)了 DLSS 3 幀生成 MOD，但使用之后游戲內(nèi)置的 benchmark 就無法運行。這里我測試的 4K 分辨率最高畫質(zhì)，游戲平均幀率達到了 101FPS，最低 1% 也有 83FPS。

溫度測試環(huán)節(jié)，利用 Furmark 對索泰 RTX 4080 SUPER 月白進行烤雞，在負載拉滿的情況下，顯卡最高功耗跑到了 320W 左右，完美對應(yīng)標稱數(shù)據(jù)。此時 GPU 表面溫度 76°C 左右、熱點溫度 90°C 左右，考慮到顯卡本身并沒有做夸張的散熱設(shè)計，這個溫度控制應(yīng)該算是相當完美。

AI 生產(chǎn)力才是王道

40 系顯卡價格偏高，最重要的原因它不是純游戲卡，對于跑 AI 的朋友來說更是妥妥的生產(chǎn)力需求。

為什么說 N 卡最適合跑 AIGC？

確切來講，AIGC 技術(shù)并不局限于 NVIDIA顯卡，但目前大多數(shù)加速計算環(huán)境是基于 CUDA 構(gòu)建的，而 CUDA 是 NVIDIA 開發(fā)的技術(shù)，NVIDIA的 GPU 擁有卓越的并行處理能力和針對 AI 工作負載優(yōu)化的架構(gòu)。例如，NVIDIA 的 DLSS 技術(shù)，它通過 AI 生成額外的幀來提升游戲和應(yīng)用程序的渲染性能，這就是 AIGC 技術(shù)的一個應(yīng)用實例。此外，市面常見的 AIGC 模型都是用 N 卡跑出來的，所以硬件兼容度也是最高的。

我之前出過一篇利用 Stable Diffusion 跑本地 AI 繪圖的文章，相比流行的 Midjourney（Mid）來說，Stable Diffusion 可以進行本地部署，部署完畢可以免費無限次使用，沒有使用成本，在圖像質(zhì)量和用戶可控性都更高。但也因為需要本地跑圖，所以對硬件有一定的要求，尤其是 GPU，推薦至少 4GB 顯存的顯卡，8GB 及以上顯存可以獲得更好的性能。

本次 AI 繪圖測試同樣基于 Stable Diffusion 本地模型，評測之前先和大家分享下索泰 RTX 4080 SUPER 的優(yōu)勢

眾所周知，在 AI 繪圖領(lǐng)域，核心數(shù)量主要決定計算的快慢，顯存大小則決定分辨率、模型以及批次數(shù)量的上限。

對于 SD 來說，12GB 顯存已經(jīng)可以滿足日常圖像繪制的需求，不過如果你喜歡嘗試不同的插件、擴展、乃至相互組合生圖

那么 16GB 可以更好的保證不出現(xiàn)爆顯存的風險。

更別提現(xiàn)在流行的視頻生成項目，這可比生成靜態(tài)圖片所需顯存要求可大了一截

所以，選擇大顯存不僅是速度更快，而且在其他項目的嘗試也能更加的自由

本次 AI 測試基于秋葉aaaki 大佬的整合包和 SDXL 大模型，首先做哈準備工作

顯存優(yōu)化這里，如果是＞12GB 顯存就選無優(yōu)化，

然后關(guān)閉下方的 VAE 半精度優(yōu)化

進入 Stable Diffusion ，先來到系統(tǒng)信息 - 基準測試跑個分

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白在默認模型下跑出了 16.49it/s、24.56it/s、28.14it/s

這是什么水準呢，從跑分天梯圖來看就是妥妥的第二名（排名僅供參考，數(shù)據(jù)量目前很少）

換成 SDXL 大模型 + SDXL VAE 的組合，分數(shù)就會驟降到 6.41it/s、11.73it/s、19.53it/s

要知道，這還是優(yōu)化相對算好的高質(zhì)量模型，想想要是用優(yōu)化普通的模型 + LORA + 額外擴展的組合，渲染量一大不崩才怪。

這應(yīng)該就是高端卡的優(yōu)勢所在 ~ 生產(chǎn)力！

使用 SDXL 1.0 模型、搭配 sxdl/VAE 模型，采樣方法: DPM++2MSDE、迭代步數(shù):60；圖片寬度：1024；圖片長度：1024；總批次數(shù)：1；單批數(shù)量：8。

耗時 1 分 56秒，顯存最高達到了 13.3GB，基本上 4070TI SUPER 以下陣亡了。

成品圖

不僅如此，Nvidia 還專門推出了用于加速 AI 矩陣運算的 Tensor Cores ，這是一個針對深度學習推理的高性能 GPU 加速器，它可以自動對神經(jīng)網(wǎng)絡(luò)模型進行優(yōu)化，提高運行速度并降低內(nèi)存占用。

在 Stable Diffusion 中使用相同的提示詞，一次生成 20 張圖片，對比 Tensor Cores 加速前后耗時

Tensor Cores 加速前后，生成時間從 2 分 36 秒縮短到了 1 分 43 秒，加速實際效果達到了 51%。

這還只是用的基礎(chǔ)模型庫，關(guān)鍵字等各項參數(shù)也不復雜，換成高分辨率輸出和多模型組合的話，這個差距只會越來越大。

而這才是老黃卡不愁賣的根本原因，生產(chǎn)力永遠是核心需求。

總結(jié)

增量減價，堪稱良心，這是我對 Nvdida RTX 4080 SUPER 顯卡的看法。游戲性能相較于 RTX 4080 有 2%~10% 提升，可以很輕松滿足 3A 大作對畫質(zhì)和幀率的需求，滿血版 AD103 核心和 16GB 的超大顯存，對于需要進行視頻編輯、3D建模等高負載任務(wù)的生產(chǎn)力用戶來說，簡直就是雪中送炭。大顯存意味著你可以同時打開更多的應(yīng)用，處理更大的文件，而不會感受到絲毫的卡頓。

索泰 RTX 4080 SUPER 16GB TRINITY OC 月白則是家用游戲顯卡的典范。小巧纖細的機身，可以輕松適配各種小型機箱，讓你的桌面空間不再受限。而且，它并沒有因為體積小而犧牲性能，對比某些品牌用夸張的造型、過分的堆料來強行提高價格，索泰這樣的做法無疑才是真正為玩家著想。