4K光追新王者! 索泰 RTX4080 SUPER顯卡全面測評

暑期大促相信對于眾多 DIY 玩家來說是個攢硬件的好日子,作為裝機大頭的顯卡應該有不少朋友都在關注。而作為老黃家的次旗艦 nvdida RTX 4080 SUPER ,想來也有不少小伙伴既想入手,又糾結于性能價格是否對等。
有鑒于此,我也利用手頭的索泰 RTX 4080 SUPER 顯卡做了幾項測試,順便分享下個人對 RTX 4080 SUPER 定位看法。
快問快答NVIDIA Ada Lovelace 架構優(yōu)勢何在
RTX 40 系列顯卡這次采用了全新的 NVIDIA Ada Lovelace 架構,以早期計算先驅(qū)Ada Lovelace 的名字命名。工藝采用定制 TSMC 4N NVIDIA工藝,核心面積從上一代的 628.4mm² 縮小到 608.5mm²,晶體管數(shù)量從上一代的 283 億個提升至 763 億個。最恐怖的是核心面積一直在縮小的同時晶體管數(shù)目保持夸張的增長速度,同時功耗也持平甚至更低于上代。
- 全景光線追蹤:Ada Lovelace 架構引入了新的全景光線追蹤技術,包括新的 RT 核心、更多的著色器以及新的 Tensor 核心,這些技術的結合使得光線追蹤的性能得到顯著提升。
- 光流加速器:架構中增加了光流加速器的運算性能,從Ampere架構的 126 TFLOPS增加到 300 TFLOPS,這使得DLSS 3能夠預測場景中的運動,提高幀率同時保持圖像質(zhì)量。
- DLSS 3技術:DLSS 3 包括幀生成技術、DLSS 2 超分辨率技術和 NVIDIA Reflex 技術,為游戲體驗的流暢度、延遲和畫質(zhì)提供全方位的提升。
- 編碼器升級:NVIDIA 編碼器 (NVENC) 升級到了第八代,開始支持 A V1 編碼,其效率比 H.264 高 40%,減少了數(shù)據(jù)量需求,同時提高畫面質(zhì)量。
- 第四代Tensor Core:Ada架構搭載了新的第四代Tensor Core,支持FP8數(shù)據(jù)類型,增加了INT4支持,同時去掉了 FP64 的支持,提供更高的AI計算性能。
- 第三代RT Core:Ada 架構的第三代 RT Core 將光線與三角形求交性能提高了一倍,同時 RT-TFLOP 峰值性能也提高了一倍,引入了 Opacity Micromap (OMM) 引擎和 Displaced Micro-Mesh (DMM) 引擎,大幅提升了光線追蹤的速度和效率。
- 著色器執(zhí)行重排序(SER):SER 技術能夠動態(tài)調(diào)整工作負載的順序,最高可將光線追蹤操作的著色器性能提升2倍,或?qū)⒂螒驇侍嵘?25%。
- 架構規(guī)模增大:Ada Lovelace 的GPC數(shù)量從Ampere的最大7個增加到12個,二級緩存規(guī)模是上一代的 16倍,顯著提升了性能。
- 顯存帶寬和PCIe支持:支持 1TB/s 的 GDDR6X 顯存帶寬和 PCIe GEN4 ,提供更高的數(shù)據(jù)傳輸速率。
- NVIDIA RTX 6000 GPU:基于 Ada Lovelace 架構的 RTX 6000 GPU 為NVIDIA Omniverse™ Enterprise 平臺提供了卓越的圖形、AI 和計算性能,促進了協(xié)作、內(nèi)容創(chuàng)作和仿真的發(fā)展。
RTX 4080 SUPER到底升級了啥?
不同于上代 4080 殘血 AD103 - 300 核心,4080S 是真滿血版本 AD103 - 400 ,擁有完整的 80 組 SM 單元、流處理器多了 512 顆。此外顯存位寬不變的情況下,顯存頻率提升到了 23Gbps(22.4Gbps),帶寬上升到了 736GB/s(717GB/s)。
從數(shù)據(jù)方面來看,RTX 4080 SUPER 領先 4080 大概 5% 左右,不過反映到實際游戲場景,提升大概在 2% ~ 3% 左右。不過這都不是重點,重點是RTX 4080 SUPER的發(fā)售價比RTX 4080 還低了約 16.7%,增量降價沒跑了
哪些用戶是否需要 RTX 4080 SUPER
經(jīng)常有朋友問我這個問題,所以單獨拿出來說 一 說
先說結論
- 2K 分辨率,主流單機大作采用中高畫質(zhì),4060TI 級別的顯卡完全沒問題
- 4K分辨率,主流單機大作采用高畫質(zhì),4070TI / SUPER 級別的顯卡都可以應對,游戲性能大概比 4070Ti 強 11% 追求高刷就開 DLSS3 性能檔,或者關閉幾個影響畫質(zhì)的選項
- 整個 SUPER 系列,我最推薦的就是 4080 SUPER
- 4070 SUPER 性能上提升最大,但顯存拉了后腿,適合預算有限的朋友
- 4070TI SUPER 要好很多,顯存來到了 16GB,玩游戲不容易爆顯存;支持雙視頻編碼器協(xié)同工作,我之前做過與 30900TI 的達芬奇輸出測試,速度會提升一倍以上,但是性價比最低
- 4080 SUPER 的優(yōu)勢在于滿血 AD103 - 400 核心,等效頻率 22.4GHz ,甚至超過了 RTX 4090 的 21GHz。算力方面提供了高達 52 TFLOPS、121 RT TFLOPS 以及 836 AI TOPS,可以更好的滿足游戲生產(chǎn)力用戶。最重要的是 618 期間價格已經(jīng)干到 8K 以內(nèi),相比 4070 SUPER 價差不大但性能提升巨大。
再來談談型號選購,就我看來,一 線品牌性能釋放都差不多,SUPER 系列在功耗上也和 40 系保持 一 致,像 4080 SUPER 滿載也不過 320W,散熱壓力并不大,所以我認為選購時性價比是最應該考慮的因素,其次下來則是品牌口碑、售后、散熱以及設計等因素。
下圖是網(wǎng)上搜集的各品牌 4080 SUPER 用料表(并未涵蓋所有)
本次測試的主角是索泰 RTX 4080 SUPER 16GB TRINITY OC 月白,推薦理由里很簡單。
首先是品牌靠譜,畢竟后面站著的是 NVIDIA 核心伙伴栢能,性能、品質(zhì)口碑都是一流,但又比御三家的價格更加親民。
其次月白這個系列我前前后后入手過 4060TI、4070TI,總結就是不算堆料但性能釋放相當出色,溫度控制的也很好。正如我前面所說,40 系顯卡尤其是高端系列都屬于規(guī)格溢出,反而是月白這種供電散熱不存在短板,同時又保持了親民的價格定位。
此外,推薦它的原因是顏值高。眾所周知,純白系顯卡本來可選余地就小,而能把設計感做的到位更是鳳毛麟角,索泰月白系列算是少有的高顏值白色系顯卡,對于搭建純白主機很有優(yōu)勢。
對了,索泰月白系列還有個優(yōu)點 ~ 身材纖細、長度適中,對小尺寸機箱兼容性較好。
純白圓潤,不夸張但實用的機體造型
索泰 RTX 4080 SUPER 16GB TRINITY OC 月白,和天啟系列同為它家次旗艦(再往上就是 AMP 和 PGF )。相比公版卡來說基頻相同,但核心頻率提升到了 2565MHz。由于沒有進行過于激進的官方超頻,因此,這塊卡可能是目前市場上價格最實惠的白色 RTX 4080 SUPER 顯卡之 一。
索泰 RTX 4080 SUPER 16GB TRINITY OC 月白基于三風扇設計,純白配色,轉角采用曲線過渡顯得較為圓潤。三 只直徑 90mm 的“仿生盾鱗2.0”風扇,不僅加大了扇葉面積,而且利用鱗狀仿生條紋和特殊定制的曲率,優(yōu)化風扇的進氣風道,起到增加風壓、減小亂流的效果。
風扇支持支持智能啟停技術,可以在高、低溫度和負載之間讓風扇智能啟停,減小噪音,增加顯卡壽命。同時,用戶還可以利用索泰的 FireStorm 軟件來自定義風扇的轉速和性能曲線,以適應不同的使用場景和個人喜好。
顯卡頂部設計了一個醒目的鏤空品牌標識,內(nèi)部鋪設了名為“虹橋幻影”的大型 RGB 燈帶,高達 1670 萬種顏色的自定義設置,可以通過 FireStorm 軟件進行個性化調(diào)整,以滿足不同場景下的工作模式需求。
顯卡內(nèi)部是索泰自家的 IceStorm3.0 散熱系統(tǒng),由仿生盾鱗 2.0 三風扇、7 條 6mm 鍍鎳熱管以及加厚型散熱模組構成,配合 11 + 2 相的供電設計,可以很輕松壓制顯卡產(chǎn)生的熱量。
顯卡背部是從 一 體成型合金背板,金屬背板不僅增強了顯卡的結構穩(wěn)定性和電氣性能,特殊的尾部的通風孔設計有助于提高散熱器的空氣流動,從而提升散熱效率。
30.7 * 59 * 12cm 的尺寸、2.5 卡槽占用,在同規(guī)格顯卡陣營堪稱纖細,可以更好的適配小尺寸機箱。
4K 毫無壓力,開啟光追更輕松
本次測試平臺如下,處理器是 Intel Core™ i7 14700KF,搭配 Z790 小雕,足以保證不拉后腿。
游戲加加性能跑分,總體得分 190056、工作站性能 M-374557。CPU單核性能評分 39492分、CPU多核性能評分 583500分、GPU性能評分 148380分、 得到了“S”級評價。
首先是 3D Mark Fire Strike,這是一項適用于高性能游戲電腦和超頻系統(tǒng)的 DirectX 11 基準測試,其統(tǒng) 一 的打分機制對于不同設備的性能比較很有參考。實測下來,索泰 RTX 4080 SUPER 16GB TRINITY OC 月白的總得分為 51976 分,其中顯卡分數(shù) 64417分,預估在【荒野大鏢客2】游戲最高畫質(zhì)下可跑到 130+FPS 以上的好成績。
而 4K 版本的 Fire Strike Ultra,顯卡得到了17959 分,,其中顯卡分數(shù) 17469分,預估在【荒野大鏢客2】游戲最高畫質(zhì)下可跑到 105+FPS 以上的好成績。此時 GPU 最高溫度 45.04°C,GPU 負載 38.99%,GPU 時鐘頻率 2760MHz.
Time Spy 則是針對 DirectX 12 游戲設計的基準測試,支持原生 API 功能,比如如異步計算,多顯卡適配器技術和多線程。實測下來,索泰 RTX 4080 SUPER 16GB TRINITY OC 得分為 27470 分,其中顯卡分數(shù)為 28339 分,預估【戰(zhàn)地5】最高畫質(zhì)下可以跑到 200+FPS 。
Time Spy Extreme 作為進階版,看重的是 4K 分辨率下 DirectX 12 的游戲性能測試。實測下來顯卡得分為 6297 分,其中顯卡分數(shù)為 6068分,預估【戰(zhàn)地5】最高畫質(zhì)下可以跑到 135+FPS ,
針對實時光線追蹤的【Port Royal】總分 18110分,大力水手關閉 40.21FPS,開啟能跑到 134.79FPS,提升極為明顯。
賽博朋克作為少有的同時支持 INA 三家超分辨率技術,以及光追與 DLSS 3 技術的單機大作,自然不能錯過測試。在默認的 4K 分辨率 / 超級光追模式下 平均幀率 能做到 113.90FPS,最小幀率都能跑到 80FPS 以上。
設置不變,僅將“大力水手”切換到性能檔,平均幀率來到 148.81FPS,最小幀率也來到了 128FPS 以上。
極限競速:地平線 5 在 4K 分辨率,預設極端模式下,平均幀率 122FPS,最低幀率 113FPS
原設置不變,開啟NVIDIA DLSS AI 超分辨率(超高性能)、DLAA關閉、開啟幀生成技術,平均幀率 166幀,最低幀率,主打流暢二字。
育碧的 3A 大作刺客信條.幻境,這游戲的優(yōu)化著實喜人,但最高只支持 nvdida DLSS2 技術.雖然有國外網(wǎng)友開發(fā)了 DLSS 3 幀生成 MOD,但使用之后游戲內(nèi)置的 benchmark 就無法運行。這里我測試的 4K 分辨率最高畫質(zhì),游戲平均幀率達到了 101FPS,最低 1% 也有 83FPS。
溫度測試環(huán)節(jié),利用 Furmark 對 索泰 RTX 4080 SUPER 月白進行烤雞,在負載拉滿的情況下,顯卡最高功耗跑到了 320W 左右,完美對應標稱數(shù)據(jù)。此時 GPU 表面溫度 76°C 左右、熱點溫度 90°C 左右,考慮到顯卡本身并沒有做夸張的散熱設計,這個溫度控制應該算是相當完美。
AI 生產(chǎn)力才是王道
40 系顯卡價格偏高,最重要的原因它不是純游戲卡,對于跑 AI 的朋友來說更是妥妥的生產(chǎn)力需求。
為什么說 N 卡最適合跑 AIGC?
確切來講,AIGC 技術并不局限于 NVIDIA顯卡 ,但目前大多數(shù)加速計算環(huán)境是基于 CUDA 構建的,而 CUDA 是 NVIDIA 開發(fā)的技術,NVIDIA的 GPU 擁有卓越的并行處理能力和針對 AI 工作負載優(yōu)化的架構。例如,NVIDIA 的 DLSS 技術,它通過 AI 生成額外的幀來提升游戲和應用程序的渲染性能,這就是 AIGC 技術的 一 個應用實例。此外,市面常見的 AIGC 模型都是用 N 卡跑出來的,所以硬件兼容度也是最高的。
我之前出過一篇利用 Stable Diffusion 跑本地 AI 繪圖的文章,相比流行的 Midjourney(Mid)來說,Stable Diffusion 可以進行本地部署,部署完畢可以免費無限次使用,沒有使用成本,在圖像質(zhì)量和用戶可控性都更高。但也因為需要本地跑圖,所以對硬件有一定的要求,尤其是 GPU,推薦至少 4GB 顯存的顯卡,8GB 及以上顯存可以獲得更好的性能。
本次 AI 繪圖測試同樣基于 Stable Diffusion 本地模型,評測之前先和大家分享下索泰 RTX 4080 SUPER 的優(yōu)勢
眾所周知,在 AI 繪圖領域,核心數(shù)量主要決定計算的快慢,顯存大小則決定分辨率、模型以及批次數(shù)量的上限。
對于 SD 來說,12GB 顯存已經(jīng)可以滿足日常圖像繪制的需求,不過如果你喜歡嘗試不同的插件、擴展、乃至相互組合生圖
那么 16GB 可以更好的保證不出現(xiàn)爆顯存的風險。
更別提現(xiàn)在流行的視頻生成項目,這可比生成靜態(tài)圖片所需顯存要求可大了一截
所以,選擇大顯存不僅是速度更快,而且在其他項目的嘗試也能更加的自由
本次 AI 測試基于秋葉aaaki 大佬的整合包和 SDXL 大模型,首先做哈準備工作
顯存優(yōu)化這里,如果是 >12GB 顯存就選無優(yōu)化,
然后關閉下方的 VAE 半精度優(yōu)化
進入 Stable Diffusion ,先來到系統(tǒng)信息 - 基準測試跑個分
索泰 RTX 4080 SUPER 16GB TRINITY OC 月白在默認模型下跑出了 16.49it/s、24.56it/s、28.14it/s
這是什么水準呢,從跑分天梯圖來看就是妥妥的第二名(排名僅供參考,數(shù)據(jù)量目前很少)
換成 SDXL 大模型 + SDXL VAE 的組合,分數(shù)就會驟降到 6.41it/s、11.73it/s、19.53it/s
要知道,這還是優(yōu)化相對算好的高質(zhì)量模型,想想要是用優(yōu)化普通的模型 + LORA + 額外擴展的組合,渲染量一大不崩才怪。
這應該就是高端卡的優(yōu)勢所在 ~ 生產(chǎn)力!
使用 SDXL 1.0 模型、搭配 sxdl/VAE 模型,采樣方法: DPM++2MSDE、迭代步數(shù):60;圖片寬度:1024;圖片長度:1024;總批次數(shù):1;單批數(shù)量:8。
耗時 1 分 56秒,顯存最高達到了 13.3GB,基本上 4070TI SUPER 以下陣亡了。
成品圖
不僅如此,Nvidia 還專門推出了用于加速 AI 矩陣運算 的 Tensor Cores ,這是一個針對深度學習推理的高性能 GPU 加速器,它可以自動對神經(jīng)網(wǎng)絡模型進行優(yōu)化,提高運行速度并降低內(nèi)存占用。
在 Stable Diffusion 中使用相同的提示詞,一次生成 20 張圖片,對比 Tensor Cores 加速前后耗時
Tensor Cores 加速前后,生成時間從 2 分 36 秒縮短到了 1 分 43 秒,加速實際效果達到了 51%。
這還只是用的基礎模型庫,關鍵字等各項參數(shù)也不復雜,換成高分辨率輸出和多模型組合的話,這個差距只會越來越大。
而這才是老黃卡不愁賣的根本原因,生產(chǎn)力永遠是核心需求。
總結
增量減價,堪稱良心,這是我對 Nvdida RTX 4080 SUPER 顯卡的看法。游戲性能相較于 RTX 4080 有 2%~10% 提升,可以很輕松滿足 3A 大作對畫質(zhì)和幀率的需求,滿血版 AD103 核心和 16GB 的超大顯存,對于需要進行視頻編輯、3D建模等高負載任務的生產(chǎn)力用戶來說,簡直就是雪中送炭。大顯存意味著你可以同時打開更多的應用,處理更大的文件,而不會感受到絲毫的卡頓。
索泰 RTX 4080 SUPER 16GB TRINITY OC 月白則是家用游戲顯卡的典范。小巧纖細的機身,可以輕松適配各種小型機箱,讓你的桌面空間不再受限。而且,它并沒有因為體積小而犧牲性能,對比某些品牌用夸張的造型、過分的堆料來強行提高價格,索泰這樣的做法無疑才是真正為玩家著想。
相關文章
rtx4070super顯卡怎么樣 rtx4070super顯卡性能測評
RTX 4070 Super顯卡在當前的顯卡市場中,確實是一款性能排名較為靠前的型號,在NVIDIA的顯卡陣營中,它的性能表現(xiàn)強勁,僅有少數(shù)幾款顯卡能超越其性能,RTX 4070 Super在NVID2024-07-25瀚鎧rx770xt性能相當于rtx多少 瀚鎧rx770xt顯卡詳細介紹
瀚鎧RX 7700 XT顯卡以其卓越的性能表現(xiàn),與NVIDIA的RTX 3080顯卡形成了強有力的競爭態(tài)勢,在性能方面,差距細微至僅約4%,這樣的性能對標不僅體現(xiàn)在復雜圖形處理、高分辨率2024-07-23誰才是甜品級顯卡? RTX 4060對比RX 6750 GRE 10G裝機測評
當下兩款甜品級顯卡4060和RX 6750 GRE 10G很受歡迎,系那個藥看看這兩款顯卡哪個更適合購買,詳細請看下文介紹2024-07-22- RTX 4080顯卡無疑是當前顯卡市場上的一顆璀璨明星,其卓越的性能在眾多顯卡中脫穎而出,僅有少數(shù)幾款顯卡能與之比肩,在N卡的陣營中,RTX 4080以其強大的處理能力獨占鰲頭,2024-07-22
- NVIDIA推出的4090D顯卡,作為品牌旗下的高端力作,緊隨旗艦級4090顯卡之后,占據(jù)了性能排行的次席位置,鑒于英偉達在全球市場的獨特銷售策略,使得高性能的4090顯卡在國內(nèi)市2024-07-18
英偉達RTX 2060對比RTX 4060值得升級嗎? 顯卡游戲性能差距對比測評
RTX 4060顯卡比RTX2060的顯卡性能提升大嗎?值得升級嗎,今天我們先簡單看一下兩者的參數(shù)對比,詳細請看下文測評2024-07-17RTX 4080 SUPER和RTX 3090 Ti怎么選? 英偉達顯卡游戲測評
GeForce RTX 4080 SUPER的性能到底比GeForce RTX 3090 Ti強多少?這仍然是一個值得關注、研究的問題,本文將通過游戲測試揭曉答案2024-07-16十年顯卡到底提升了多少? GTX 760對比RTX 4060六款游戲?qū)崪y出爐
本文將對比GeForce GTX 760和GeForce RTX 4060的游戲性能,以評估這十年間,從前者升級至后者可以獲得多少倍的性能提升2024-07-082024年GeForce RTX 3060顯卡還值得入手嗎?七款4K游戲?qū)崪y出爐
新一代的GeForce RTX 4060的價格比GeForce RTX 3060貴不了多少的情況下,GeForce RTX 3060已經(jīng)不值得入手了,如果你還想入手,請看看下面的7款游戲?qū)崪y2024-07-08RTX 4070 SUPER對比RX 6900 XT誰性能更強? 英偉達顯卡游戲?qū)崪y出爐
GeForce RTX 4070 SUPER和Radeon RX 6900 XT兩款顯卡哪款更值得購買?下面我們將通過游戲性能測試對比揭曉答案2024-07-08