NVIDIA RTX 3080 Ti顯卡怎么樣 NVIDIA RTX 3080 Ti顯卡全面評測

中關(guān)村在線 發(fā)布時間：2021-06-03 11:11:14 作者：曲楠

之前NVIDIA出過一款限制挖礦的顯卡，前不久，NVIDIA又再次宣布，后續(xù)推出的RTX30系顯卡也會限制挖礦，那么NVIDIA RTX 3080 Ti顯卡這款新出的顯卡怎么樣呢？一起看看吧

受到芯片短缺以及礦潮影響，近一年的DIY市場尤其混亂，其中又以顯卡最為畸形，原本5499元首發(fā)的GeForce RTX 3080已經(jīng)被炒到了15000左右，價格翻了3倍。而不久前NVIDIA在官方博客中再次宣布，后續(xù)推出的RTX 30系顯卡，除了RTX 3090外將全部從芯片層面限制挖礦，包括之前已經(jīng)推出的RTX 3060/3060 Ti/3070/3080，以及后續(xù)將要推出的顯卡，今天大家期待已久的GeForce RTX 3080 Ti終于來了。

此次我們根據(jù)9個方面來全面分析一下NVIDIA的顯卡能力，趕緊看看吧

GeForce RTX 3080 Ti首測 12G顯存版的3090

GeForce RTX 3080 Ti

RTX 3080 Ti首測

GeForce RTX 3080 Ti細節(jié)特寫

關(guān)于此次發(fā)布的GeForce RTX 3080 Ti顯卡，想必大家主要關(guān)心的有這幾點，首先是價格和性能，其次是供貨量，能不能買到。由于此次的顯卡全部限制了哈希率，也就是以太坊挖礦，所以會減少礦工的涌入。在6月1日臺北電腦展發(fā)布會上，已經(jīng)公布了售價為8999元，但國內(nèi)目前買不到，所以只能期待一波非公版的顯卡了，不同廠商會根據(jù)公版定價酌情加價，但首發(fā)價格一定是比較低的，大家不妨去搶一波。

01 GA102核心的第三張卡

下面我們先來看看在架構(gòu)上有哪些改動，官方白皮書上對比的對象為GeForce RTX 2080 Ti，相較于上一代的NVIDIA Turing架構(gòu)，NVIDIA Ampere架構(gòu)下的GeForce RTX 3080 Ti每個時鐘執(zhí)行2次著色器運算，而Turing為1次，RTX 3080 Ti的著色器性能達到34 TFLOPS單精度性能，而Turing為14 TFLOPS。

RTX 3080 Ti首測

第一代NVIDIA RTX架構(gòu) Turing下的RTX 2080 Ti

RTX 3080 Ti首測

第二代NVIDIA RTX架構(gòu) Ampere下的RTX 3080 Ti

NVIDIA Ampere架構(gòu)翻倍了光線與三角形的相交吞吐量，RT Core達到67 RT TFLOPS，而Turing為43 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升，還增加了對游戲中運動模糊部分場景的光線追蹤計算加速。

第三代Tensor Core可自動識別并消除不太重要的DNN權(quán)重，處理稀疏網(wǎng)絡(luò)的速率是Turing的兩倍，算力高達273 Tensor TFLOPS，而Turing為114 Tensor TFLOPS。

GeForce RTX 3080 Ti仍然采用了GA102核心，與GeForce RTX 3080/3090相同，下面我們來看一看RTX 3080 Ti在GA102中做了哪些改動。

RTX 3080 Ti首測

完整的GA102核心

完整的GA102 GPU包含7個GPC（圖形處理集群）42個TPC（紋理處理集群）以及84個SM（流處理器）組成，而RTX 3080 Ti的CUDA數(shù)量是10240個，所以可以推斷RTX 3080 Ti屏蔽了兩組TPC，所以只有80個SM單元，而完整GA102核心的CUDA數(shù)量應(yīng)該是10752個。

RTX 3080 Ti首測

為了查詢方便，筆者將這幾款顯卡的核心參數(shù)列出，可以看到RTX 3080 Ti與RTX 3090的核心參數(shù)非常接近。相差的兩個SM單元，也就是1組TPC，256個CUDA，其實在實際應(yīng)用中來講差距并不是很大，最重要的是RTX 3090相比RTX 3080 Ti多了12GB的顯存；而相比RTX 3080來說提升就非常大了。

可能有用戶會問，既然和RTX 3090的差距如此小，那這張卡的定位是什么？筆者個人感覺RTX 3080 Ti更多的還是為游戲玩家而準(zhǔn)備，24GB的顯存其實大部分游戲是用不到的，當(dāng)然8K除外。

影馳RTX 3090 HOF評測

渲染8K素材占用了17GB顯存

但在專業(yè)渲染軟件中，渲染8K或4K素材的顯存占用率非常高，能達到17GB甚至更高，這對于只有12GB顯存的RTX 3080 Ti就完全不夠了，爆顯存的危害想必大家也知道，可以導(dǎo)致游戲或軟件崩潰，從而進程丟失。

02 NVIDIA Ampere架構(gòu)GA102解析

NVIDIA RTX 3070首測比肩RTX 2080Ti

GeForce RTX 3080 Ti采用了GA102核心，擁有280億（28000 million）個晶體管，628平方毫米的面積，基于三星的8nm NVIDIA定制工藝，來自Micron的GDDR6X顯存。

本次NVIDIA Ampere的SM在Turing基礎(chǔ)上增加了一倍的FP32運算單元，這使得每個SM的FP32運算單元數(shù)量提高了一倍，同時吞吐量也就變?yōu)榱艘槐丁?/p>

而通常我們計算顯卡的CUDA數(shù)量，并不是把SM中的所有單元加起來計數(shù)，而是只統(tǒng)計FP32單元的數(shù)量，所以這樣一來，SM中的【FP32 : INT32】從 1:1 變?yōu)?2:1。

GeForce RTX 3080 Ti共有10240個CUDA，其實它有5120個INT32單元，但由于內(nèi)部的FP32數(shù)量翻了一倍，所以最終實現(xiàn)了10240的CUDA數(shù)量。

而這樣粗暴的提升CUDA數(shù)量對于游戲其實有著非常大的幫助，通常在游戲中浮點運算相比整數(shù)計算要常用的多，圖形、算法以及各種計算操作中著色器工作負(fù)載通常需要混合使用FP32算數(shù)指令，而FP32的加速也有助于光線追蹤降噪著色器。

在去年與GeForce RTX 30系顯卡一同發(fā)布的還有一項新技術(shù)——RTX IO。目前很多游戲動輒幾十G甚至百G的安裝空間，對于存儲空間的負(fù)擔(dān)暫且不提，但存放在硬盤中的數(shù)據(jù)，如果顯卡想要讀取到，需要先由CPU從硬盤中讀取壓縮過的數(shù)據(jù)，經(jīng)過解壓縮再發(fā)送到顯存中。

雖然隨著NVMe SSD的推出，讀取速度相較機械硬盤能夠快20倍，但受制于傳統(tǒng)I/O限制，NVMe高達7GB/秒的高速讀寫對于CPU是極大的負(fù)擔(dān)。

雙倍加量不加價 NVIDIA RTX 3080顯卡首測

傳統(tǒng)的數(shù)據(jù)交換

在這個過程中，會占用多個CPU核心，壓力急劇增大，占用較多的內(nèi)存，而此時其實GPU是處于閑置狀態(tài)的。RTX IO的作用就是越過CPU解壓再傳輸數(shù)據(jù)這一步，直接從PCIE總線讀取硬盤上經(jīng)過壓縮的數(shù)據(jù)，并且完成無損GPU解壓，降低CPU占用，變向提升了性能。

雙倍加量不加價 NVIDIA RTX 3080顯卡首測

RTX IO可以極大解放CPU負(fù)擔(dān)

當(dāng)然這項技術(shù)作為系統(tǒng)底層的運行方式改變，還需要借助微軟發(fā)布的DirectStorage來實現(xiàn)，對于目前容量的游戲來說，RTX IO的改善效果有限，但假以時日等游戲容量上百G成為常態(tài)的時候，這項技術(shù)將會發(fā)揮巨大的功效。

同時搭配新增的HDMI 2.1接口，可以支持單線8K的視頻輸出，而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出，如果想要連接8K電視，則需要更多的線纜支持。

03 GeForce RTX 3080 Ti外觀

首先還是來看一下外觀，在外包裝上相比之前的公版沒有變化，不過GeForce RTX 3080 Ti這款顯卡本身相比GeForce RTX 3080在細節(jié)上還是有不少變化的。

RTX 3080 Ti首測

GeForce RTX 3080 Ti

RTX 3080 Ti首測

GeForce RTX 3080 Ti配件盒展示

外包裝依舊是禮盒形式的，收藏感滿滿，在拿出顯卡后下方是轉(zhuǎn)接線和說明書的配件盒，因為此次公版仍采用單12pin的供電插槽，所以需要轉(zhuǎn)換成雙8pin的接口才能使用。

RTX 3080 Ti首測

GeForce RTX 3080 Ti 正面

拿出顯卡后我們先來看一下正面（由于公版軸流式設(shè)計，兩側(cè)均有風(fēng)扇，我們以插入機箱后的方向來區(qū)分反正面），相比GeForce RTX 3080的設(shè)計整體基本無改動，不過邊框部分的內(nèi)角從啞光改為了鏡面，這種略帶跳躍的視覺效果相比之前的設(shè)計更好看。

RTX 3080 Ti首測

GeForce RTX 3080 Ti 內(nèi)角的金屬光澤

RTX 3080 Ti首測

GeForce RTX 3080 Ti上機后燈光效果

另外在這次GeForce RTX 3080 Ti中出了顯卡側(cè)面的GeForce RTX的logo燈，在正面還增加了一個“X”的燈光效果，不過由于是顯卡自內(nèi)而外發(fā)出的燈效，所以并不明顯，需要在較暗的環(huán)境下才能看出。

RTX 3080 Ti首測

GeForce RTX 3080 Ti背面

RTX 3080 Ti首測

GeForce RTX 3080 Ti邊框部位NVIDIA logo

顯卡背面部分（雖然這看起來更像正面），基本沒有改動，邊框配色為淡淡的玫瑰金，包括極細微的NVIDIA logo。

RTX 3080 Ti首測

GeForce RTX 3080 Ti 單12pin供電接口

在GeForce RTX 3080 Ti顯卡的側(cè)面，可以看到單12pin的供電接口，從整體來看它比較靠近中間部位，但我們都知道公版卡采用了高度緊湊的PCB板，長度也小于一般尺寸，所以其實供電接口已經(jīng)位于板子的尾部，沒有往右挪的空間了。根據(jù)NVIDIA官方說明，GeForce RTX 3080 Ti的單卡功耗為350W，下面我們也會詳細測試。

RTX 3080 Ti首測

GeForce RTX 3080 Ti視頻接口

GeForce RTX 3080 Ti的擋板部位顏色也和GeForce RTX 3080不同，后者采用了與散熱鰭片相同的黑色，而在新版的GeForce RTX 3080 Ti中也改為了正常的金屬色，未作特殊處理。接口方面的配置依舊為DP 1.4*3+HDMI 2.1*1的4接口設(shè)計，另外由于新的HDMI 2.1協(xié)議，最高已可支持單線8K的視頻輸出。

NVIDIA 30系顯卡發(fā)布會你需要了解這些

散熱系統(tǒng)示意

另外如果是第一次了解公版顯卡的朋友們，這里再給大家說一下?lián)醢宀课贿@個奇怪的“柵欄”的用處，由于公版卡采用了雙軸流式設(shè)計，正面及背面均有散熱風(fēng)扇，正面風(fēng)扇為主動吸入冷空氣為GPU降溫，擋板部位則是排出熱空氣的“出風(fēng)口”，而背面的風(fēng)扇則是向上排出顯卡內(nèi)熱空氣的作用。

04 3DMARK 理論性能測試

首先介紹一下測試平臺，為了保證此次評測能夠發(fā)揮GeForce RTX 3080 Ti顯卡的最佳性能，主板和CPU采用了目前桌面旗艦級配置，具體如下。

RTX 3080 Ti首測

在測試成績上，基準(zhǔn)測試采用3DMARK，游戲性能測試使用游戲自帶Benchmark，同時為了減小誤差，每項測試成績均測試3遍取平均值。

RTX 3080 Ti首測

GPU-Z參數(shù)

首先看一下GPU-Z的參數(shù)，GeForce RTX 3080 Ti采用GA102核心，三星8nm工藝，芯片面積628平方毫米，擁有10240個CUDA，1665MHz頻率。采用12GB GDDR6X顯存，位寬為384bit，顯存帶寬達到了912.4 GB/s，光柵單元和紋理單元為112和320。

下面先進行的是用來衡量顯卡DX11理論性能的3DMARK FS套裝：FS,FSE,FSU三者分別對應(yīng)顯卡在1080P、2K、4K的理論性能，取顯卡分?jǐn)?shù)實際測試結(jié)果如下：

RTX 3080 Ti首測

3D MARK FS套裝測試

在針對顯卡DX11性能的3DMARK FS套裝測試中，我們選擇了上代和本代的4張顯卡進行分值對比，以便能更好的反應(yīng)GeForce RTX 3080 Ti的性能水平。

可以看到GeForce RTX 3080 Ti的性能基本與GeForce RTX 3090相同，差距微乎其微。另外對比GeForce RTX 3080則提高了不少，整體差距在11%左右。而對比上一代旗艦GeForce RTX 2080 Ti整體提升約為40%。

RTX 3080 Ti首測

3D MARK TS套裝測試

而在針對DX12環(huán)境下的Time Spy和Time Spy Extreme測試中，GeForce RTX 3080 Ti的分?jǐn)?shù)與GeForce RTX 3090的分?jǐn)?shù)差距則要大一些，達到4%左右。而對比GeForce RTX 3080的分?jǐn)?shù)要高出7%左右；對比上一代GeForce RTX 2080 Ti的分?jǐn)?shù)要高出43%左右。

RTX 3080 Ti首測

3D MARK 光追測試

PortRoyal是3DMARK中專門針對光追性能的測試項，在這組測試中GeForce RTX 3080 Ti的表現(xiàn)依舊緊咬GeForce RTX 3090，分?jǐn)?shù)差距不超過1%；對比GeForce RTX 3080的分?jǐn)?shù)提升約為11%；對比上一代GeForce RTX 2080 Ti的分?jǐn)?shù)提升則非常大，約為60%。

05 游戲性能測試

在游戲性能測試中，我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條：英靈殿》、《無主之地》，國產(chǎn)游戲《邊境》、《光明記憶：無限》的benchmark跑分軟件。

另外在游戲測試中，由于顯卡驅(qū)動的版本更新和游戲更新非常影響游戲幀數(shù)，所有benchmark跑分成績均以本次成績?yōu)闇?zhǔn)。

RTX 3080 Ti首測

《刺客信條：英靈殿》游戲測試

在游戲?qū)崪y中我們更印證了前面的說法，GeForce RTX 3080 Ti和GeForce RTX 3090的大部分分?jǐn)?shù)相同，僅有1-2幀的差距。而GeForce RTX 3080的分?jǐn)?shù)差距在1080P和2K分辨率下也并不大，主要是4K分辨率會有10%左右的差距。

RTX 3080 Ti首測

《德軍總部新血脈》游戲測試

《德軍總部新血脈》并且由于自帶兩個benchmark，所以我們的數(shù)據(jù)取跑分均值，另外這款游戲幾乎每更新一次驅(qū)動或者游戲版本升級都會導(dǎo)致分?jǐn)?shù)的巨大差異，在本次重新測試中，GeForce RTX 3080 Ti與GeForce RTX 3090的差距依舊微乎其微，而相比GeForce RTX 3080的提升約為4%左右。

RTX 3080 Ti首測

《孤島驚魂5》游戲測試

《孤島驚魂5》同樣算是優(yōu)化比較到位的3A大作，GeForce RTX 3080 Ti均能達到100幀以上的流暢運行標(biāo)準(zhǔn)，其中4K分辨率下的成績要領(lǐng)先GeForce RTX 3080 15%左右。

RTX 3080 Ti首測

《無主之地3》游戲測試

《無主之地3》是一款采用了卡通渲染風(fēng)格的游戲，它對于性能要求的下限很低而上限又很高，在1080P分辨率下GeForce RTX 3080 Ti能夠跑到147幀，而在4K分辨率下打了對折僅有70幀。

RTX 3080 Ti首測

《光明記憶：無限》游戲測試

《光明記憶：無限》是由飛燕群島工作室開發(fā)的《光明記憶》新系列，目前還沒有游戲提供試玩，不過benchmark的跑分軟件官方已經(jīng)提供，玩家可以在steam上自行下載。另外我們在測試的時候由于無法關(guān)閉光追選項，故所有測試成績均為“RTX 最高/DLSS 質(zhì)量”模式下進行。在這款游戲的benchmark中出現(xiàn)了驚人的分?jǐn)?shù)一致情況，雖然多測試幾遍肯定會有所不同，但在整體趨同的情況下意義不大。