NVIDIA RTX 3080 Ti顯卡怎么樣 NVIDIA RTX 3080 Ti顯卡全面評測

受到芯片短缺以及礦潮影響,近一年的DIY市場尤其混亂,其中又以顯卡最為畸形,原本5499元首發(fā)的GeForce RTX 3080已經(jīng)被炒到了15000左右,價格翻了3倍。而不久前NVIDIA在官方博客中再次宣布,后續(xù)推出的RTX 30系顯卡,除了RTX 3090外將全部從芯片層面限制挖礦,包括之前已經(jīng)推出的RTX 3060/3060 Ti/3070/3080,以及后續(xù)將要推出的顯卡,今天大家期待已久的GeForce RTX 3080 Ti終于來了。
此次我們根據(jù)9個方面來全面分析一下NVIDIA的顯卡能力,趕緊看看吧
GeForce RTX 3080 Ti
GeForce RTX 3080 Ti細節(jié)特寫
關(guān)于此次發(fā)布的GeForce RTX 3080 Ti顯卡,想必大家主要關(guān)心的有這幾點,首先是價格和性能,其次是供貨量,能不能買到。由于此次的顯卡全部限制了哈希率,也就是以太坊挖礦,所以會減少礦工的涌入。在6月1日臺北電腦展發(fā)布會上,已經(jīng)公布了售價為8999元,但國內(nèi)目前買不到,所以只能期待一波非公版的顯卡了,不同廠商會根據(jù)公版定價酌情加價,但首發(fā)價格一定是比較低的,大家不妨去搶一波。
01 GA102核心的第三張卡
下面我們先來看看在架構(gòu)上有哪些改動,官方白皮書上對比的對象為GeForce RTX 2080 Ti,相較于上一代的NVIDIA Turing架構(gòu),NVIDIA Ampere架構(gòu)下的GeForce RTX 3080 Ti每個時鐘執(zhí)行2次著色器運算,而Turing為1次,RTX 3080 Ti的著色器性能達到34 TFLOPS單精度性能,而Turing為14 TFLOPS。
第一代NVIDIA RTX架構(gòu) Turing下的RTX 2080 Ti
第二代NVIDIA RTX架構(gòu) Ampere下的RTX 3080 Ti
NVIDIA Ampere架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達到67 RT TFLOPS,而Turing為43 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對游戲中運動模糊部分場景的光線追蹤計算加速。
第三代Tensor Core可自動識別并消除不太重要的DNN權(quán)重,處理稀疏網(wǎng)絡(luò)的速率是Turing的兩倍,算力高達273 Tensor TFLOPS,而Turing為114 Tensor TFLOPS。
GeForce RTX 3080 Ti仍然采用了GA102核心,與GeForce RTX 3080/3090相同,下面我們來看一看RTX 3080 Ti在GA102中做了哪些改動。
完整的GA102核心
完整的GA102 GPU包含7個GPC(圖形處理集群)42個TPC(紋理處理集群)以及84個SM(流處理器)組成,而RTX 3080 Ti的CUDA數(shù)量是10240個,所以可以推斷RTX 3080 Ti屏蔽了兩組TPC,所以只有80個SM單元,而完整GA102核心的CUDA數(shù)量應該是10752個。
為了查詢方便,筆者將這幾款顯卡的核心參數(shù)列出,可以看到RTX 3080 Ti與RTX 3090的核心參數(shù)非常接近。相差的兩個SM單元,也就是1組TPC,256個CUDA,其實在實際應用中來講差距并不是很大,最重要的是RTX 3090相比RTX 3080 Ti多了12GB的顯存;而相比RTX 3080來說提升就非常大了。
可能有用戶會問,既然和RTX 3090的差距如此小,那這張卡的定位是什么?筆者個人感覺RTX 3080 Ti更多的還是為游戲玩家而準備,24GB的顯存其實大部分游戲是用不到的,當然8K除外。
渲染8K素材占用了17GB顯存
但在專業(yè)渲染軟件中,渲染8K或4K素材的顯存占用率非常高,能達到17GB甚至更高,這對于只有12GB顯存的RTX 3080 Ti就完全不夠了,爆顯存的危害想必大家也知道,可以導致游戲或軟件崩潰,從而進程丟失。
02 NVIDIA Ampere架構(gòu)GA102解析
GeForce RTX 3080 Ti采用了GA102核心,擁有280億(28000 million)個晶體管,628平方毫米的面積,基于三星的8nm NVIDIA定制工藝,來自Micron的GDDR6X顯存。
本次NVIDIA Ampere的SM在Turing基礎(chǔ)上增加了一倍的FP32運算單元,這使得每個SM的FP32運算單元數(shù)量提高了一倍,同時吞吐量也就變?yōu)榱艘槐丁?/p>
而通常我們計算顯卡的CUDA數(shù)量,并不是把SM中的所有單元加起來計數(shù),而是只統(tǒng)計FP32單元的數(shù)量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變?yōu)?2:1。
GeForce RTX 3080 Ti共有10240個CUDA,其實它有5120個INT32單元,但由于內(nèi)部的FP32數(shù)量翻了一倍,所以最終實現(xiàn)了10240的CUDA數(shù)量。
而這樣粗暴的提升CUDA數(shù)量對于游戲其實有著非常大的幫助,通常在游戲中浮點運算相比整數(shù)計算要常用的多,圖形、算法以及各種計算操作中著色器工作負載通常需要混合使用FP32算數(shù)指令,而FP32的加速也有助于光線追蹤降噪著色器。
在去年與GeForce RTX 30系顯卡一同發(fā)布的還有一項新技術(shù)——RTX IO。目前很多游戲動輒幾十G甚至百G的安裝空間,對于存儲空間的負擔暫且不提,但存放在硬盤中的數(shù)據(jù),如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數(shù)據(jù),經(jīng)過解壓縮再發(fā)送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機械硬盤能夠快20倍,但受制于傳統(tǒng)I/O限制,NVMe高達7GB/秒的高速讀寫對于CPU是極大的負擔。
傳統(tǒng)的數(shù)據(jù)交換
在這個過程中,會占用多個CPU核心,壓力急劇增大,占用較多的內(nèi)存,而此時其實GPU是處于閑置狀態(tài)的。RTX IO的作用就是越過CPU解壓再傳輸數(shù)據(jù)這一步,直接從PCIE總線讀取硬盤上經(jīng)過壓縮的數(shù)據(jù),并且完成無損GPU解壓,降低CPU占用,變向提升了性能。
RTX IO可以極大解放CPU負擔
當然這項技術(shù)作為系統(tǒng)底層的運行方式改變,還需要借助微軟發(fā)布的DirectStorage來實現(xiàn),對于目前容量的游戲來說,RTX IO的改善效果有限,但假以時日等游戲容量上百G成為常態(tài)的時候,這項技術(shù)將會發(fā)揮巨大的功效。
同時搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
03 GeForce RTX 3080 Ti外觀
首先還是來看一下外觀,在外包裝上相比之前的公版沒有變化,不過GeForce RTX 3080 Ti這款顯卡本身相比GeForce RTX 3080在細節(jié)上還是有不少變化的。
GeForce RTX 3080 Ti
GeForce RTX 3080 Ti配件盒展示
外包裝依舊是禮盒形式的,收藏感滿滿,在拿出顯卡后下方是轉(zhuǎn)接線和說明書的配件盒,因為此次公版仍采用單12pin的供電插槽,所以需要轉(zhuǎn)換成雙8pin的接口才能使用。
GeForce RTX 3080 Ti 正面
拿出顯卡后我們先來看一下正面(由于公版軸流式設(shè)計,兩側(cè)均有風扇,我們以插入機箱后的方向來區(qū)分反正面),相比GeForce RTX 3080的設(shè)計整體基本無改動,不過邊框部分的內(nèi)角從啞光改為了鏡面,這種略帶跳躍的視覺效果相比之前的設(shè)計更好看。
GeForce RTX 3080 Ti 內(nèi)角的金屬光澤
GeForce RTX 3080 Ti上機后燈光效果
另外在這次GeForce RTX 3080 Ti中出了顯卡側(cè)面的GeForce RTX的logo燈,在正面還增加了一個“X”的燈光效果,不過由于是顯卡自內(nèi)而外發(fā)出的燈效,所以并不明顯,需要在較暗的環(huán)境下才能看出。
GeForce RTX 3080 Ti背面
GeForce RTX 3080 Ti邊框部位NVIDIA logo
顯卡背面部分(雖然這看起來更像正面),基本沒有改動,邊框配色為淡淡的玫瑰金,包括極細微的NVIDIA logo。
GeForce RTX 3080 Ti 單12pin供電接口
在GeForce RTX 3080 Ti顯卡的側(cè)面,可以看到單12pin的供電接口,從整體來看它比較靠近中間部位,但我們都知道公版卡采用了高度緊湊的PCB板,長度也小于一般尺寸,所以其實供電接口已經(jīng)位于板子的尾部,沒有往右挪的空間了。根據(jù)NVIDIA官方說明,GeForce RTX 3080 Ti的單卡功耗為350W,下面我們也會詳細測試。
GeForce RTX 3080 Ti視頻接口
GeForce RTX 3080 Ti的擋板部位顏色也和GeForce RTX 3080不同,后者采用了與散熱鰭片相同的黑色,而在新版的GeForce RTX 3080 Ti中也改為了正常的金屬色,未作特殊處理。接口方面的配置依舊為DP 1.4*3+HDMI 2.1*1的4接口設(shè)計,另外由于新的HDMI 2.1協(xié)議,最高已可支持單線8K的視頻輸出。
散熱系統(tǒng)示意
另外如果是第一次了解公版顯卡的朋友們,這里再給大家說一下?lián)醢宀课贿@個奇怪的“柵欄”的用處,由于公版卡采用了雙軸流式設(shè)計,正面及背面均有散熱風扇,正面風扇為主動吸入冷空氣為GPU降溫,擋板部位則是排出熱空氣的“出風口”,而背面的風扇則是向上排出顯卡內(nèi)熱空氣的作用。
04 3DMARK 理論性能測試
首先介紹一下測試平臺,為了保證此次評測能夠發(fā)揮GeForce RTX 3080 Ti顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級配置,具體如下。
在測試成績上,基準測試采用3DMARK,游戲性能測試使用游戲自帶Benchmark,同時為了減小誤差,每項測試成績均測試3遍取平均值。
GPU-Z參數(shù)
首先看一下GPU-Z的參數(shù),GeForce RTX 3080 Ti采用GA102核心,三星8nm工藝,芯片面積628平方毫米,擁有10240個CUDA,1665MHz頻率。采用12GB GDDR6X顯存,位寬為384bit,顯存帶寬達到了912.4 GB/s,光柵單元和紋理單元為112和320。
下面先進行的是用來衡量顯卡DX11理論性能的3DMARK FS套裝:FS,FSE,FSU三者分別對應顯卡在1080P、2K、4K的理論性能,取顯卡分數(shù)實際測試結(jié)果如下:
3D MARK FS套裝測試
在針對顯卡DX11性能的3DMARK FS套裝測試中,我們選擇了上代和本代的4張顯卡進行分值對比,以便能更好的反應GeForce RTX 3080 Ti的性能水平。
可以看到GeForce RTX 3080 Ti的性能基本與GeForce RTX 3090相同,差距微乎其微。另外對比GeForce RTX 3080則提高了不少,整體差距在11%左右。而對比上一代旗艦GeForce RTX 2080 Ti整體提升約為40%。
3D MARK TS套裝測試
而在針對DX12環(huán)境下的Time Spy和Time Spy Extreme測試中,GeForce RTX 3080 Ti的分數(shù)與GeForce RTX 3090的分數(shù)差距則要大一些,達到4%左右。而對比GeForce RTX 3080的分數(shù)要高出7%左右;對比上一代GeForce RTX 2080 Ti的分數(shù)要高出43%左右。
3D MARK 光追測試
PortRoyal是3DMARK中專門針對光追性能的測試項,在這組測試中GeForce RTX 3080 Ti的表現(xiàn)依舊緊咬GeForce RTX 3090,分數(shù)差距不超過1%;對比GeForce RTX 3080的分數(shù)提升約為11%;對比上一代GeForce RTX 2080 Ti的分數(shù)提升則非常大,約為60%。
05 游戲性能測試
在游戲性能測試中,我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:英靈殿》、《無主之地》,國產(chǎn)游戲《邊境》、《光明記憶:無限》的benchmark跑分軟件。
另外在游戲測試中,由于顯卡驅(qū)動的版本更新和游戲更新非常影響游戲幀數(shù),所有benchmark跑分成績均以本次成績?yōu)闇省?/p>
《刺客信條:英靈殿》游戲測試
在游戲?qū)崪y中我們更印證了前面的說法,GeForce RTX 3080 Ti和GeForce RTX 3090的大部分分數(shù)相同,僅有1-2幀的差距。而GeForce RTX 3080的分數(shù)差距在1080P和2K分辨率下也并不大,主要是4K分辨率會有10%左右的差距。
《德軍總部新血脈》游戲測試
《德軍總部新血脈》并且由于自帶兩個benchmark,所以我們的數(shù)據(jù)取跑分均值,另外這款游戲幾乎每更新一次驅(qū)動或者游戲版本升級都會導致分數(shù)的巨大差異,在本次重新測試中,GeForce RTX 3080 Ti與GeForce RTX 3090的差距依舊微乎其微,而相比GeForce RTX 3080的提升約為4%左右。
《孤島驚魂5》游戲測試
《孤島驚魂5》同樣算是優(yōu)化比較到位的3A大作,GeForce RTX 3080 Ti均能達到100幀以上的流暢運行標準,其中4K分辨率下的成績要領(lǐng)先GeForce RTX 3080 15%左右。
《無主之地3》游戲測試
《無主之地3》是一款采用了卡通渲染風格的游戲,它對于性能要求的下限很低而上限又很高,在1080P分辨率下GeForce RTX 3080 Ti能夠跑到147幀,而在4K分辨率下打了對折僅有70幀。
《光明記憶:無限》游戲測試
《光明記憶:無限》是由飛燕群島工作室開發(fā)的《光明記憶》新系列,目前還沒有游戲提供試玩,不過benchmark的跑分軟件官方已經(jīng)提供,玩家可以在steam上自行下載。另外我們在測試的時候由于無法關(guān)閉光追選項,故所有測試成績均為“RTX 最高/DLSS 質(zhì)量”模式下進行。在這款游戲的benchmark中出現(xiàn)了驚人的分數(shù)一致情況,雖然多測試幾遍肯定會有所不同,但在整體趨同的情況下意義不大。
相關(guān)文章
華碩RTX 3080 Ti/3070 Ti 系列顯卡怎么樣?
華碩RTX 3080 Ti/3070 Ti 系列顯卡怎么樣?這款產(chǎn)品搭載一體式水冷散熱器,顯卡表面具有一個小型渦輪風扇,水冷排為 240 規(guī)格,具有 RGB 燈光效果,詳細請看下文介紹2021-06-03英偉達 GeForce RTX 3080 Ti顯卡怎么樣? 首發(fā)評測
英偉達 GeForce RTX 3080 Ti顯卡怎么樣?雖然這次英偉達 GeForce RTX 3080 Ti 依舊采用了與 GeForce RTX 3080 一致的外觀,但TX 3080 Ti 配備了 12GB 的美光 GDDR6X 顯存,2021-06-03七彩虹戰(zhàn)斧RTX3080Ti顯卡怎么樣 七彩虹戰(zhàn)斧RTX3080Ti游戲顯卡評測
七彩虹戰(zhàn)斧RTX 3080 Ti外觀精致,做工出色,尤其是在散熱方面表現(xiàn)非常出色,一起來了解一下吧2021-06-03Intel DG2獨立顯卡實物曝光 僅僅略低于RTX3080
Intel DG2獨立顯卡實物曝光,512EU DG2在部分測試中僅僅略低于RTX 3080,但注意測試項目都是Intel重點優(yōu)化的,更多人將它定位在RTX 3070 Ti的檔次上,詳細請看下文介紹2021-05-31- rtx 3080現(xiàn)在的顯卡價格非常的高,而RTX 3080 Ti也將在今年的5月份上市了!這兩張顯卡到底應該買哪一張好呢,趕緊看看吧2021-04-26
顯卡如何選擇 微星RTX 3060 Ti/3070/3080顯卡全方位評測
顯卡如何選擇?下面小編帶來微星RTX 3060 Ti/3070/3080顯卡全方位評測2021-02-01微星RTX 3080 SUPRIM X超龍怎么樣 微星RTX 3080 SUPRIM X超龍評測
各家的超旗艦顯卡由于復雜的工藝設(shè)計等因素,往往需要很長時間的打磨才能通過測試。今天給大家?guī)淼木褪俏⑿浅炫烇@卡GeForce RTX 3080 SUPRIM X 10G超龍的評測,趕緊看2021-01-22微星RTX 3080超龍值得入手嗎 微星RTX 3080超龍全方位評測
微星RTX 3080超龍怎么樣?性能如何?值得買嗎?下面小編帶來微星RTX 3080超龍全方位評測2021-01-04技嘉AORUS GeForce RTX 3080 XTREME 10G大雕怎么樣
從公版發(fā)售開始,NVIDIA30系就被玩家冠以“真香”的名號,全新升級的第二代RTX架構(gòu)NVIDIAAmpere帶來的性能飛躍。我們接下來就看看這款來自技嘉科技的旗艦級顯卡—技嘉GeFor2020-12-21映眾RTX 3080冰龍超級版怎么樣 映眾RTX 3080冰龍超級版詳細評測
映眾(INNO3D)GEFORCE RTX 30系列顯卡為玩家們帶來了它的全新大作,而冰龍超級版系列一直是以高顏值的外觀和出色的散熱系統(tǒng)廣受玩家們的喜愛,今天筆者就來給大家評測這款2020-10-15