NVIDIA RTX 3070 Ti顯卡怎么樣 NVIDIA RTX 3070 Ti顯卡評(píng)測(cè)

NVIDIA RTX 3070 Ti顯卡今日首發(fā),想買的小伙伴可以準(zhǔn)備開搶了,那么這款顯卡各方面性能怎么樣呢?感興趣的朋友不要錯(cuò)過這篇評(píng)測(cè)了。
GeForce RTX 3070 Ti
而RTX 30系顯卡截止目前還未宣布哪款顯卡將停產(chǎn),如果說NVIDIA是覺得去年發(fā)布的RTX 30系顯卡定價(jià)過低,想推出Ti系列來提高售價(jià),但從已發(fā)布的GeForce RTX 3080 Ti來看,雖然價(jià)格上去了,但性能同樣約等于GeForce RTX 3090,換算過來其實(shí)價(jià)格并沒有變化。
GeForce RTX 3070 Ti
在之前的臺(tái)北電腦展上,GeForce RTX 3070 Ti的價(jià)格已經(jīng)曝光,為4499元起。在看過了GeForce RTX 3080 Ti的性能提升后,相信大家已經(jīng)迫不及待了,今天我們就來看看這款GeForce RTX 3070 Ti的性能提升如何。
01 GA104核心的第二張顯卡
在核心架構(gòu)上,GeForce RTX 3070 Ti是采用GA104核心的第二張卡,官方白皮書上對(duì)比的對(duì)象為GeForce RTX 2070 SUPER,相較于上一代的NVIDIA Turing架構(gòu),NVIDIA Ampere架構(gòu)下的GeForce RTX 3070 Ti每個(gè)時(shí)鐘執(zhí)行2次著色器運(yùn)算,而Turing為1次,RTX 3070 Ti的著色器性能達(dá)到22 TFLOPS單精度性能,而Turing為9 TFLOPS。
新老兩代顯卡算力對(duì)比
NVIDIA Ampere架構(gòu)翻倍了光線與三角形的相交吞吐量,RT Core達(dá)到42 RT TFLOPS,而Turing為24 RT TFLOPS。而且第二代光線追蹤最重要的不僅僅是性能提升,還增加了對(duì)游戲中運(yùn)動(dòng)模糊部分場(chǎng)景的光線追蹤計(jì)算加速。
第三代Tensor Core可自動(dòng)識(shí)別并消除不太重要的DNN權(quán)重,處理稀疏網(wǎng)絡(luò)的速率是Turing的兩倍,算力高達(dá)174 Tensor TFLOPS,而Turing為72 Tensor TFLOPS。
GeForce RTX 3070 Ti采用了GA104核心,與GeForce RTX 3070相同,不過NVIDIA官方并沒有給出GA104核心架構(gòu)圖,我們?nèi)砸訥A102來做講解。
完整的GA102核心
完整的GA102 GPU包含7個(gè)GPC(圖形處理集群)42個(gè)TPC(紋理處理集群)以及84個(gè)SM(流處理器)組成,而GeForce RTX 3070 Ti的CUDA數(shù)量是6144個(gè),共有48個(gè)SM單元,也就是3個(gè)GPC 24個(gè)TPC,而剛剛發(fā)布的GeForce RTX 3080 Ti共有40個(gè)TPC 80個(gè)SM單元,這也是兩款芯片的差距所在。
公版顯卡參數(shù)表
為了查詢方便,筆者將這幾款顯卡的核心參數(shù)列出,可以看到GeForce RTX 3070與GeForce RTX 3070 Ti的差距不大,相差的兩個(gè)SM單元,和剛剛發(fā)布的GeForce RTX 3080 Ti情況基本相同,也就是1組TPC,256個(gè)CUDA。只不過GeForce RTX 3080 Ti更接近GeForce RTX 3090,而根據(jù)參數(shù)來看GeForce RTX 3070 Ti與GeForce RTX 3080還有一定差距。
GDDR6X
另外GeForce RTX 3070 Ti的顯存雖然依舊是8GB,但已經(jīng)由GDDR6更換為GDDR6X,兩者的區(qū)別主要在于頻率和帶寬上,同頻下實(shí)現(xiàn)更高的顯存帶寬可以降低成本和功耗,另外在相同時(shí)間內(nèi)GDDR6X可以比GDDR6傳輸多2倍的數(shù)據(jù)。這對(duì)于需要大量數(shù)據(jù)負(fù)載的工作尤為重要,如光線追蹤的游戲、AI學(xué)習(xí)和8K視頻渲染。
02 NVIDIA Ampere架構(gòu)GA104解析
GeForce RTX 3070 Ti采用了GA104核心,擁有174億(17400 million)個(gè)晶體管,392平方毫米的面積,基于三星的8nm NVIDIA定制工藝,來自Micron的GDDR6X顯存,這里與GeForce RTX 3070的GDDR6有所區(qū)別。
本次NVIDIA Ampere的SM在Turing基礎(chǔ)上增加了一倍的FP32運(yùn)算單元,這使得每個(gè)SM的FP32運(yùn)算單元數(shù)量提高了一倍,同時(shí)吞吐量也就變?yōu)榱艘槐丁?/p>
而通常我們計(jì)算顯卡的CUDA數(shù)量,并不是把SM中的所有單元加起來計(jì)數(shù),而是只統(tǒng)計(jì)FP32單元的數(shù)量,所以這樣一來,SM中的【FP32 : INT32】 從 1:1 變?yōu)?2:1。
GeForce RTX 3070 Ti共有6144個(gè)CUDA,其實(shí)它有3072個(gè)INT32單元,但由于內(nèi)部的FP32數(shù)量翻了一倍,所以最終實(shí)現(xiàn)了6144的CUDA數(shù)量。
而這樣粗暴的提升CUDA數(shù)量對(duì)于游戲其實(shí)有著非常大的幫助,通常在游戲中浮點(diǎn)運(yùn)算相比整數(shù)計(jì)算要常用的多,圖形、算法以及各種計(jì)算操作中著色器工作負(fù)載通常需要混合使用FP32算數(shù)指令,而FP32的加速也有助于光線追蹤降噪著色器。
在去年與GeForce RTX 30系顯卡一同發(fā)布的還有一項(xiàng)新技術(shù)——RTX IO。目前很多游戲動(dòng)輒幾十G甚至百G的安裝空間,對(duì)于存儲(chǔ)空間的負(fù)擔(dān)暫且不提,但存放在硬盤中的數(shù)據(jù),如果顯卡想要讀取到,需要先由CPU從硬盤中讀取壓縮過的數(shù)據(jù),經(jīng)過解壓縮再發(fā)送到顯存中。
雖然隨著NVMe SSD的推出,讀取速度相較機(jī)械硬盤能夠快20倍,但受制于傳統(tǒng)I/O限制,NVMe高達(dá)7GB/秒的高速讀寫對(duì)于CPU是極大的負(fù)擔(dān)。
傳統(tǒng)的數(shù)據(jù)交換
在這個(gè)過程中,會(huì)占用多個(gè)CPU核心,壓力急劇增大,占用較多的內(nèi)存,而此時(shí)其實(shí)GPU是處于閑置狀態(tài)的。RTX IO的作用就是越過CPU解壓再傳輸數(shù)據(jù)這一步,直接從PCIE總線讀取硬盤上經(jīng)過壓縮的數(shù)據(jù),并且完成無損GPU解壓,降低CPU占用,變向提升了性能。
RTX IO可以極大解放CPU負(fù)擔(dān)
當(dāng)然這項(xiàng)技術(shù)作為系統(tǒng)底層的運(yùn)行方式改變,還需要借助微軟發(fā)布的DirectStorage來實(shí)現(xiàn),對(duì)于目前容量的游戲來說,RTX IO的改善效果有限,但假以時(shí)日等游戲容量上百G成為常態(tài)的時(shí)候,這項(xiàng)技術(shù)將會(huì)發(fā)揮巨大的功效。
同時(shí)搭配新增的HDMI 2.1接口,可以支持單線8K的視頻輸出,而上一代HDMI 2.0僅支持4K 98Hz的視頻輸出,如果想要連接8K電視,則需要更多的線纜支持。
03 GeForce RTX 3070 Ti外觀
首先還是來看一下外觀,在外包裝上相比之前的公版沒有變化,不過顯卡本身GeForce RTX 3070 Ti更像是GeForce RTX 3080的mini版,與GeForce RTX 3070相距甚遠(yuǎn)。
GeForce RTX 3070 Ti配件盒展示
外包裝依舊是禮盒形式的,收藏感滿滿,在拿出顯卡后下方是轉(zhuǎn)接線和說明書的配件盒,因?yàn)榇舜喂嫒圆捎脝?2pin的供電插槽,所以需要轉(zhuǎn)換成雙8pin的接口才能使用。
GeForce RTX 3070 Ti
GeForce RTX 3070
顯卡正面我們對(duì)比一下GeForce RTX 3070,可以看到GeForce RTX 3070仍然采用了單面雙風(fēng)扇的設(shè)計(jì),而GeForce RTX 3070 Ti則是采用了軸流式設(shè)計(jì),兩側(cè)均有風(fēng)扇。除此之外,顯卡的整體外邊框設(shè)計(jì)基本相似。
GeForce RTX 3070 Ti
GeForce RTX 3070
GeForce RTX 3070 Ti的背面其實(shí)更像GeForce RTX 3080,包括金屬邊框以及表面的磨砂質(zhì)感,只是從體積上略小一號(hào)。
GeForce RTX 3070 Ti 內(nèi)角的金屬光澤
與GeForce RTX 3080 Ti在邊框部位的改動(dòng)相同,GeForce RTX 3070 Ti的內(nèi)角從啞光改為了鏡面,這種略帶跳躍的視覺效果相比之前的設(shè)計(jì)更好看。
GeForce RTX 3070 Ti 單12pin供電接口
在GeForce RTX 3070 Ti顯卡的側(cè)面,可以看到單12pin的供電接口,從整體來看它比較靠近中間部位,但我們都知道公版卡采用了高度緊湊的PCB板,長(zhǎng)度也小于一般尺寸,所以其實(shí)供電接口已經(jīng)位于板子的尾部,沒有往右挪的空間了。根據(jù)NVIDIA官方說明,GeForce RTX 3070 Ti的單卡功耗為290W,推薦750W及以上電源。
另外在邊框的配色上GeForce RTX 3070 Ti的顏色幾乎為純銀色,而GeForce RTX 3080和GeForce RTX 3080 Ti則為玫瑰金。
GeForce RTX 3070 Ti視頻接口
GeForce RTX 3070 Ti的擋板部位整體設(shè)計(jì)與GeForce RTX 3070相同。接口方面的配置依舊為DP 1.4a*3+HDMI 2.1*1的4接口設(shè)計(jì),另外由于新的HDMI 2.1協(xié)議,最高已可支持單線8K的視頻輸出。
04 3DMARK 理論性能測(cè)試
首先介紹一下測(cè)試平臺(tái),為了保證此次評(píng)測(cè)能夠發(fā)揮GeForce RTX 3080 Ti顯卡的最佳性能,主板和CPU采用了目前桌面旗艦級(jí)配置,具體如下。
在測(cè)試成績(jī)上,基準(zhǔn)測(cè)試采用3DMARK,游戲性能測(cè)試使用游戲自帶Benchmark,同時(shí)為了減小誤差,每項(xiàng)測(cè)試成績(jī)均測(cè)試3遍取平均值。
GPU-Z參數(shù)
首先看一下GPU-Z的參數(shù),GeForce RTX 3070 Ti采用GA104核心,三星8nm工藝,芯片面積392平方毫米,擁有6144個(gè)CUDA,1770MHz頻率。采用8GB GDDR6X顯存,位寬為256bit,顯存帶寬達(dá)到了608.3 GB/s,光柵單元和紋理單元為96和192。
下面先進(jìn)行的是用來衡量顯卡DX11理論性能的3DMARK FS套裝:FS,FSE,FSU三者分別對(duì)應(yīng)顯卡在1080P、2K、4K的理論性能,取顯卡分?jǐn)?shù)實(shí)際測(cè)試結(jié)果如下:
3D MARK FS套裝測(cè)試
在針對(duì)顯卡DX11性能的3DMARK FS套裝測(cè)試中,我們選擇了上代和本代的4張顯卡進(jìn)行分值對(duì)比,以便能更好的反應(yīng)GeForce RTX 3070 Ti的性能水平。
可以看到GeForce RTX 3070 Ti的性能顯然更接近GeForce RTX 3070,整體提升10%左右;對(duì)比GeForce RTX 3080的差距為17%左右;相比上一代的GeForce RTX 2070 SUPER提升45%左右。
3D MARK TS套裝測(cè)試
而在針對(duì)DX12環(huán)境下的Time Spy和Time Spy Extreme測(cè)試中,GeForce RTX 3070 Ti的分?jǐn)?shù)提升稍弱,相比GeForce RTX 3070提升7%左右。而對(duì)比GeForce RTX 3080的分?jǐn)?shù)差距為23%左右;對(duì)比上一代GeForce RTX 2070 SUPER的分?jǐn)?shù)要高出42%左右。
3D MARK 光追測(cè)試
PortRoyal是3DMARK中專門針對(duì)光追性能的測(cè)試項(xiàng),在這組測(cè)試中GeForce RTX 3070 Ti的表現(xiàn)更貼近GeForce RTX 3070,分?jǐn)?shù)提升為6%左右;對(duì)比GeForce RTX 3080的分?jǐn)?shù)差距為31%左右;對(duì)比上一代GeForce RTX 2070 SUPER的分?jǐn)?shù)提升則非常大,約為50%。
這是比較理想的等差數(shù)列
另外我們對(duì)比了一組比較有意思的數(shù)據(jù),綜合來看目前GeForce RTX 30系顯卡性能,形成等差數(shù)列的游戲卡型號(hào)分別為RTX 3060、RTX 3060 Ti、RTX 3070 Ti以及RTX 3080,所以個(gè)人來看GeForce RTX 3070與GeForce RTX 3070 Ti的型號(hào)會(huì)有些許沖突,不知道NVIDIA后續(xù)是否會(huì)有停產(chǎn)GeForce RTX 3070的打算。
05 游戲性能測(cè)試
在游戲性能測(cè)試中,我們選擇了《德軍總部新血脈》、《孤島驚魂5》、《刺客信條:英靈殿》、《無主之地》,國(guó)產(chǎn)游戲《邊境》、《光明記憶:無限》的benchmark跑分軟件。
另外在游戲測(cè)試中,由于顯卡驅(qū)動(dòng)的版本更新和游戲更新非常影響游戲幀數(shù),所有benchmark跑分成績(jī)均以本次成績(jī)?yōu)闇?zhǔn)。
《刺客信條:英靈殿》游戲測(cè)試
在游戲?qū)崪y(cè)中可以看到GeForce RTX 3070 Ti和GeForce RTX 3070的幀數(shù)差距并不明顯,平均下來為2%左右。而對(duì)比GeForce RTX 3080的分?jǐn)?shù)差距整體在12%左右。
《德軍總部新血脈》游戲測(cè)試
相關(guān)文章
華碩RTX 3080 Ti/3070 Ti 系列顯卡怎么樣?
華碩RTX 3080 Ti/3070 Ti 系列顯卡怎么樣?這款產(chǎn)品搭載一體式水冷散熱器,顯卡表面具有一個(gè)小型渦輪風(fēng)扇,水冷排為 240 規(guī)格,具有 RGB 燈光效果,詳細(xì)請(qǐng)看下文介紹2021-06-03RX-6700XT對(duì)比RTX-3070哪個(gè)好
很多DIY玩家都會(huì)自己買顯卡組裝電腦,那么對(duì)于顯卡的性能就必須十分了解,RX-6700XT對(duì)比RTX-3070哪個(gè)好呢,小編給大家介紹一下2021-05-13RTX3070對(duì)比RTX3060TI哪個(gè)好
RTX3070和RTX3060TI都是全新出品的RTX30系顯卡,想要全新的顯卡,在這兩款顯卡之間不知道如何選擇的用戶可以看過來2021-04-28RTX 3070和RTX 2080ti哪個(gè)好?性能對(duì)比測(cè)試
有人認(rèn)為3070的性能比2080Ti性能強(qiáng),今天就來實(shí)測(cè)下RTX 3070和RTX 2080Ti哪個(gè)好?詳細(xì)內(nèi)容請(qǐng)往下看2021-03-02RTX 3060/3070性能怎么樣 RTX 3060/3070性能詳細(xì)評(píng)測(cè)
近期,基于RTX 30系列移動(dòng)級(jí)獨(dú)立顯卡的游戲本上市,我們也對(duì)時(shí)下主流的兩個(gè)配置:RTX 3060和RTX 3070移動(dòng)級(jí)獨(dú)顯做了性能評(píng)估,下面來看看它們相對(duì)于RTX 20系列移動(dòng)級(jí)獨(dú)顯來2021-02-08顯卡如何選擇 微星RTX 3060 Ti/3070/3080顯卡全方位評(píng)測(cè)
顯卡如何選擇?下面小編帶來微星RTX 3060 Ti/3070/3080顯卡全方位評(píng)測(cè)2021-02-01ROG STRIX GeForce RTX3070 WHITE白色限量版顯卡詳細(xì)評(píng)測(cè)
ROG STRIX GeForce RTX3070 WHITE白色限量版怎么樣?好不好用?值得入手嗎?下面小編帶來ROG STRIX GeForce RTX3070 WHITE白色限量版顯卡詳細(xì)評(píng)測(cè)2021-01-29RTX3060Ti怎么樣 RTX3060Ti與RTX3070/RTX2080S游戲性能評(píng)測(cè)
RTX3060Ti怎么樣?繼RTX3090、RTX3080、RTX3070陸續(xù)發(fā)布之后,讓不少消費(fèi)者感受到了RTX30系列的性能強(qiáng)悍,而近期又新增了新成員,那就是玩家期待已久的RTX3060Ti,下文中為2020-12-10索泰RTX3070 X-GAMING OC值得入手嗎 索泰RTX3070 X-GAMING OC顯卡評(píng)測(cè)
索泰RTX3070 X-GAMING OC怎么樣?性能如何?好不好用?值得買嗎?下面小編帶來索泰RTX3070 X-GAMING OC顯卡評(píng)測(cè)2020-11-18華碩ROG STRIX RTX3070怎么樣 華碩ROG STRIX RTX3070顯卡評(píng)測(cè)
華碩ROG STRIX RTX3070怎么樣?性能如何?值得入手嗎?下面小編帶來華碩ROG STRIX RTX3070顯卡評(píng)測(cè)2020-11-17