NVIDIA RTX3080值得入手嗎 NVIDIA RTX3080顯卡詳細(xì)評(píng)測(cè)

發(fā)布時(shí)間：2020-09-17 10:22:29 作者：佚名

我要評(píng)論

NVIDIA RTX3080顯卡怎么樣？性能如何？玩游戲卡不卡？值得買(mǎi)嗎？下面小編帶來(lái)NVIDIA RTX3080顯卡詳細(xì)評(píng)測(cè)

二、安培構(gòu)架解析：流處理器數(shù)量翻倍是否言過(guò)其實(shí)？

在圖靈誕生之前，GPU核心中并沒(méi)有單獨(dú)的INT32單元，從Kepler到Maxwell到再到Pascal,每一個(gè)CUDA核心都就是由FP32單元構(gòu)成。

而Turing每一個(gè)CUDA核心除了有一個(gè)FP32的單精度浮點(diǎn)單元之外，還有對(duì)應(yīng)有一個(gè)INT32的單精度整數(shù)單元。

在現(xiàn)代游戲（例如古墓麗影：暗影）中，每100條指令操作中有62條是浮點(diǎn)指令操作，38條是整數(shù)指令操作。以往GPU在只能單獨(dú)、交替的執(zhí)行浮點(diǎn)和整數(shù)運(yùn)算，圖靈構(gòu)架加入了整數(shù)運(yùn)算單元之后，可以與浮點(diǎn)單元一起并發(fā)執(zhí)行，可以將流處理器的執(zhí)行效率提升36%。

不過(guò)在游戲中整數(shù)運(yùn)算量遠(yuǎn)遠(yuǎn)低于浮點(diǎn)運(yùn)算量（38：62），因此經(jīng)常會(huì)有大量的INT32單元被閑置。為了解決這個(gè)問(wèn)題，提升INT32單元的利用率，NVIDIA改進(jìn)了INT32單元，使之不僅可以運(yùn)行整數(shù)運(yùn)算，也能進(jìn)行單精度浮點(diǎn)運(yùn)算。

如上圖所示，在安培構(gòu)架中，每個(gè)SM單元中的64個(gè)FP32單元依舊保留，而INT32單元?jiǎng)t被賦予了更多的使命，它不僅能進(jìn)行整數(shù)運(yùn)算，但是在不需要進(jìn)行整數(shù)運(yùn)算的情況下，它也能和FP32一樣進(jìn)行單精度浮點(diǎn)運(yùn)算。

也就是說(shuō)，每個(gè)SM單元可以同時(shí)執(zhí)行4x（16FP32+16FP32）=128個(gè)FP32運(yùn)算，或者4x（16FP32+16INT32）=64個(gè)FP32+64個(gè)INT32運(yùn)算。

在理想的情況將下，一個(gè)SM單元中的64個(gè)INT單元全部都做單精度浮點(diǎn)運(yùn)算的話(huà)，那么流處理器（FP32單元）數(shù)量將會(huì)直接變成128個(gè)。相對(duì)而言，圖靈構(gòu)架一個(gè)SM單元只有固定的64個(gè)流處理器。

RTX 3080擁有68個(gè)SM單元，理論上能達(dá)到8704個(gè)流處理器的規(guī)模。很多同學(xué)可能懷疑NVIDIA在騙我們，這些流處理器是否能夠同時(shí)工作還是個(gè)問(wèn)號(hào)。

下面我們使用AIDA64 GPGPU進(jìn)行驗(yàn)證，看看RTX 3080的8704個(gè)流處理器是否言過(guò)其實(shí)。

如果依據(jù)1710MHz的頻率和8704個(gè)FP32單元來(lái)計(jì)算RTX 3080的理論浮點(diǎn)性能應(yīng)當(dāng)是29767GFLOPS。

實(shí)測(cè)RTX 3080的單精度浮點(diǎn)運(yùn)算性能是29117GFLOPS，略低于理論值。這是因?yàn)?20W TDP的限制，RTX 3080在進(jìn)行GPGPU單精度浮點(diǎn)測(cè)試時(shí)，GPU核心的滿(mǎn)載頻率只有1672MHz并沒(méi)有達(dá)到默頻的1710MHz。

不過(guò)從這里可以看出，RTX 3080的的確確擁有8704個(gè)流處理器（FP32單元），現(xiàn)在已經(jīng)沒(méi)有什么好質(zhì)疑的了。

實(shí)測(cè)RTX 2080 Ti的單精度浮點(diǎn)運(yùn)算性能是16626GFLOPS，接近RTX 3080的6成。

實(shí)際上，在進(jìn)行GPGPU測(cè)試時(shí)，RTX 2080 Ti的運(yùn)行頻率達(dá)到了1910MHz，所以雖然流處理器數(shù)量只有一半，但是浮點(diǎn)性能卻能達(dá)到6成。

RTX 2080在進(jìn)行GPGPU測(cè)試時(shí)，運(yùn)行頻率更是高達(dá)1938MHz，單精度浮點(diǎn)運(yùn)算性能達(dá)到了11416GFLOPS，約為RTX 3080的40%。要知道RTX 2080 2944個(gè)流處理器只相當(dāng)于RTX 3080 8704個(gè)流處理器的1/3。

所以現(xiàn)在大家應(yīng)該知道了RTX 3080 TDP如此之高的原因！即便是320W的TDP，也難以滿(mǎn)足讓8704個(gè)流處理器以較高的頻率運(yùn)行的功耗需求。