欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

NVIDIA RTX3080值得入手嗎 NVIDIA RTX3080顯卡詳細(xì)評測

  發(fā)布時間:2020-09-17 10:22:29   作者:佚名   我要評論
NVIDIA RTX3080顯卡怎么樣?性能如何?玩游戲卡不卡?值得買嗎?下面小編帶來NVIDIA RTX3080顯卡詳細(xì)評測

二、安培構(gòu)架解析:流處理器數(shù)量翻倍是否言過其實?

在圖靈誕生之前,GPU核心中并沒有單獨的INT32單元,從Kepler到Maxwell到再到Pascal,每一個CUDA核心都就是由FP32單元構(gòu)成。

而Turing每一個CUDA核心除了有一個FP32的單精度浮點單元之外,還有對應(yīng)有一個INT32的單精度整數(shù)單元。

在現(xiàn)代游戲(例如古墓麗影:暗影)中,每100條指令操作中有62條是浮點指令操作,38條是整數(shù)指令操作。以往GPU在只能單獨、交替的執(zhí)行浮點和整數(shù)運算,圖靈構(gòu)架加入了整數(shù)運算單元之后,可以與浮點單元一起并發(fā)執(zhí)行,可以將流處理器的執(zhí)行效率提升36%。

不過在游戲中整數(shù)運算量遠(yuǎn)遠(yuǎn)低于浮點運算量(38:62),因此經(jīng)常會有大量的INT32單元被閑置。為了解決這個問題,提升INT32單元的利用率,NVIDIA改進了INT32單元,使之不僅可以運行整數(shù)運算,也能進行單精度浮點運算。

如上圖所示,在安培構(gòu)架中,每個SM單元中的64個FP32單元依舊保留,而INT32單元則被賦予了更多的使命,它不僅能進行整數(shù)運算,但是在不需要進行整數(shù)運算的情況下,它也能和FP32一樣進行單精度浮點運算。

也就是說,每個SM單元可以同時執(zhí)行4x(16FP32+16FP32)=128個FP32運算,或者4x(16FP32+16INT32)=64個FP32+64個INT32運算。

在理想的情況將下,一個SM單元中的64個INT單元全部都做單精度浮點運算的話,那么流處理器(FP32單元)數(shù)量將會直接變成128個。相對而言,圖靈構(gòu)架一個SM單元只有固定的64個流處理器。

RTX 3080擁有68個SM單元,理論上能達(dá)到8704個流處理器的規(guī)模。很多同學(xué)可能懷疑NVIDIA在騙我們,這些流處理器是否能夠同時工作還是個問號。

下面我們使用AIDA64 GPGPU進行驗證,看看RTX 3080的8704個流處理器是否言過其實。

如果依據(jù)1710MHz的頻率和8704個FP32單元來計算RTX 3080的理論浮點性能應(yīng)當(dāng)是29767GFLOPS。

實測RTX 3080的單精度浮點運算性能是29117GFLOPS,略低于理論值。這是因為320W TDP的限制,RTX 3080在進行GPGPU單精度浮點測試時,GPU核心的滿載頻率只有1672MHz并沒有達(dá)到默頻的1710MHz。

不過從這里可以看出,RTX 3080的的確確擁有8704個流處理器(FP32單元),現(xiàn)在已經(jīng)沒有什么好質(zhì)疑的了。

實測RTX 2080 Ti的單精度浮點運算性能是16626GFLOPS,接近RTX 3080的6成。

實際上,在進行GPGPU測試時,RTX 2080 Ti的運行頻率達(dá)到了1910MHz,所以雖然流處理器數(shù)量只有一半,但是浮點性能卻能達(dá)到6成。

RTX 2080在進行GPGPU測試時,運行頻率更是高達(dá)1938MHz,單精度浮點運算性能達(dá)到了11416GFLOPS,約為RTX 3080的40%。要知道RTX 2080 2944個流處理器只相當(dāng)于RTX 3080 8704個流處理器的1/3。

所以現(xiàn)在大家應(yīng)該知道了RTX 3080 TDP如此之高的原因!即便是320W的TDP,也難以滿足讓8704個流處理器以較高的頻率運行的功耗需求。

相關(guān)文章

最新評論