英特爾Nehalem技術(shù)詳解

其實(shí),對(duì)于這一點(diǎn),大部分的玩家們已經(jīng)早有耳聞。而且在6月初的臺(tái)北COMPUTEX 2008大展上,我們也初見(jiàn)了Nehalem的身影,并且在Intel的主板墻上我們更是看見(jiàn)了來(lái)自眾多廠商的X58系列主板。面對(duì)新一代CPU及芯片組產(chǎn)品的咄咄逼人,目前的主流產(chǎn)品自然要把握好現(xiàn)在的大好形勢(shì)。
那么,英特爾新一代Nehalem微架構(gòu)的處理器到底是何方神圣?它又有著怎樣的與眾不同呢?下面,我們就來(lái)詳細(xì)的了解一下。
● Nehalem微架構(gòu)概括
1.是Core的進(jìn)化也是Core的革新

Nehalem微架構(gòu)的處理器產(chǎn)品正面
Nehalem是基于Core微架構(gòu)的進(jìn)一步演化,它同Core一樣,還是基于4指令寬度的解碼/重命名/撤銷。當(dāng)然,例如SSE4.2這樣的新的指令集、指令緩存等比起Core都有所增加,TLb也有進(jìn)一步的改善。然而,在Nehalem上又有許多新的革命性的變化,諸如同步多線程(SMT)技術(shù)及三級(jí)緩存和集成內(nèi)存控制器技術(shù)等。這些新的變化又更像是Core架構(gòu)的一次全面革新。
?。?全新的接口不再兼容舊有平臺(tái)

Nehalem微架構(gòu)的處理器產(chǎn)品背面
新一代Nehalem微架構(gòu)采用新的Quick Path Interconnect架構(gòu),因此并不兼容于舊有平臺(tái),其采用全新Socket LGA1366,將配搭新一代X58芯片組。(這也許也是Intel目前剛剛發(fā)布的4系平臺(tái)為什么這么急于成為主流平臺(tái)的原因)上市初期最高型號(hào)為XE版本的Bloomfield(定位于高端桌面級(jí)市場(chǎng)),采用全新LGA 1366處理器接口,核心頻率為3.2GHz,原生四核心并支持SMT技術(shù),其同一時(shí)間最高可處理8個(gè)線程。Bloomfield XE版本內(nèi)建8MB L3 Cache,處理器通過(guò)QPI總線與芯片組傳輸速度高達(dá)6.4GT/s,處理器內(nèi)建三通道內(nèi)存控制器,支持最高DDR3-1333模塊,F(xiàn)MB版本為08,最高TDP為130W。
?。?構(gòu)造全面模塊化

Nehalem的核心架構(gòu)
Nehalem在核心內(nèi)部引入了L1、L2、L3三級(jí)緩存的概念,每個(gè)核心都有自己獨(dú)立的一、二級(jí)緩存,并且每個(gè)內(nèi)核也都引入了SMT(類似于超線程)技術(shù),處理器通過(guò)QPI與外部連接。通過(guò)對(duì)核心內(nèi)部的模塊之間的調(diào)整,(例如:核心數(shù)量、SMT功能、L3緩存容量、QPI連接數(shù)量 ) Nehalem能夠適應(yīng)從很地段的市場(chǎng)一直到很高短的市場(chǎng),覆蓋面從移動(dòng)設(shè)備一直到服務(wù)器市場(chǎng)。因此,Nehalem的擴(kuò)展性極強(qiáng),能夠?qū)崿F(xiàn)跨平臺(tái)應(yīng)用。(如定位于高端桌面市場(chǎng)的Bloomfield,定位于桌面雙核的Havendale及主流桌面四核的Lynnfield等等)。
接下來(lái),我們?cè)賮?lái)了解一下Nehalem微架構(gòu)有哪些新的特性。
#p#
● Nehalem新技術(shù)詳解
1 .QPI總線技術(shù)

Nehalem QPI總線示意圖
在Nehalem之前,Intel一直使用FSB前端總線作為處理器與芯片組連接的橋梁,雖然1600Mhz的前端總線對(duì)于桌面級(jí)數(shù)據(jù)處理來(lái)說(shuō)已是綽綽有余,但對(duì)于數(shù)據(jù)量龐大的服務(wù)器來(lái)說(shuō),其仍然是性能的瓶頸。Nehalem因此引入了全新的串行總線QPI,QPI總線是基于數(shù)據(jù)包傳輸(packet-based)。其擁有高帶寬、低延遲的點(diǎn)到點(diǎn)互連技術(shù)等特點(diǎn),它的傳輸速度可以達(dá)到每秒6.4G次數(shù)據(jù)。與FSB最大的不同在于,QPI不僅僅可以負(fù)責(zé)CPU與北橋通信,還可以實(shí)現(xiàn)CPU與CPU之間的相互連通。正如前文中所提到的Nehalem模塊化的特點(diǎn),對(duì)于不同市場(chǎng)的Nehalem,可以具有不同的QPI總線條數(shù)。比如桌面市場(chǎng)的CPU,具有1條或者半條QPI總線(半條可能是用10bit位寬或單向);DP服務(wù)器(雙CPU插座)的CPU,每個(gè)具有2條QPI總線;而MP服務(wù)器(4個(gè)或8個(gè)CPU插座)的,則每個(gè)具有4條或更多的QPI總線。
2.內(nèi)存控制器
在AMD整合了內(nèi)存控制器長(zhǎng)達(dá)5年之久后,Intel終于按捺不住了。為了進(jìn)一步降低處理器訪問(wèn)內(nèi)存的延遲以提高處理器的性能,Intel也引入了內(nèi)存控制器的概念。

Intel 整合內(nèi)存控制器(IMC)示意圖
Intel的整合內(nèi)存控制器(integrated memory controller),可以支持3通道的DDR3內(nèi)存運(yùn)行在1.33GT/s(DDR3-1333),這樣總共的峰值帶寬就可以達(dá)到32GB/s。三通道的DDR3內(nèi)存,其每通道都能夠獨(dú)立操作,其處理器所集成的內(nèi)存控制器需要亂序執(zhí)行來(lái)降低延遲。
不過(guò),高性能也是有高付出的,在高端平臺(tái)上,必須要三條DDR3內(nèi)存才能夠打開(kāi)三通道,而且三通道內(nèi)存也并沒(méi)有加入DDR2的設(shè)計(jì),因此用戶只能夠選擇DDR3內(nèi)存來(lái)感受內(nèi)存延遲降低的快感。
3.同步多線程技術(shù)
自從奔騰4時(shí)期開(kāi)始,超線程技術(shù)便已經(jīng)是家喻戶曉了。在當(dāng)時(shí)31級(jí)流水線的P4上面,為了提高處理器的性能,細(xì)化的流水線可以操作不同的任務(wù)進(jìn)程。然而,在14級(jí)流水線下的Core上面,超線程技術(shù)消失了。不過(guò)這一切都是暫時(shí)的。因?yàn)镹ehalem又重新引入了類似于·超線程技術(shù)的同步多線程技術(shù)。

Nehalem同步多線程技術(shù)圖解
Nehalem的同步多線程(Simultaneous Multi-Threading,SMT)是2-way的,每核心可以同時(shí)執(zhí)行2個(gè)線程。這樣就可以壓縮多任務(wù)處理時(shí)所需要的總時(shí)間。同步多線程功能的好處是只需要消耗很小的核心面積代價(jià),就可以在多任務(wù)的情況下提供顯著的性能提升,比起完全再添加一個(gè)物理核心來(lái)說(shuō)要?jiǎng)澦愕枚?。并且,Nehalem因?yàn)長(zhǎng)3大緩存的設(shè)計(jì)及內(nèi)存控制器的集成使之擁有了更大的緩存和更大的內(nèi)存帶寬,而且基于Core微架構(gòu)中表現(xiàn)優(yōu)秀的分支預(yù)測(cè)設(shè)計(jì)能夠更加有效的發(fā)揮多線程的性能。
4.緩存結(jié)構(gòu)
在早期的奔騰D時(shí)代,由于2顆核心之間互相獨(dú)立,因此其之間的數(shù)據(jù)調(diào)配需要通過(guò)前端總線來(lái)進(jìn)行,這使得數(shù)據(jù)的處理存在非常高的延遲。在Core時(shí)代,這一情況有所好轉(zhuǎn),因?yàn)镃ore核心共享了L2緩存,這使得數(shù)據(jù)處理延遲大大降低。而在Nehalem上,我們又看見(jiàn)了一種新的緩存管理機(jī)制,包含式緩存。

Nehalem緩存結(jié)構(gòu)
Nehalem上,8MB的L3對(duì)于前兩級(jí)來(lái)說(shuō),是完全包含式的,并且由4個(gè)核心共享,其可以處理幾乎所有的一致性流量問(wèn)題,而不需要打攪到每個(gè)獨(dú)立核心的私有緩存。如果在L3中發(fā)生命中失敗,那么要訪問(wèn)的數(shù)據(jù)就肯定也不在任何一個(gè)L2和L1中,不需要偵聽(tīng)其它內(nèi)核。另一方面,Nehalem的L3對(duì)于緩存命中成功,也扮演著偵聽(tīng)過(guò)濾器的角色。在Nehalem的L3中的每一個(gè)緩存行里,有4 bit是用來(lái)做核心確認(rèn)的,表明是哪一個(gè)核心在它的私有緩存里具有這個(gè)行的數(shù)據(jù)備份。如果一個(gè)核心確認(rèn)位被設(shè)置成0,則那個(gè)核心就不具有該行的數(shù)據(jù)備份。Nehalem使用的是MESIF緩存一致性協(xié)議(MESIF cache coherency protocol),如果兩個(gè)以上核心的確認(rèn)位都有效(設(shè)置成1),那么該緩存行就被確定是未被修改的,任何一個(gè)內(nèi)核的緩存行都不能夠進(jìn)入更改模式。當(dāng)L3緩存命中,而4個(gè)核心確認(rèn)位都是0時(shí),就不需要對(duì)其它內(nèi)核做偵聽(tīng);而只有1個(gè)位是有效時(shí),則只需要偵聽(tīng)那一個(gè)核心。這兩種技術(shù)的聯(lián)合使用,使得L3可以盡可能的讓每個(gè)核心避免數(shù)據(jù)一致性錯(cuò)誤,這樣就給出更多的實(shí)際帶寬。
Nehalem的每個(gè)核心有64KB L1和256KB 必須在L3 緩存中保留數(shù)據(jù),這就意味著在8MB的L3中,有1-1.25MB的數(shù)據(jù)是前兩級(jí)緩存中也有的數(shù)據(jù)。這也恰恰就是包含式緩存額外的開(kāi)銷。
寫(xiě)在最后:
從對(duì)Nehalem詳細(xì)的技術(shù)解析來(lái)看,它無(wú)論是對(duì)Core架構(gòu)的一個(gè)改進(jìn)也好,還是對(duì)Core的一個(gè)全面革新,其強(qiáng)勁的性能飛躍已是一個(gè)不爭(zhēng)的事實(shí)。雖然在COMPUTEX 2008展會(huì)上我們已經(jīng)看見(jiàn)了Nehalem的工程樣品的實(shí)物展示,但更進(jìn)一步的詳細(xì)性能測(cè)試恐怕也只有在第四季度發(fā)布之前才能夠得以真正的揭曉
相關(guān)文章

AMD 銳龍 9 9955HX3D首測(cè):單核多核一路領(lǐng)先
新一代筆記本正在陸續(xù)到來(lái),HotHardware搶先拿到了一臺(tái)微星的泰坦18 Pro,簡(jiǎn)單測(cè)試了其首發(fā)配備的AMD銳龍9 9955HX3D,展現(xiàn)了新一代X3D旗艦的威力2025-03-28
游戲裝機(jī)不花冤枉錢! 銳龍5 9600X性價(jià)比完勝酷睿Ultra 7 265K
花更多的錢,是不是真的能換來(lái)更好的游戲體驗(yàn)?咱今天就來(lái)嘮嘮這個(gè)事兒,看看這錢到底該不該花,接下來(lái)我們不妨拿競(jìng)品高端定位的酷睿Ultra 7 265K來(lái)和銳龍5 9600X進(jìn)行一個(gè)對(duì)2025-03-25
AMD銳龍7 9700X板U套裝推薦:輕松獲得僅次于9800X3D的游戲性能
銳龍7 9700X的首發(fā)上市價(jià)格為2549元,現(xiàn)在該產(chǎn)品也大幅降價(jià)到1999元,性價(jià)比非常誘人,今天我們就來(lái)看看AMD銳龍7 9700X板U套裝推薦2025-03-17
銳龍7 7800X3D實(shí)力完勝i9-14900K! 3000元內(nèi)游戲CPU推薦
在當(dāng)前3000元以內(nèi),最熱門的游戲CPU莫過(guò)于銳龍7 7800X3D和酷睿i9-14900K,那么這兩款產(chǎn)品究竟誰(shuí)性價(jià)比更高呢?下面我們就來(lái)看看詳細(xì)測(cè)評(píng)2025-03-12
游戲與生產(chǎn)力雙高 綜合實(shí)力最強(qiáng)! 銳龍9 9950X3D處理器首發(fā)評(píng)測(cè)
AMD終于將銳龍 9000系列的王牌產(chǎn)品——銳龍 9 9950X3D拿了出來(lái),在搭載了超大容量的3D緩存之后,這顆處理器可以說(shuō)是兼顧了游戲以及創(chuàng)作能力,同時(shí)也是消費(fèi)級(jí)銳龍 9000處理2025-03-12
64位和32位CPU有什么區(qū)別? 電腦32位和62位系統(tǒng)區(qū)別介紹
在選購(gòu)或使用電腦時(shí),我們經(jīng)常會(huì)聽(tīng)到“32位”和“64位”這樣的術(shù)語(yǔ),那么,這兩個(gè)概念到底是什么意思?它們對(duì)計(jì)算機(jī)的性能和兼容性有什么影響?詳細(xì)請(qǐng)看下文介紹2025-03-07
為什么主流裝機(jī)玩家都選AMD 銳龍5 9600X? 五大理由告訴你
你可能會(huì)奇怪,為什么最近Zen5架構(gòu)的銳龍9000系列桌面處理器在主流玩家群體中的口碑這么好;為什么在追求性價(jià)比搭配,期望用最少花費(fèi)實(shí)現(xiàn)盡可能好游戲體驗(yàn)的玩家群體中,AM2025-02-28
有銳龍7 9700X還考慮什么酷睿i9/Ultra 9處理器? 性能級(jí)游戲裝機(jī)推薦
別看銳龍7 9700X只是一款2000元價(jià)位的產(chǎn)品,但是具備了挑戰(zhàn)競(jìng)品旗艦酷睿i9-14900K和酷睿Ultra 9 285K的強(qiáng)悍實(shí)力,具體差距如何?請(qǐng)看下文測(cè)評(píng)2025-02-27
CPU散熱你了解多少? CPU 熱節(jié)流機(jī)制的利與弊分析
CPU熱節(jié)流是指當(dāng)處理器在運(yùn)行過(guò)程中產(chǎn)生過(guò)多的熱量,達(dá)到一定的溫度閾值時(shí),為了防止過(guò)熱和損壞,CPU會(huì)自動(dòng)降低時(shí)鐘速度和性能的技術(shù),下面我們就來(lái)看看它的利弊2025-02-19
CPU 的 L1、L2 和 L3 Cache 在現(xiàn)代計(jì)算機(jī)架構(gòu)中起著關(guān)鍵作用,它們的設(shè)計(jì)、大小、位置以及讀寫(xiě)速度和延遲都有顯著的差異,詳細(xì)請(qǐng)看下文介紹2025-02-19











