英特爾Nehalem技術(shù)詳解

互聯(lián)網(wǎng) 發(fā)布時間：2009-04-21 01:32:30 作者：佚名

　　Intel 4系芯片組一經(jīng)發(fā)布，雙45平臺便逐漸的成為了玩家們關(guān)注焦點。更為驚喜的是，幾大一線廠商方面，也在通過大幅度降價的手段來吸引消費者們的注意。不過，細心的消費者們都會發(fā)現(xiàn)，P45芯片組與P35芯片組相比，其性能上并沒有

●　Nehalem新技術(shù)詳解

1 .QPI總線技術(shù)

比酷睿強在哪英特爾Nehalem技術(shù)詳解(2)
Nehalem QPI總線示意圖

　　在Nehalem之前，Intel一直使用FSB前端總線作為處理器與芯片組連接的橋梁，雖然1600Mhz的前端總線對于桌面級數(shù)據(jù)處理來說已是綽綽有余，但對于數(shù)據(jù)量龐大的服務器來說，其仍然是性能的瓶頸。Nehalem因此引入了全新的串行總線QPI，QPI總線是基于數(shù)據(jù)包傳輸（packet-based）。其擁有高帶寬、低延遲的點到點互連技術(shù)等特點，它的傳輸速度可以達到每秒6.4G次數(shù)據(jù)。與FSB最大的不同在于，QPI不僅僅可以負責CPU與北橋通信，還可以實現(xiàn)CPU與CPU之間的相互連通。正如前文中所提到的Nehalem模塊化的特點，對于不同市場的Nehalem，可以具有不同的QPI總線條數(shù)。比如桌面市場的CPU，具有1條或者半條QPI總線（半條可能是用10bit位寬或單向）；DP服務器（雙CPU插座）的CPU，每個具有2條QPI總線；而MP服務器（4個或8個CPU插座）的，則每個具有4條或更多的QPI總線。

2.內(nèi)存控制器

　　在AMD整合了內(nèi)存控制器長達5年之久后，Intel終于按捺不住了。為了進一步降低處理器訪問內(nèi)存的延遲以提高處理器的性能，Intel也引入了內(nèi)存控制器的概念。

比酷睿強在哪英特爾Nehalem技術(shù)詳解(2)
Intel 整合內(nèi)存控制器（IMC)示意圖

　　Intel的整合內(nèi)存控制器（integrated memory controller），可以支持3通道的DDR3內(nèi)存運行在1.33GT/s（DDR3-1333），這樣總共的峰值帶寬就可以達到32GB/s。三通道的DDR3內(nèi)存，其每通道都能夠獨立操作，其處理器所集成的內(nèi)存控制器需要亂序執(zhí)行來降低延遲。

　　不過，高性能也是有高付出的，在高端平臺上，必須要三條DDR3內(nèi)存才能夠打開三通道，而且三通道內(nèi)存也并沒有加入DDR2的設(shè)計，因此用戶只能夠選擇DDR3內(nèi)存來感受內(nèi)存延遲降低的快感。

3.同步多線程技術(shù)

　　自從奔騰4時期開始，超線程技術(shù)便已經(jīng)是家喻戶曉了。在當時31級流水線的P4上面，為了提高處理器的性能，細化的流水線可以操作不同的任務進程。然而，在14級流水線下的Core上面，超線程技術(shù)消失了。不過這一切都是暫時的。因為Nehalem又重新引入了類似于·超線程技術(shù)的同步多線程技術(shù)。

比酷睿強在哪英特爾Nehalem技術(shù)詳解(2)
Nehalem同步多線程技術(shù)圖解

　　Nehalem的同步多線程（Simultaneous Multi-Threading，SMT）是2-way的，每核心可以同時執(zhí)行2個線程。這樣就可以壓縮多任務處理時所需要的總時間。同步多線程功能的好處是只需要消耗很小的核心面積代價，就可以在多任務的情況下提供顯著的性能提升，比起完全再添加一個物理核心來說要劃算得多。并且，Nehalem因為L3大緩存的設(shè)計及內(nèi)存控制器的集成使之擁有了更大的緩存和更大的內(nèi)存帶寬，而且基于Core微架構(gòu)中表現(xiàn)優(yōu)秀的分支預測設(shè)計能夠更加有效的發(fā)揮多線程的性能。

4.緩存結(jié)構(gòu)

　　在早期的奔騰D時代，由于2顆核心之間互相獨立，因此其之間的數(shù)據(jù)調(diào)配需要通過前端總線來進行，這使得數(shù)據(jù)的處理存在非常高的延遲。在Core時代，這一情況有所好轉(zhuǎn)，因為Core核心共享了L2緩存，這使得數(shù)據(jù)處理延遲大大降低。而在Nehalem上，我們又看見了一種新的緩存管理機制，包含式緩存。

比酷睿強在哪英特爾Nehalem技術(shù)詳解(2)
Nehalem緩存結(jié)構(gòu)

　　Nehalem上，8MB的L3對于前兩級來說，是完全包含式的，并且由4個核心共享，其可以處理幾乎所有的一致性流量問題，而不需要打攪到每個獨立核心的私有緩存。如果在L3中發(fā)生命中失敗，那么要訪問的數(shù)據(jù)就肯定也不在任何一個L2和L1中，不需要偵聽其它內(nèi)核。另一方面，Nehalem的L3對于緩存命中成功，也扮演著偵聽過濾器的角色。在Nehalem的L3中的每一個緩存行里，有4 bit是用來做核心確認的，表明是哪一個核心在它的私有緩存里具有這個行的數(shù)據(jù)備份。如果一個核心確認位被設(shè)置成0，則那個核心就不具有該行的數(shù)據(jù)備份。Nehalem使用的是MESIF緩存一致性協(xié)議（MESIF cache coherency protocol），如果兩個以上核心的確認位都有效（設(shè)置成1），那么該緩存行就被確定是未被修改的，任何一個內(nèi)核的緩存行都不能夠進入更改模式。當L3緩存命中，而4個核心確認位都是0時，就不需要對其它內(nèi)核做偵聽；而只有1個位是有效時，則只需要偵聽那一個核心。這兩種技術(shù)的聯(lián)合使用，使得L3可以盡可能的讓每個核心避免數(shù)據(jù)一致性錯誤，這樣就給出更多的實際帶寬。
　　Nehalem的每個核心有64KB L1和256KB 必須在L3 緩存中保留數(shù)據(jù)，這就意味著在8MB的L3中，有1-1.25MB的數(shù)據(jù)是前兩級緩存中也有的數(shù)據(jù)。這也恰恰就是包含式緩存額外的開銷。

寫在最后：

　　從對Nehalem詳細的技術(shù)解析來看，它無論是對Core架構(gòu)的一個改進也好，還是對Core的一個全面革新，其強勁的性能飛躍已是一個不爭的事實。雖然在COMPUTEX 2008展會上我們已經(jīng)看見了Nehalem的工程樣品的實物展示，但更進一步的詳細性能測試恐怕也只有在第四季度發(fā)布之前才能夠得以真正的揭曉

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

英特爾Nehalem技術(shù)詳解

相關(guān)文章

最新評論

文章分類

大家感興趣的內(nèi)容

最近更新的內(nèi)容