欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

英特爾新一代顯卡架構Larrabee解析

互聯(lián)網(wǎng)   發(fā)布時間:2009-04-21 01:32:25   作者:佚名   我要評論
  眾所周知,現(xiàn)在的獨立顯卡市場是NVIDIA和AMD-ATI兩家的天下。盡管INTEL憑借整合圖形芯片組的優(yōu)勢占據(jù)了集成顯卡市場的半壁江山,但獨立顯卡一直是INTEL心中難言的痛,它一直在尋找進軍獨立顯卡市場的切入點。早在1998年2月,INTE

  獨特的顯存架構
  在顯存控制器方面, AMD和NVIDIA的GPU使用的是64bit的顯存控制器,并且在芯片內只有一組控制器。鑒于INTEL的Larrabee采用多核心設計,內部需要更多的顯存帶寬, Larrabee將采用1024-bit雙向環(huán)形總線,單向傳輸位寬為512-bit。在加上GDDR5顯存的助力,Larrabee將會有不錯的性能表現(xiàn)。目前的GDDR5顯存顆粒還十分昂貴,不過相信到了2010年的時候,會迅速普及,價格自然也會降低到一個比較合理的價位。

  英特爾新一代顯卡架構Larrabee解析(3)
嵌入式存儲架構
  值得一提的是,AMD公司已經(jīng)在它的GPU中放棄了他們的環(huán)形顯存控制器架構,轉而采用更先進的片上嵌入式存儲,因為他們的GPU需要更加強大的存儲帶寬。AMD認為環(huán)形的總線會將數(shù)據(jù)直接排擠送出,這種線路設計會相對簡單許多,它可以大幅減少芯片的復雜程度,不過他的缺點也比較明顯,它需要一根很長的電線貫穿整個芯片。并且無論接收方是否需要,都為所有的接收端提供了較高的數(shù)據(jù)帶寬。因此如果內存接收方需要更高的內存,或者需要提高系統(tǒng)總線的帶寬的話,提供一條雙向的帶寬就可以輕松解決。INTEL可能有比AMD更高明的環(huán)形總線方案。因為Larrabee支持超高速相關性緩存,并且可以跨越核心通信。L2高速緩存可以被分割為2個部分,同時可以用環(huán)形總線保持他們數(shù)據(jù)的一致性。這樣可以促進信息更好的被傳遞,也讓繁重的數(shù)據(jù)處理變得更加輕松。如果Larrabee所有的處理核心都通過一個雙向的環(huán)形總線連接,每個方向提供512bit的位寬。這條總線的工作頻率,可能與Larrabee的主頻相同。我們假設一下Larrabee的運行頻率為2GHz以上,那么這條總線將會提供非常高的帶寬吞吐量,而且它的工作頻率要遠遠高于AMD的GPU。
  SLI、交火不算什么,Larrabee的多內核設計!
  目前的GPU全是采用單核芯片設計,圖形顯示系統(tǒng)要想達到更高的性能只能采用雙GPU設計或雙卡、四卡并聯(lián)運行方案。這在成本上往往是用戶所不能接受的。而在Larrabee上,INTEL采用多核心設計,這也將是首款采用多核設計的GPU。根據(jù)INTEL初步的計算,最初Larrabee的核心數(shù)量將會是16個核心,今后按照翻倍的步進也許會升級到32個核心。這是因為要應付目前主流的3D圖形的運算,起步至少要16個核心才可以從容應對,但是24個核心的產(chǎn)品也是有可能的,畢竟以目前的生產(chǎn)工藝來看做到這一點完全是沒有問題的。

  英特爾新一代顯卡架構Larrabee解析(4)
半導體芯片核心
  目前我們的半導體芯片核心面積可以做到286平方毫米,NVIDIA的GT200和AMD的RV770就處在這個層次上。因此在Larrabee集成更多的處理核心應該并非難事。假設INTEL要想集成40個處理核心,那么至少需要572平方毫米的芯片。事實上NVIDIA的GT200使用的是65nm制造工藝技術,如果INTEL用最為先進的32nm制造工藝技術,那么芯片的尺寸還會大幅縮小。就目前的INTEL 45nm制造工藝來說,芯片的核心面積可以減小至少50%,但是根據(jù)INTEL的說法,只要轉產(chǎn)到45nm,甚至可以減小到60~70%的樣子。屆時Larrabee將能集成更多的處理核心。INTEL推測,40個核心45nm版本的Larrabee其核心面積約為370平方毫米。像NVIDIA的產(chǎn)品線一樣,INTEL也會將芯片根據(jù)核心數(shù)量分成不同的檔次,面向不同人群推出。  

  英特爾新一代顯卡架構Larrabee解析(4)
游戲性能與核心數(shù)量的增長趨勢
  根據(jù)INTEL的說法,這種特性在《戰(zhàn)爭機器》、《F.E.A.R.》、《半條命2:第二章》等游戲中表現(xiàn)最明顯,實際性能基本隨著核心數(shù)量呈線性增長趨勢。如果8核心的性能算作1,那么16核心就約等于2、24核心約等于3、32核心約等于4。如果一直這樣增長下去,那Larrabee的實力將是恐怖的。不過INTEL也承認,隨著核心數(shù)量的繼續(xù)增多,這種線性關系會逐漸減弱,到了40核心只有3.8-3.9,48核心就僅僅4.4-4.6了,64核心甚至可能都不到7。因此如果解決多核心中復雜的數(shù)據(jù)共享問題及功耗問題,這都是INTEL需要面對的。
  除此之外,Larrabee還同時能夠支持4路硬件線程。而Larrabee也能夠在CPU內核心進行4組套轉換。INTEL CPU比如Nehalem都支持2-way多線程,Larrabee則為4-way multi-threadCPU。而GPU產(chǎn)品中支持多線程的則很少。GPU產(chǎn)品通常配備有數(shù)十以上的線程硬件轉換功能。比如GeForce GTX 200(GT200)在32寄存器/線程時轉換為16warp(NVIDIA用語)。根據(jù)Larrabee的資料,硬件多線程設計是為了在進行編譯的時候減少二級緩存的等待時間為目的。這與GPU的硬件多threading不同。 另外 Larrabee的硬件多線程比GPU少的原因是架構上的不同。值得注意的是,INTEL指出Larrabee“全面支持IEEE標準單、雙精度浮點運算”,但沒有透露具體指標。AMD和NVIDIA顯卡在單精度方面表現(xiàn)都很出色,RV770系列已經(jīng)輕松超過1TFlops,不過雙精度性能還相差甚遠,比如Tesla的單精度性能可達900-1000GFlops,雙精度就只有100GFlops左右。如果出Larrabee全雙精度浮點運算的話,那么它的通用運算能力要遠遠強于當前的GPU。
  盡管INTEL進軍獨立顯卡市場的野心已然明確,但據(jù)消息來源表示,目前很多細節(jié)還處于混沌狀態(tài)。INTEL將會在今年第四季度公開發(fā)布詳細完整的獨立顯卡產(chǎn)品線roadmap。到那個時候,Larrabee顯卡才會變得更加清晰。相較于GPGPU來說,它最大的優(yōu)勢就在于采用了大家熟悉的x86架構。目前多數(shù)的軟件工程師仍不熟悉如何將GPU應用在多任務處理及平行運算上,這點就占了不少優(yōu)勢。如果順利的話,INTEL將肯定在2008年展示Larrabee系列獨立顯卡。根據(jù)比較可靠的消息來看,Larrabee項目其實是隸屬于Tera-Scale計劃(“萬億級別計算研究項目”。這個計劃的重要工作內容,就是分析未來10年內人們對電腦及服務器的應用需求。這一計劃涉及的研究領域非常廣泛,共有超過 400 間大學、美國國防部高等研究計劃局 (DARPA) ,以及像是微軟與惠普等相關公司,共同為 Larrabee 應用進行研究。


相關文章

最新評論