服務(wù)器技術(shù)全面解析
什么是服務(wù)器
服務(wù)器是一種高性能計算機,作為網(wǎng)絡(luò)的節(jié)點,存儲、處理網(wǎng)絡(luò)上80%的數(shù)據(jù)、信息,因此也被稱為網(wǎng)絡(luò)的靈魂。做一個形象的比喻:服務(wù)器就像是郵局的交換機,而微機、筆記本、PDA、手機等固定或移動的網(wǎng)絡(luò)終端,就如散落在家庭、各種辦公場所、公共場所等處的電話機。我們與外界日常的生活、工作中的電話交流、溝通,必須經(jīng)過交換機,才能到達目標(biāo)電話;同樣如此,網(wǎng)絡(luò)終端設(shè)備如家庭、企業(yè)中的微機上網(wǎng),獲取資訊,與外界溝通、娛樂等,也必須經(jīng)過服務(wù)器,因此也可以說是服務(wù)器在“組織”和“領(lǐng)導(dǎo)”這些設(shè)備。
服務(wù)器的構(gòu)成與微機基本相似,有處理器、硬盤、內(nèi)存、系統(tǒng)總線等,它們是針對具體的網(wǎng)絡(luò)應(yīng)用特別制定的,因而服務(wù)器與微機在處理能力、穩(wěn)定性、可靠性、安全性、可擴展性、可管理性等方面存在差異很大。尤其是隨著信息技術(shù)的進步,網(wǎng)絡(luò)的作用越來越明顯,對自己信息系統(tǒng)的數(shù)據(jù)處理能力、安全性等的要求也越來越高,如果您在進行電子商務(wù)的過程中被黑客竊走密碼、損失關(guān)鍵商業(yè)數(shù)據(jù);如果您在自動取款機上不能正常的存取,您應(yīng)該考慮在這些設(shè)備系統(tǒng)的幕后指揮者————服務(wù)器,而不是埋怨工作人員的素質(zhì)和其他客觀條件的限制。
服務(wù)器技術(shù)之EMP技術(shù)
目前服務(wù)器的技術(shù)熱點主要有:IRISC與CISC技術(shù)、處理器技術(shù)、多處理器技術(shù)(AMP技術(shù)、SMP技術(shù)、MPP技術(shù)、COMA技術(shù)、集群技術(shù)和NUMA技術(shù))、SCSI接口技術(shù)、智能I/O技術(shù)、容錯技術(shù)、磁盤陣列技術(shù)、熱插拔技術(shù)、雙機熱備份。
服務(wù)器在網(wǎng)絡(luò)中承擔(dān)傳輸和處理大量數(shù)據(jù)的任務(wù),要具備高可伸縮性、高可靠性、高可用性和高可管理性。IA-64體系將帶動服務(wù)器技術(shù)特性的提高,如高性能CPU、多處理器技術(shù)、總線和內(nèi)存技術(shù)、容錯技術(shù)、群集技術(shù)、硬件管理接口、均衡服務(wù)器平臺技術(shù)等。
EMP(Emergency Management Port)技術(shù)
EMP(Emergency Management Port)技術(shù)也是一種遠(yuǎn)程管理技術(shù),利用EMP技術(shù)可以在客戶端通過電話線或電纜直接連接到服務(wù)器,來對服務(wù)器實施異地操作,如關(guān)閉操作系統(tǒng)、啟動電源、關(guān)閉電源、捕捉服務(wù)器屏幕、配置服務(wù)器BIOS等操作,是一種很好的實現(xiàn)快速服務(wù)和節(jié)省維護費用的技術(shù)手段。 應(yīng)用ISC和EMP兩種技術(shù)可以實現(xiàn)對服務(wù)器進行遠(yuǎn)程監(jiān)控管理。
服務(wù)器技術(shù)之RAID冗余磁盤陣列技術(shù)
目前服務(wù)器的技術(shù)熱點主要有:IRISC與CISC技術(shù)、處理器技術(shù)、多處理器技術(shù)(AMP技術(shù)、SMP技術(shù)、MPP技術(shù)、COMA技術(shù)、集群技術(shù)和NUMA技術(shù))、SCSI接口技術(shù)、智能I/O技術(shù)、容錯技術(shù)、磁盤陣列技術(shù)、熱插拔技術(shù)、雙機熱備份。
服務(wù)器在網(wǎng)絡(luò)中承擔(dān)傳輸和處理大量數(shù)據(jù)的任務(wù),要具備高可伸縮性、高可靠性、高可用性和高可管理性。IA-64體系將帶動服務(wù)器技術(shù)特性的提高,如高性能CPU、多處理器技術(shù)、總線和內(nèi)存技術(shù)、容錯技術(shù)、群集技術(shù)、硬件管理接口、均衡服務(wù)器平臺技術(shù)等。
RAID(Redundant Array of Independent Disks)冗余磁盤陣列技術(shù)
RAID技術(shù)是一種工業(yè)標(biāo)準(zhǔn),各廠商對RAID級別的定義也不盡相同。目前對RAID級別的定義可以獲得業(yè)界廣泛認(rèn)同的有4種,RAID 0、RAID 1、RAID 0+1和RAID 5。
RAID 0是無數(shù)據(jù)冗余的存儲空間條帶化,具有成本低、讀寫性能極高、存儲空間利用率高等特點,適用于Video/Audio信號存儲、臨時文件的轉(zhuǎn)儲等對速度要求極其嚴(yán)格的特殊應(yīng)用。但由于沒有數(shù)據(jù)冗余,其安全性大大降低,構(gòu)成陣列的任何一塊硬盤的損壞都將帶來災(zāi)難性的數(shù)據(jù)損失。所以,若在RAID 0中配置4塊以上的硬盤,對于一般應(yīng)用來說是不明智的。
RAID 1是兩塊硬盤數(shù)據(jù)完全鏡像,安全性好,技術(shù)簡單,管理方便,讀寫性能均好。但它無法擴展(單塊硬盤容量),數(shù)據(jù)空間浪費大,嚴(yán)格意義上說,不應(yīng)稱之為"陣列"。
RAID 0+1綜合了RAID 0和RAID 1的特點,獨立磁盤配置成RAID 0,兩套完整的RAID 0互相鏡像。它的讀寫性能出色,安全性高,但構(gòu)建陣列的成本投入大,數(shù)據(jù)空間利用率低,不能稱之為經(jīng)濟高效的方案。
負(fù)載均衡技術(shù)概覽
當(dāng)前,無論在企業(yè)網(wǎng)、園區(qū)網(wǎng)還是在廣域網(wǎng)如Internet上,業(yè)務(wù)量的發(fā)展都超出了過去最樂觀的估計,上網(wǎng)熱潮風(fēng)起云涌,新的應(yīng)用層出不窮,即使按照當(dāng)時最優(yōu)配置建設(shè)的網(wǎng)絡(luò),也很快會感到吃不消。尤其是各個網(wǎng)絡(luò)的核心部分,其數(shù)據(jù)流量和計算強度之大,使得單一設(shè)備根本無法承擔(dān),而如何在完成同樣功能的多個網(wǎng)絡(luò)設(shè)備之間實現(xiàn)合理的業(yè)務(wù)量分配,使之不致于出現(xiàn)一臺設(shè)備過忙、而別的設(shè)備卻未充分發(fā)揮處理能力的情況,就成了一個問題,負(fù)載均衡機制也因此應(yīng)運而生。
負(fù)載均衡建立在現(xiàn)有網(wǎng)絡(luò)結(jié)構(gòu)之上,它提供了一種廉價有效的方法擴展服務(wù)器帶寬和增加吞吐量,加強網(wǎng)絡(luò)數(shù)據(jù)處理能力,提高網(wǎng)絡(luò)的靈活性和可用性。它主要完成以下任務(wù):解決網(wǎng)絡(luò)擁塞問題,服務(wù)就近提供,實現(xiàn)地理位置無關(guān)性 ;為用戶提供更好的訪問質(zhì)量;提高服務(wù)器響應(yīng)速度;提高服務(wù)器及其他資源的利用效率;避免了網(wǎng)絡(luò)關(guān)鍵部位出現(xiàn)單點失效。
對一個網(wǎng)絡(luò)的負(fù)載均衡應(yīng)用,可以從網(wǎng)絡(luò)的不同層次入手,具體情況要看對網(wǎng)絡(luò)瓶頸所在之處的具體分析,大體上不外乎從傳輸鏈路聚合、采用更高層網(wǎng)絡(luò)交換技術(shù)和設(shè)置服務(wù)器集群策略三個角度實現(xiàn)。
■傳輸鏈路聚合
為了支持與日俱增的高帶寬應(yīng)用,越來越多的PC機使用更加快速的鏈路連入網(wǎng)絡(luò)。而網(wǎng)絡(luò)中的業(yè)務(wù)量分布是不平衡的,核心高、邊緣低,關(guān)鍵部門高、一般部門低。伴隨計算機處理能力的大幅度提高,人們對多工作組局域網(wǎng)的處理能力有了更高的要求。當(dāng)企業(yè)內(nèi)部對高帶寬應(yīng)用需求不斷增大時(例如Web訪問、文檔傳輸及內(nèi)部網(wǎng)連接),局域網(wǎng)核心部位的數(shù)據(jù)接口將產(chǎn)生瓶頸問題,瓶頸延長了客戶應(yīng)用請求的響應(yīng)時間。并且局域網(wǎng)具有分散特性,網(wǎng)絡(luò)本身并沒有針對服務(wù)器的保護措施,一個無意的動作(像一腳踢掉網(wǎng)線的插頭)就會讓服務(wù)器與網(wǎng)絡(luò)斷開。
通常,解決瓶頸問題采用的對策是提高服務(wù)器鏈路的容量,使其超出目前的需求。例如可以由快速以太網(wǎng)升級到千兆以太網(wǎng)。對于大型企業(yè)來說,采用升級技術(shù)是一種長遠(yuǎn)的、有前景的解決方案。然而對于許多企業(yè),當(dāng)需求還沒有大到非得花費大量的金錢和時間進行升級時,使用升級技術(shù)就顯得大材小用了。在這種情況下,鏈路聚合技術(shù)為消除傳輸鏈路上的瓶頸與不安全因素提供了成本低廉的解決方案,
鏈路聚合技術(shù),將多個線路的傳輸容量融合成一個單一的邏輯連接。當(dāng)原有的線路滿足不了需求,而單一線路的升級又太昂貴或難以實現(xiàn)時,就要采用多線路的解決方案了。目前有4種鏈路聚合技術(shù)可以將多條線路“捆綁”起來。同步IMUX系統(tǒng)工作在T1/E1的比特層,利用多個同步的DS1信道傳輸數(shù)據(jù),來實現(xiàn)負(fù)載均衡。IMA是另外一種多線路的反向多路復(fù)用技術(shù),工作在信元級,能夠運行在使用ATM路由器的平臺上。用路由器來實現(xiàn)多線路是一種流行的鏈路聚合技術(shù),路由器可以根據(jù)已知的目的地址的緩沖(cache)大小,將分組分配給各個平行的鏈路,也可以采用循環(huán)分配的方法來向線路分發(fā)分組。多重鏈路PPP,又稱MP或MLP,是應(yīng)用于使用PPP封裝數(shù)據(jù)鏈路的路由器負(fù)載平衡技術(shù)。MP可以將大的PPP數(shù)據(jù)包分解成小的數(shù)據(jù)段,再將其分發(fā)給平行的多個線路,還可以根據(jù)當(dāng)前的鏈路利用率來動態(tài)地分配撥號線路。這樣做盡管速度很慢,因為數(shù)據(jù)包分段和附加的緩沖都增加時延,但可以在低速的線路上運行得很好。
鏈路聚合系統(tǒng)增加了網(wǎng)絡(luò)的復(fù)雜性,但也提高了網(wǎng)絡(luò)的可靠性,使人們可以在服務(wù)器等關(guān)鍵LAN段的線路上采用冗余路由。對于IP系統(tǒng),可以考慮采用VRRP(虛擬路由冗余協(xié)議)。VRRP可以生成一個虛擬缺省的網(wǎng)關(guān)地址,當(dāng)主路由器無法接通時,備用路由器就會采用這個地址,使LAN通信得以繼續(xù)??傊?,當(dāng)主要線路的性能必需提高而單條線路的升級又不可行時,可以采用鏈路聚合技術(shù)。
更高層交換
大型的網(wǎng)絡(luò)一般都是由大量專用技術(shù)設(shè)備組成的,如包括防火墻、路由器、第2層/3層交換機、負(fù)載均衡設(shè)備、緩沖服務(wù)器和Web服務(wù)器等。如何將這些技術(shù)設(shè)備有機地組合在一起,是一個直接影響到網(wǎng)絡(luò)性能的關(guān)鍵性問題?,F(xiàn)在許多交換機提供第四層交換功能,可以將一個外部IP地址映射為多個內(nèi)部IP地址,對每次TCP連接請求動態(tài)使用其中一個內(nèi)部地址,達到負(fù)載均衡的目的。有的協(xié)議內(nèi)部支持與負(fù)載均衡相關(guān)的功能,例如HTTP協(xié)議中的重定向能力。
Web內(nèi)容交換技術(shù),即URL交換或七層交換技術(shù),提供了一種對訪問流量的高層控制方式。Web內(nèi)容交換技術(shù)檢查所有的HTTP報頭,根據(jù)報頭內(nèi)的信息來執(zhí)行負(fù)載均衡的決策,并可以根據(jù)這些信息來確定如何為個人主頁和圖像數(shù)據(jù)等內(nèi)容提供服務(wù)。它不是根據(jù)TCP端口號來進行控制的,所以不會造成訪問流量的滯留。如果Web服務(wù)器已經(jīng)為圖像服務(wù)、SSL對話、數(shù)據(jù)庫事務(wù)服務(wù)之類的特殊功能進行了優(yōu)化,那么,采用這個層次的流量控制將可以提高網(wǎng)絡(luò)的性能。目前,采用第七層交換技術(shù)的產(chǎn)品與方案,有黎明網(wǎng)絡(luò)的iSwitch、交換機,Cisco的CDN(內(nèi)容交換網(wǎng)絡(luò)系統(tǒng))等。
服務(wù)器群集解決方案
在某些情況下,例如,某網(wǎng)站內(nèi)部職員和外部客戶同時使用網(wǎng)站,而公司要將內(nèi)部職員的服務(wù)請求連接到一個較慢的服務(wù)器來為外部客戶提供更多的資源,這時就可以使用Web內(nèi)容交換技術(shù)。Web主機訪問控制設(shè)備也可以使用這種技術(shù)來降低硬件成本,因為它可以輕易地將訪問多個主機的用戶流量轉(zhuǎn)移給同一個Web服務(wù)器。如果用戶訪問量增加到一定程度,這些流量還可以被轉(zhuǎn)移到專用的Web服務(wù)器設(shè)備,雖然這種專用設(shè)備的成本較高,但是由于使用的是相同的Web內(nèi)容交換技術(shù)來控制流量,所以網(wǎng)絡(luò)的結(jié)構(gòu)框架就不用再進行改變了。
但是,使用Web內(nèi)容交換技術(shù)的負(fù)載均衡設(shè)備所能支持的標(biāo)準(zhǔn)和規(guī)則的數(shù)目有限,其采用的標(biāo)準(zhǔn)和規(guī)則的靈活性也有限。另外,負(fù)載均衡設(shè)備所能監(jiān)測到HTTP報頭的深度也是限制內(nèi)容交換能力的一個因素。如果所要找的信息在負(fù)載均衡設(shè)備所不能監(jiān)測的字段內(nèi),那內(nèi)容交換的作用就無法發(fā)揮。而且,內(nèi)容交換還受到能夠同時開啟的TCP連接數(shù)量以及TCP連接的建立和斷開比率的限制。另外,Web內(nèi)容交換技術(shù)還會占用大量的系統(tǒng)資源(包括內(nèi)存占用和處理器占用)。對Web內(nèi)容交換技術(shù)進行的測試表明,操縱Web內(nèi)容的吞吐量是很費力的,有時只能得到很小的性能改進。所以,網(wǎng)絡(luò)管理員必須認(rèn)真考慮投入與回報的問題。
■帶均衡策略的服務(wù)器群集
如今,服務(wù)器必須具備提供大量并發(fā)訪問服務(wù)的能力,其處理能力和I/O能力已經(jīng)成為提供服務(wù)的瓶頸。如果客戶的增多導(dǎo)致通信量超出了服務(wù)器能承受的范圍,那么其結(jié)果必然是――宕機。顯然,單臺服務(wù)器有限的性能不可能解決這個問題,一臺普通服務(wù)器的處理能力只能達到每秒幾萬個到幾十萬個請求,無法在一秒鐘內(nèi)處理上百萬個甚至更多的請求。但若能將10臺這樣的服務(wù)器組成一個系統(tǒng),并通過軟件技術(shù)將所有請求平均分配給所有服務(wù)器,那么這個系統(tǒng)就完全擁有每秒鐘處理幾百萬個甚至更多請求的能力。這就是利用服務(wù)器群集實現(xiàn)負(fù)載均衡的最初基本設(shè)計思想。
早期的服務(wù)器群集通常以光纖鏡像卡進行主從方式備份。令服務(wù)運營商頭疼的是關(guān)鍵性服務(wù)器或應(yīng)用較多、數(shù)據(jù)流量較大的服務(wù)器一般檔次不會太低,而服務(wù)運營商花了兩臺服務(wù)器的錢卻常常只得到一臺服務(wù)器的性能。新的解決方案見圖,通過LSANT(Load Sharing Network Address Transfer)將多臺服務(wù)器網(wǎng)卡的不同IP地址翻譯成一個VIP(Virtual IP)地址,使得每臺服務(wù)器均時時處于工作狀態(tài)。原來需要用小型機來完成的工作改由多臺PC服務(wù)器完成,這種彈性解決方案對投資保護的作用是相當(dāng)明顯的――既避免了小型機剛性升級所帶來的巨大設(shè)備投資,又避免了人員培訓(xùn)的重復(fù)投資。同時,服務(wù)運營商可以依據(jù)業(yè)務(wù)的需要隨時調(diào)整服務(wù)器的數(shù)量。
網(wǎng)絡(luò)負(fù)載均衡提高了諸如Web服務(wù)器、FTP服務(wù)器和其他關(guān)鍵任務(wù)服務(wù)器上的因特網(wǎng)服務(wù)器程序的可用性和可伸縮性。單一計算機可以提供有限級別的服務(wù)器可靠性和可伸縮性。但是,通過將兩個或兩個以上高級服務(wù)器的主機連成群集,網(wǎng)絡(luò)負(fù)載均衡就能夠提供關(guān)鍵任務(wù)服務(wù)器所需的可靠性和性能。
為了建立一個高負(fù)載的Web站點,必須使用多服務(wù)器的分布式結(jié)構(gòu)。上面提到的使用代理服務(wù)器和Web服務(wù)器相結(jié)合,或者兩臺Web服務(wù)器相互協(xié)作的方式也屬于多服務(wù)器的結(jié)構(gòu),但在這些多服務(wù)器的結(jié)構(gòu)中,每臺服務(wù)器所起到的作用是不同的,屬于非對稱的體系結(jié)構(gòu)。非對稱的服務(wù)器結(jié)構(gòu)中每個服務(wù)器起到的作用是不同的,例如一臺服務(wù)器用于提供靜態(tài)網(wǎng)頁,而另一臺用于提供動態(tài)網(wǎng)頁等等。這樣就使得網(wǎng)頁設(shè)計時就需要考慮不同服務(wù)器之間的關(guān)系,一旦要改變服務(wù)器之間的關(guān)系,就會使得某些網(wǎng)頁出現(xiàn)連接錯誤,不利于維護,可擴展性也較差。
能進行負(fù)載均衡的網(wǎng)絡(luò)設(shè)計結(jié)構(gòu)為對稱結(jié)構(gòu),在對稱結(jié)構(gòu)中每臺服務(wù)器都具備等價的地位,都可以單獨對外提供服務(wù)而無須其他服務(wù)器的輔助。然后,可以通過某種技術(shù),將外部發(fā)送來的請求均勻分配到對稱結(jié)構(gòu)中的每臺服務(wù)器上,接收到連接請求的服務(wù)器都獨立回應(yīng)客戶的請求。在這種結(jié)構(gòu)中,由于建立內(nèi)容完全一致的Web服務(wù)器并不困難,因此負(fù)載均衡技術(shù)就成為建立一個高負(fù)載Web站點的關(guān)鍵性技術(shù)。
總之,負(fù)載均衡是一種策略,它能讓多臺服務(wù)器或多條鏈路共同承擔(dān)一些繁重的計算或I/O任務(wù),從而以較低成本消除網(wǎng)絡(luò)瓶頸,提高網(wǎng)絡(luò)的靈活性和可靠性。
高端服務(wù)器技術(shù)
服務(wù)器性能指標(biāo)以系統(tǒng)響應(yīng)速度和作業(yè)吞吐量為代表。響應(yīng)速度是指用戶從輸入信息到服務(wù)器完成任務(wù)給出響應(yīng)的時間。作業(yè)吞吐量是整個服務(wù)器在單位時間內(nèi)完成的任務(wù)量。假定用戶不間斷地輸入請求,則在系統(tǒng)資源充裕的情況下,單個用戶的吞吐量與響應(yīng)時間成反比,即響應(yīng)時間越短,吞吐量越大。為了縮短某一用戶或服務(wù)的響應(yīng)時間,可以分配給它更多的資源。性能調(diào)整就是根據(jù)應(yīng)用要求和服務(wù)器具體運行環(huán)境和狀態(tài),改變各個用戶和服務(wù)程序所分配的系統(tǒng)資源,充分發(fā)揮系統(tǒng)能力,用盡量少的資源滿足用戶要求,達到為更多用戶服務(wù)的目的。
技術(shù)目標(biāo)
服務(wù)器所要求的高擴展性、高可用性、易管理性、高可靠性不僅是廠商追求的技術(shù)目標(biāo),也是用戶所需求的。
可擴展性具體表現(xiàn)在兩個方面:一是留有富余的機箱可用空間,二是充裕的I/O帶寬。隨著處理器運算速度的提高和并行處理器數(shù)量的增加,服務(wù)器性能的瓶頸將會歸結(jié)為PCI及其附屬設(shè)備。高擴展性意義在于用戶可以根據(jù)需要隨時增加有關(guān)部件,在滿足系統(tǒng)運行要求同時,又保護投資。
可用性是以設(shè)備處于正常運行狀態(tài)的時間比例作為衡量指標(biāo),例如99.9%的可用性表示每年有8小時的時間設(shè)備不能正常運行,99.999%的可用性表示每年有5分鐘的時間設(shè)備不能正常運行。部件冗余是提高可用性的基本方法,通常是對發(fā)生故障給系統(tǒng)造成危害最大的那些部件(例如電源、硬盤、風(fēng)扇和PCI卡)添加冗余配置,并設(shè)計方便的更換結(jié)構(gòu)(如熱插拔),從而保證這些設(shè)備即使發(fā)生故障也不會影響系統(tǒng)的正常運行。
可管理性旨在利用特定的技術(shù)和產(chǎn)品來提高系統(tǒng)的可靠性,降低系統(tǒng)的購買、使用、部署和支持費用。最顯著的作用體現(xiàn)在減少維護人員的工時占用和避免系統(tǒng)停機帶來的損失。服務(wù)器的管理性能直接影響服務(wù)器的易用性??晒芾硇允荰CO各種費用之中所占比例最大的一項。有研究表明,系統(tǒng)的部署和支持費用遠(yuǎn)遠(yuǎn)超過了初次購買所花的費用,而付給管理和支持人員的報酬又是其中所占份額最高的。另外,工作效率的降低、商業(yè)機會的喪失和營業(yè)收入的下滑所帶來的財務(wù)損失也不可忽視。因此,系統(tǒng)的可管理性既是IT部門的迫切要求,又對企業(yè)經(jīng)營效益起著非常關(guān)鍵的作用??晒芾硇援a(chǎn)品和工具可通過提供系統(tǒng)內(nèi)部的有關(guān)信息而達到簡化系統(tǒng)管理的目的。通過網(wǎng)絡(luò)實現(xiàn)遠(yuǎn)程管理,技術(shù)支持人員在自己的桌面上即可解決問題,不必親赴故障現(xiàn)場。系統(tǒng)部件可自動監(jiān)視自己的工作狀態(tài),如果發(fā)現(xiàn)故障隱患可隨時發(fā)出警告,提醒維護人員立即采取措施保護企業(yè)數(shù)據(jù)資產(chǎn),故障部件更換的操作也非常簡單方便。
說到可靠性,簡單來說就是要求服務(wù)器必須穩(wěn)定運行,也就是宕機率低。其中的關(guān)鍵在于操作系統(tǒng)與硬件設(shè)備的協(xié)作,如果待處理的資源控制在CPU和操作系統(tǒng)上,而不是應(yīng)用上,就會避免由于某項任務(wù)處理出錯而導(dǎo)致系統(tǒng)無法運行,服務(wù)器宕機率將大大降低,而這也恰恰是Unix/Linux系統(tǒng)的優(yōu)勢之一。導(dǎo)致日常維護工作的中斷有:主機升級、硬件維護或安裝、操作系統(tǒng)升級、應(yīng)用/文件升級或維護、文件重組、全系統(tǒng)備份等原因。意外的災(zāi)難包括硬盤損壞、系統(tǒng)故障、軟件故障、用戶錯誤、電源掉電、人為破壞和自然災(zāi)害等因素。
SMP
SMP(Symmetrical Multi-Processor)就是對稱式多處理器。在對稱式結(jié)構(gòu)中,機器里每一位處理器的地位都是一樣的,它們連接在一起,共享一個存儲器。存儲器里有一個操作系統(tǒng),每個計算機都能運行這個操作系統(tǒng),都能響應(yīng)外部設(shè)備的要求,即每個存儲器的地位是平等的、對稱的。在國內(nèi)市場上這類機型的處理器一般以4個或8個為主,有少數(shù)是16個處理器。但是一般來講,SMP結(jié)構(gòu)的機器可擴展性較差,很難做到100個以上多處理器,常規(guī)的一般是8個到16個,不過這對于多數(shù)的用戶來說已經(jīng)夠用了。這種機器的好處在于它的使用方式和微機或工作站的區(qū)別不大,編程的變化相對來說比較小,原來用微機工作站編寫的程序如果要移植到SMP機器上使用,改動起來也相對比較容易。SMP結(jié)構(gòu)的機型可用性比較差。因為4個或8個處理器共享一個操作系統(tǒng)和一個存儲器,一旦操作系統(tǒng)出現(xiàn)了問題,整個機器就完全癱瘓掉了。而且由于這個機器的可擴展性較差,不容易保護用戶的投資。但是這類機型技術(shù)比較成熟,相應(yīng)的軟件也比較多,因此現(xiàn)在國內(nèi)市場上推出的并行機大量都是這一種。
集群技術(shù)
通俗地說,集群是這樣一種技術(shù):它至少將兩個系統(tǒng)連接到一起,使兩臺服務(wù)器能夠像一臺機器那樣工作或者看起來好像一臺機器。采用集群系統(tǒng)通常是為了提高系統(tǒng)的穩(wěn)定性和網(wǎng)絡(luò)中心的數(shù)據(jù)處理能力及服務(wù)能力。自80年代初以來,各種形式的集群技術(shù)紛紛涌現(xiàn)。因為集群能夠提供高可用性和可伸縮性,所以,它迅速成為企業(yè)和ISP計算的支柱。
常見集群技術(shù)
1.服務(wù)器鏡像技術(shù)
服務(wù)器鏡像技術(shù)是將建立在同一個局域網(wǎng)之上的兩臺服務(wù)器通過軟件或其他特殊的網(wǎng)絡(luò)設(shè)備(比如鏡像卡)將兩臺服務(wù)器的硬盤做鏡像。其中,一臺服務(wù)器被指定為主服務(wù)器,另一臺為從服務(wù)器??蛻糁荒軐χ鞣?wù)器上的鏡像的卷進行讀寫,即只有主服務(wù)器通過網(wǎng)絡(luò)向用戶提供服務(wù),從服務(wù)器上相應(yīng)的卷被鎖定以防對數(shù)據(jù)的存取。主/從服務(wù)器分別通過心跳監(jiān)測線路互相監(jiān)測對方的運行狀態(tài),當(dāng)主服務(wù)器因故障宕機時,從服務(wù)器將在很短的時間內(nèi)接管主服務(wù)器的應(yīng)用。
服務(wù)器鏡像技術(shù)的特點是成本較低,提高了系統(tǒng)的可用性,保證了在一臺服務(wù)器宕機的情況下系統(tǒng)仍然可用,但是這種技術(shù)僅限于兩臺服務(wù)器的集群,系統(tǒng)不具有可擴展性。
2. 應(yīng)用程序錯誤接管集群技術(shù)
錯誤接管集群技術(shù)是將建立在同一個網(wǎng)絡(luò)里的兩臺或多臺服務(wù)器通過集群技術(shù)連接起來,集群節(jié)點中的每臺服務(wù)器各自運行不同的應(yīng)用,具有自己的廣播地址,對前端用戶提供服務(wù),同時每臺服務(wù)器又監(jiān)測其他服務(wù)器的運行狀態(tài),為指定服務(wù)器提供熱備份作用。當(dāng)某一節(jié)點因故障宕機時,集群系統(tǒng)中指定的服務(wù)器會在很短的時間內(nèi)接管故障機的數(shù)據(jù)和應(yīng)用,繼續(xù)為前端用戶提供服務(wù)。
\錯誤接管集群技術(shù)通常需要共享外部存儲設(shè)備—磁盤陣列柜,兩臺或多臺服務(wù)器通過SCSI電纜或光纖與磁盤陣列柜相連,數(shù)據(jù)都存放在磁盤陣列柜上。這種集群系統(tǒng)中通常是兩個節(jié)點互為備份的,而不是幾臺服務(wù)器同時為一臺服務(wù)器備份,集群系統(tǒng)中的節(jié)點通過串口、共享磁盤分區(qū)或內(nèi)部網(wǎng)絡(luò)來互相監(jiān)測對方的心跳。
錯誤接管集群技術(shù)經(jīng)常用在數(shù)據(jù)庫服務(wù)器、MAIL服務(wù)器等的集群中。這種集群技術(shù)由于采用共享存儲設(shè)備,所以增加了外設(shè)費用。它最多可以實現(xiàn)32臺機器的集群,極大地提高了系統(tǒng)的可用性及可擴展性。
3.容錯集群技術(shù)
容錯集群技術(shù)的一個典型的應(yīng)用即容錯機,在容錯機中,每一個部件都具有冗余設(shè)計。在容錯集群技術(shù)中集群系統(tǒng)的每個節(jié)點都與其他節(jié)點緊密地聯(lián)系在一起,它們經(jīng)常需要共享內(nèi)存、硬盤、CPU和I/O等重要的子系統(tǒng),容錯集群系統(tǒng)中各個節(jié)點被共同映像成為一個獨立的系統(tǒng),并且所有節(jié)點都是這個映像系統(tǒng)的一部分。在容錯集群系統(tǒng)中,各種應(yīng)用在不同節(jié)點之間的切換可以很平滑地完成,不需切換時間。
容錯集群技術(shù)的實現(xiàn)往往需要特殊的軟硬件設(shè)計,因此成本很高,但是容錯系統(tǒng)最大限度地提高了系統(tǒng)的可用性,是財政、金融和安全部門的最佳選擇。
目前在提高系統(tǒng)的可用性方面用得比較廣泛的是應(yīng)用程序錯誤接管技術(shù),即我們通常所采用的雙機通過SCSI電纜共享磁盤陣列的集群技術(shù),這種技術(shù)目前被各家集群軟件廠商和操作系統(tǒng)軟件廠商進一步擴充,形成了市面上形形色色的集群系統(tǒng)。
基于IA架構(gòu)高性能集群系統(tǒng)技術(shù)
利用最新的4、8路IA服務(wù)器架構(gòu)的高性能服務(wù)器集群系統(tǒng), 采用了領(lǐng)先的VI(Visual Interface)技術(shù),有效地消除了系統(tǒng)中節(jié)點之間通訊的瓶頸;同時,系統(tǒng)采用的負(fù)載均衡技術(shù)使用戶設(shè)備可以充分得到利用,并且達到了4個9的可靠性,具有極高的產(chǎn)品性價比,為Internet的應(yīng)用提供了一個強有力的數(shù)據(jù)庫服務(wù)器平臺。
1.系統(tǒng)概述
數(shù)據(jù)中心領(lǐng)域一直是高端RISC服務(wù)器的天下,多年來人們只有選擇AS400 、E10000、HP9000等這樣的小型機,價格昂貴,維護成本高。而IA 架構(gòu)服務(wù)器價格低廉,易于使用和維護,通過Cluster技術(shù)可以構(gòu)造超級計算機,其超強的處理能力可以取代價格昂貴的中大型機,為行業(yè)的高端應(yīng)用開辟新的方向。
對于成長中的大型用戶來講,數(shù)據(jù)中心或數(shù)據(jù)倉庫中所保存的企業(yè)經(jīng)營、管理數(shù)據(jù)的增長是十分驚人的,而這些數(shù)據(jù)對大型用戶的作用又是非常重要的。發(fā)展若干年中積累下的數(shù)據(jù)是一筆寶貴的財富,通過對這些浩若煙海的數(shù)據(jù)進行分析,經(jīng)營者們能夠得出直觀的經(jīng)營圖表、曲線,能夠為以后大型用戶的發(fā)展提供有力的決策支持。但是由于這樣的數(shù)據(jù)隨著時間的流逝不斷膨脹,給大型用戶的IT系統(tǒng)管理人員帶來了巨大的壓力。
用戶到底需要什么樣的服務(wù)器才能滿足目前和未來發(fā)展的需要?
首先要有超強的計算能力,可以承受長時間、大用戶量的并發(fā)訪問。
其次,服務(wù)器系統(tǒng)的高可用性、易用易管理對于用戶也是極為重要的,如果系統(tǒng)出現(xiàn)故障,造成服務(wù)的中斷,或者重要資料的丟失,會給用戶造成挽回的損失。所以,用戶在選擇服務(wù)器系統(tǒng)時一定要考慮高可用的系統(tǒng)方案。
第三,隨著數(shù)據(jù)的不斷堆積,對數(shù)據(jù)的查詢和統(tǒng)計將使系統(tǒng)變得越來越慢,硬件設(shè)備的更新?lián)Q代可以說是一個發(fā)展中的大型用戶必不可少的工作。
利用最新的4、8路IA服務(wù)器架構(gòu)的高性能服務(wù)器集群系統(tǒng)[1], 采用了領(lǐng)先的VI(Visual Interface)技術(shù),有效地消除了系統(tǒng)中節(jié)點之間通訊的瓶頸;同時,系統(tǒng)采用的負(fù)載均衡技術(shù)使用戶設(shè)備可以充分得到利用,并且達到了4個9的可靠性,具有極高的產(chǎn)品性價比,1999年推出以來引起了用戶的廣泛關(guān)注,為國內(nèi)廣大用戶提供了一個強有力的數(shù)據(jù)庫服務(wù)器平臺。
2.系統(tǒng)原理
高性能服務(wù)器集群系統(tǒng)是基于2節(jié)點或4節(jié)點的集群,最多可達32個CPU,內(nèi)存最大支持32GB。4節(jié)點構(gòu)成一個工作單元,最多可級聯(lián)16個工作單元。
各節(jié)點為IA服務(wù)器,它支持4路或8路Pentium III Xeon CPU并行處理。每臺服務(wù)器上插一塊千兆網(wǎng)卡或vi結(jié)構(gòu)的高速交換卡,連接至一臺高速交換機(可以是千兆以太網(wǎng)卡交換機或某些特殊的高速交換機,例如vi結(jié)構(gòu)的高速交換機)做為服務(wù)器彼此之間的數(shù)據(jù)交換用,稱之為SAN(Server Area Network)交換機。
每臺服務(wù)器插有一塊百兆或千兆以太網(wǎng)卡,連接到局域網(wǎng)用的交換機或集線器上,為客戶端的訪問提供連接服務(wù)。
四臺服務(wù)器共享一臺光纖通道磁盤陣列柜。每臺服務(wù)器有兩塊光纖通道卡,分別連接到兩個光纖通道的集線器上,每個集線器分別連接到光纖通道磁盤陣列柜的兩個控制器上。對于光纖通道磁盤陣列柜,只要有一個控制器能正常工作,整個陣列柜就能正常工作,因此這種配置方案是冗余的,防止單點失效。對于最重要的存放在磁盤陣列柜中的數(shù)據(jù),還可采取將集群系統(tǒng)與磁盤陣列柜分別存放的方式來確保數(shù)據(jù)安全,光纖通道允許集群系統(tǒng)與磁盤陣列柜之間最長10公里的距離。
每臺服務(wù)器有一個硬盤區(qū)域,用于安裝本機的引導(dǎo)系統(tǒng)和數(shù)據(jù)庫系統(tǒng)的管理部分。用戶數(shù)據(jù)存儲在共享的磁盤陣列柜中。
在局域網(wǎng)中,有一臺客戶機做為管理控制臺,在其上安裝有數(shù)據(jù)庫的管理控制臺,用于管理并行數(shù)據(jù)庫,可以同時監(jiān)控四個節(jié)點上的數(shù)據(jù)庫實例,實現(xiàn)啟動、停止、監(jiān)控運行性能等功能。
另外在這臺客戶機上安裝有網(wǎng)管系統(tǒng),SAN的管理控制臺,磁盤柜的管理控制臺,UPS管理控制臺等,實現(xiàn)集群系統(tǒng)的統(tǒng)一管理。有的管理功能實現(xiàn)時只需要安裝TCP/IP協(xié)議,有的則還需要安裝SNMP協(xié)議才能正常工作。
一個良好的集群系統(tǒng)除了優(yōu)秀的性能指標(biāo)之外,還需要有相應(yīng)的操作系統(tǒng)和數(shù)據(jù)庫的支持,我們目前的集群系統(tǒng)支持WINDOWS NT 4.0 及WINDOWS 2000操作系統(tǒng)[2],在數(shù)據(jù)庫方面支持ORACLE和DB2。它不運行在單機上,只有在多個節(jié)點同時工作時,才能夠顯示出它的性能,并使得系統(tǒng)能夠真正做到負(fù)載均衡(Load Balance)。
2.1 兩節(jié)點集群系統(tǒng)
從方案的配置上來說,用戶可以根據(jù)需要做不同的選擇,可以使用兩臺高端服務(wù)器實現(xiàn)一個虛擬主機。這時,采用vi結(jié)構(gòu)的高速交換設(shè)備更具有優(yōu)越性,不需要使用vi 交換機,可以用每臺服務(wù)器上的vi結(jié)構(gòu)的高速交換卡直連實現(xiàn)服務(wù)器之間的高速數(shù)據(jù)交換。如果使用千兆以太網(wǎng)卡,還需要千兆交換機,成本較高。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
路由網(wǎng)關(guān)網(wǎng)絡(luò)管理和監(jiān)控功能介紹
路由網(wǎng)關(guān)網(wǎng)絡(luò)管理和監(jiān)控功能介紹...2007-09-09