Windows Server 2008故障轉移群集簡介
自從在 Windows NT 4.0 Enterprise Edition 中首次引入群集以來,用戶就一直在抱怨它太難于設置,維護則更是難上加難。管理群集要求管理員不僅要了解群集本身,還需要精通存儲技術以及群集服務與各種存儲解決方案交互的方式。許多組織都難以獲取用于啟動和運行高可用性解決方案以及之后對其進行維護所需的所有技能。
多年來群集一直在不斷改進,但直到 Microsoft 開始研究 Windows Server® 2008 時,仍有許多地方有待改進。明確這一點后,團隊以簡單為主要目標開始著手重新設計群集。在 Windows Server 2008 中,Microsoft® 群集服務 (MSCS) 得到了完全的改觀,并且現在改稱為“故障轉移群集”。
這并不是說簡單是新的“故障轉移群集”帶來的唯一改進。這些年來,由于許多組織都提供了有關他們希望在群集解決方案中看到哪些功能的有價值反饋,因此 Microsoft 積累了大量經驗教訓。新的“故障轉移群集”功能可解決用戶報告的許多首要問題,并且還加入了一些使其更具吸引力的激動人心的新功能。因此在本文中,我將向您介紹 Windows Server 2008 故障轉移群集中包含的一些非??岬男鹿δ?。
新的管理界面
安裝“故障轉移群集”之后,可在“管理工具”中或通過運行 Cluadmin.msc 訪問“故障轉移群集管理”界面。“故障轉移群集管理”管理單元(類似于 Windows Server 2008 中的其他管理界面)是一個 Microsoft 管理控制臺 (MMC) 3.0。對于群集老手來說,首次打開“故障轉移群集管理”管理單元的感覺就像來到國外卻沒有帶地圖一樣。
新界面分為三個不同的窗格,如圖 1 所示。左側窗格列出了組織中的所有 Windows Server 2008 故障轉移群集。中間的窗格提供了有關在左側窗格中選擇的群集配置部分的詳細信息,而右側窗格顯示可執(zhí)行的操作。

圖 1“故障轉移群集管理”管理單元
例如,在左側窗格中選擇 Storage。中間的窗格將隨后顯示群集中提供了哪些存儲以及哪些存儲(如果有)當前可用的詳細信息。如圖 1 所示,該群集包含支持見證磁盤的一塊存儲區(qū)、已為 File Server 置備的存儲以及一些可用存儲。右側窗格列出了相關的操作,如添加更多存儲。請注意,“故障轉移群集管理”管理單元不能用于管理之前版本的“Microsoft 群集服務”。
改進了配置過程
配置“故障轉移群集”變得非常簡單。許多配置、重新配置和維護群集的操作都有向導。有了這些向導的幫助,管理員不必再擔心資源是否已配置正確或者它們是否會以正確的順序聯(lián)機。
圖 2 顯示了“高可用性向導”。在該特定示例中配置了一個 File Server。左側顯示了向導已指引管理員完成的步驟列表。此過程一旦完成,就會顯示摘要頁面并可查看報告。

圖 2 高可用性向導
#p#嵌入了驗證過程
在之前版本的 Windows Server 中,要成為受支持的群集解決方案,必須在“Windows Server 目錄”中將硬件配置列為“群集解決方案”。它包括在“地理位置分散型”類別下單獨列出的多站點群集。要列在該目錄中,硬件供應商必須運行一組 Windows 硬件質量實驗室 (WHQL) 測試并將結果提交給 Microsoft。這對于供應商來說成本很高,并且難以維護“Windows Server 目錄”數據庫。
在 Windows Server 2008 中,“故障轉移群集”包含一個內置的驗證過程。該過程由分為四個大類別的一系列測試組成,如圖 3 所示。

圖 3 故障轉移群集驗證測試類別
您可以看到 Network 類別已展開以顯示運行的測試;每個類別都包含一系列測試。Storage 類別也許是四個類別中最關鍵的一個類別,它包括用于確保存儲解決方案符合 Windows Server 2008 故障轉移群集提出的新要求的測試。
具體地說,硬件供應商現在必須使用基于 Microsoft Storport 驅動程序的驅動程序,并且它們必須支持 SCSI-3 持久保留。此外,在使用多路徑軟件“設備專用模塊”時,必須遵循“Microsoft 多路徑輸入\輸出”標準。
由于并入了驗證過程,支持模型發(fā)生了更改。所有硬件必須具備 Windows Server 2008 徽標,并且必須通過所有的驗證測試。唯一例外的是包含兩個單獨且完全不同的儲存柜(每個站點一個)的多站點群集,以及并未使用任何共享存儲的 Exchange Server 2007 群集連續(xù)復制實現。
新的仲裁模型
Windows Server 2008 故障轉移群集中的仲裁模型也發(fā)生了更改。在較老的系統(tǒng)中,當管理員聽到“仲裁”這個詞時,他可能想到的是包含群集配置和一些復制文件的某個共享磁盤。它是群集中的一個單點故障。如果仲裁磁盤出現故障,群集服務將終止并失去高可用性。
Windows Server 2003 服務器群集提供了另一種仲裁類型,即“多數節(jié)點集”仲裁。此類仲裁類型通常是在多站點群集中實現,并且不需要共享存儲?!岸鄶倒?jié)點集”仲裁由駐留在每個群集節(jié)點上的系統(tǒng)驅動器上的文件共享組成。通過服務器消息塊 (SMB) 連接來連接到該仲裁類型。同樣,為使群集能正常運行,必須有大多數節(jié)點的參與。
引入 Exchange Server 2007 群集連續(xù)復制 (CCR) 之后,文件共享見證 (FSW) 功能也添加到了 Windows Server 2003 服務器群集中。它允許單個 Exchange 2007 CCR 群集節(jié)點(或任意多站點群集)繼續(xù)提供服務,只要能夠實現到大多數 FSW 的連接即可。
在 Windows Server 2008 故障轉移群集中,仲裁的概念現在才真正意味著達成共識。現在實現仲裁(或達成共識)的方式是擁有足夠的投票才能開始使用群集??赏ㄟ^多種方法獲取足夠的投票,具體取決于仲裁配置。在 Windows Server 2008 故障轉移群集中共有四種仲裁模式,如圖 4 所示。在列出的四種模式中,只有前兩種(“多數節(jié)點”和“節(jié)點和磁盤多數”)可在創(chuàng)建群集過程中自動選擇。應使用以下邏輯:
如果在群集中配置的節(jié)點數目為奇數,則選擇“多數節(jié)點”模式。
如果在群集中配置的節(jié)點數目為偶數且共享存儲已連接并可訪問,則選擇“節(jié)點和磁盤多數”。

圖 4 配置群集仲裁向導中的仲裁模式
要從可用存儲選擇一個見證磁盤,可選擇大小至少 500 MB 且配置了 NTFS 分區(qū)的首個磁盤。其余仲裁模式僅可通過運行“配置群集仲裁向導”來手動選擇?!肮?jié)點和文件共享多數”選項通常用在多站點群集配置或 Exchange 2007 CCR 群集中。最后一個選項“非多數:僅磁盤”模式等同于傳統(tǒng)群集中的共享仲裁模式。它是一個單點故障,通常不應使用此選項。
#p#在群集中僅有兩種見證資源(物理磁盤和文件共享)經過配置后能幫助達成共識。
見證磁盤是群集服務可將其聯(lián)機的一塊存儲區(qū)。該磁盤與群集“網絡名稱”及相關 IP 地址資源一同位于“群集核心資源組”中。配置了見證磁盤后,該磁盤上將出現一個 Cluster 文件夾并放置一個完整的群集配置副本(群集配置單元或副本)。
FSW 是一個網絡共享,在理想情況下位于不屬于群集的網絡服務器上。為 FSW 建立 SMB 連接,由 FSW 維護見證日志文件(它包含了群集配置的版本信息)的副本。
一個群集中僅可配置一種見證資源。在群集實現仲裁時需要該資源提供一張額外的投票。換句話說,如果群集僅差一張選票(即一個節(jié)點)即可達成共識,那見證資源將聯(lián)機以便實現仲裁。如果群集還差多張選票才可實現仲裁,則見證資源不會聯(lián)機,且群集將繼續(xù)保持休眠狀態(tài)并等候其他群集結點的加入。
增強了安全功能
故障轉移群集包含多個新的安全增強功能。其中最重要的也許是不再需要群集服務帳戶 (CSA)。在之前版本的 Microsoft 群集服務中,在配置過程中需要用到域用戶帳戶。該帳戶的目的是用于啟動群集服務,因此需將它添加到每個群集節(jié)點上的本地管理員組中,并且向其提供必要的本地用戶權限以便群集服務能正常運行。作為域用戶帳戶,CSA 需要遵守許多可應用到群集節(jié)點的域級別策略。這些策略可能會導致群集服務失敗,對高可用性產生負面影響。
現在,群集服務是以一個本地系統(tǒng)帳戶的名義運行,該帳戶對本地群集節(jié)點具備一組特定權限,能夠正常運行。群集的安全上下文已轉換成“群集名稱對象”(CNO),該對象是首次創(chuàng)建群集時在 Active Directory® 的“計算機”容器中默認創(chuàng)建的計算機對象。一旦成功創(chuàng)建群集且 Active Directory 中存在 CNO,就不再需要用于安裝和配置群集的用戶帳戶。
在 Active Directory 的“計算機”容器中創(chuàng)建的其他計算機對象與“故障轉移群集”相關聯(lián)。這些對象稱為“虛擬計算機對象”(VCO),等同于在群集中作為客戶端訪問點 (CAP) 的一部分創(chuàng)建的群集“網絡名稱”資源。CNO 負責創(chuàng)建群集中的所有 VCO,它會被添加到 Active Directory 中對象的系統(tǒng)訪問控制列表 (SACL) 中(請參閱圖 5)。

圖 5 Active Directory 中 VCO 的安全性
CNO 還負責同步它創(chuàng)建的所有 VCO 的域密碼。將根據配置的密碼輪換域策略完成此過程。此外,由于 CNO 負責創(chuàng)建與群集中的 VCO 相關聯(lián)的所有計算機對象,因此 CNO(計算機帳戶)必須具有域級別權限以便能夠在創(chuàng)建 VCO 的容器(默認情況下為“計算機”容器)中創(chuàng)建計算機對象。
另一項更改是 Kerberos 現在已成為默認的身份驗證方法。由于 Active Directory 中存在計算機帳戶,因而使得此項增強的安全功能成為可能。但是,如果某個應用程序雖然無法使用 Kerberos 來執(zhí)行身份驗證卻需要訪問群集資源,則群集可以使用 NT LAN Manager (NTLM) 身份驗證。
直接處理群集過程的群集節(jié)點間的通信也更加安全。所有群集內部的通信都會默認進行簽名??赏ㄟ^使用 cluster.exe 通用語言接口 (CLI) 來更改此群集屬性,這樣可加密節(jié)點之間的所有通信以提供更高級別的安全性。
#p#擴展了網絡功能
“故障轉移群集”中的新網絡功能使得高可用性和災難恢復解決方案的設計更加靈活。同時,這些網絡增強功能在群集中的節(jié)點間提供了更加可靠的連接。
在單個網絡中找到群集節(jié)點可能是客戶最迫切需要的功能?,F在已實現這項功能。群集網絡驅動程序已徹底重新編寫,因此只要每個節(jié)點都連接至少兩個分別路由的單獨網絡,它就可以在群集中的節(jié)點間提供高度可靠且容錯的通信。
群集網絡驅動程序根據群集啟動過程中提供的連接信息構造自己的內部路由表。這包括本地連接信息以及在群集配置數據庫(群集注冊配置單元)中提供的信息。
群集驗證過程的一項內容是網絡連接發(fā)現過程。在不同路由網絡中找到群集節(jié)點的功能減輕了多站點群集的網絡需求。因而使得組織部署它們時更加輕松且成本更低。它還使在“故障轉移群集”中使用 iSCSI 存儲成為更具吸引力的存儲解決方案。
群集節(jié)點還可通過 DHCP(動態(tài)主機配置協(xié)議)獲取 IP 地址信息。如果網絡管理員允許其環(huán)境中的服務器使用動態(tài)地址,則此功能可以減輕他們的負擔。
群集節(jié)點網絡接口的配置決定了哪些網絡使用靜態(tài)或動態(tài) IP 地址。盡管群集中的 IP 地址資源是從 DHCP 服務器獲得的,也可以在“故障轉移群集管理”管理單元中將其更改為靜態(tài) IP 地址。
在過去,所有的群集通信都使用用戶數據報協(xié)議 (UDP) 廣播,或者有時使用多播?,F在已停止使用多播功能,且群集通信轉為使用 UDP 單播。(端口 3343 仍是 Microsoft 群集使用的公共端口。)許多網絡管理員對于不再使用廣播都感到非常高興。但是,群集中真正的回報在于群集服務內部的新消息傳遞過程。(不過,該內容超出了本文的介紹范圍。)即使將 UDP 用作傳輸機制,群集內部的通信現在也是更加可靠的 TCP 通信。
增強了與存儲交互時的可靠性
“故障轉移群集”與存儲交互的方式發(fā)生了翻天覆地的變化。群集磁盤驅動程序 (clusdisk.sys) 已徹底重新編寫,現在它才是真正的即插即用 (PnP) 驅動程序。而且它與存儲交互的方式也已發(fā)生改變。
在 Windows Server 2003 中,群集磁盤驅動程序位于一個直接存儲路徑中。但在 Windows Server 2008 中,群集磁盤驅動程序需要與分區(qū)管理器 (partmgr.sys) 驅動程序進行通信才能與存儲實現交互。圖 6 中展示了這兩種方法。

圖 6 存儲堆棧在 Windows Server 2008 中的變化
分區(qū)管理器主要負責保護群集磁盤資源。首次映射到群集節(jié)點時,共享存儲總線上的所有磁盤都會自動處于脫機狀態(tài)。因此,即使是在創(chuàng)建群集之前,也可將存儲同時映射到群集中的所有節(jié)點。不再需要一次一個地引導節(jié)點,在一個節(jié)點上準備磁盤然后關閉節(jié)點,再引導另一節(jié)點,檢驗磁盤配置等等。
但仍然需要執(zhí)行存儲測試,該測試是群集驗證過程的一個部分并且需要初始化磁盤??稍趫?zhí)行驗證過程之前在群集的一個節(jié)點上完成該操作。一旦存儲被添加到群集,磁盤將在“磁盤管理”界面中顯示“保留”狀態(tài),并且會一直處于受保護狀態(tài)。
另一項更改與 SCSI 命令有關。在 Windows Server 2003 中,SCSI-2 Reserve\Release 命令與寫入磁盤自身扇區(qū)中的群集磁盤驅動程序搭配使用。在 Windows Server 2008 中,必需使用 SCSI-3 PR (Persistent Reservation) 命令。群集節(jié)點必須先注冊然后才能保留存儲,并且群集節(jié)點需定期使用“注冊保護協(xié)議”來保護其保留。
驗證過程中的其中一項存儲測試將驗證此功能。如果某個存儲解決方案并不支持 SCSI-3 (PR) 命令,則“故障轉移群集”也將不支持它。
在連接到存儲時,許多組織使用多路徑軟件來實現冗余。這種方法不但受到支持,甚至還推薦做為最佳實踐。但是,必須使用“Microsoft 多路徑輸入\輸出”標準來重新編寫第三方多路徑軟件解決方案(即設備專用模塊),以便得到“故障轉移群集”的支持。從而確保所有的 SCSI-3 PR 命令都同時沿所有路徑發(fā)送到存儲,無論路徑是否處于活動狀態(tài)。驗證過程也會確認此功能。
其他存儲改進包括有所改進的檢查磁盤 (chkdsk.exe) 過程、之前“群集服務器恢復實用程序”中的內置磁盤修復功能以及自修復磁盤。在“故障轉移群集”中,確定群集磁盤資源時將同時用到磁盤簽名和 LUN ID。如果任意一項發(fā)生更改,群集配置都會更新。正是由于物理磁盤資源上的屬性更改提供了更好的高可用性,因而減少了錯誤。
#p#內置恢復過程
之前提到的磁盤修復顯然是一項內置恢復功能。還有一個是 Active Directory 修復功能。如果刪除了代表 CNO 的計算機對象,您將無法再創(chuàng)建與群集 CAP 相關聯(lián)的計算機對象。但是,您會遇到的第一個問題可能是高度可用的應用程序或用戶由于無法獲得安全令牌而無法訪問群集外部的資源。
從已刪除的 CNO 恢復包括以下兩個步驟。首先,必須讓域管理員從 Active Directory 的 DeletedObjects 容器恢復已刪除的計算機對象。然后,在還原并重新啟用該對象之后,執(zhí)行“故障轉移群集管理”管理單元中的“修復 Active Directory 對象”過程。
在 Windows Server 2003 服務器群集中,位于 %systemroot%\cluster 子目錄中的群集配置文件可能會損壞因而必須進行替換。在“故障轉移群集”中,自修復功能可幫助解決這一問題。如果群集服務在某個節(jié)點上啟動且配置數據庫發(fā)生損壞,將使用 HKLM\System\CCS\Services\ClusSvc\Parameters 注冊表項中包含的信息加載最小的配置模板。該節(jié)點將嘗試加入一個已成形的群集,如果該嘗試成功,該群集注冊表配置單元的一個全新副本將被推送到該節(jié)點。如果節(jié)點無法加入群集,群集服務將終止。
新的備份和還原功能
“故障轉移群集”自帶了“卷影復制服務”編寫器。它在備份和還原群集數據庫以及物理磁盤資源上保存的數據過程中起著非常關鍵的作用。備份群集配置非常簡單。只要系統(tǒng)狀態(tài)為備份的一部分,就可以還原群集配置。但請注意,僅應備份具有仲裁的群集。從而確保備份的是最新的群集配置。
有兩種完全不同的群集還原類型:權威還原和非權威還原。非權威還原使用 Windows Server Backup 或第三方備份應用程序來從選定的備份執(zhí)行還原。而群集結點的權威還原僅可使用 Windows Server Backup CLI (wbadmin.exe) 執(zhí)行還原。
權威還原實質上是將群集配置“帶回”執(zhí)行備份時的狀態(tài)。要完成權威還原,必須停止除正在執(zhí)行還原的節(jié)點以外的所有其他節(jié)點上的群集服務。當還原完成且在已還原節(jié)點上啟動群集服務后,群集的還原配置將變成權威性的新群集配置。然后,在群集中的其他節(jié)點上重新啟動群集服務時,還原配置將在加入過程中向外推送到這些節(jié)點。
在某些情況下,它可以節(jié)省大量的時間和資金。假設您有一個包含多個打印后臺處理程序資源的打印群集且每個資源都支持 1,500 臺打印機,而您無意間刪除了其中一個打印后臺處理程序資源。現在,大量用戶無法正常打印。與其手動將這些打印機都重新添加回群集配置,更快的方法是執(zhí)行群集配置的權威還原。當然,這需要您具備良好的備份和還原策略。
從 Windows Server 2003 服務器群集進行遷移
由于 Windows Server 2008 故障轉移群集包含這些體系結構更改,因此并不支持從 Windows Server 2003 執(zhí)行就地或周期性升級。從 Windows Server 2000 群集升級到 Windows Server 2003 時,許多組織都系統(tǒng)地刪除了群集中的所有節(jié)點,全新安裝操作系統(tǒng),然后再將節(jié)點重新添加到群集中。這種方法無法用于遷移到 Windows Server 2008 的情形,因為 Windows Server 2003 和 Windows Server 2008 群集節(jié)點不能處于同一群集當中。
幸運地是,系統(tǒng)提供了一個基于向導的遷移過程來幫助執(zhí)行遷移。但是遷移到 Windows Server 2008 故障群集需要執(zhí)行一些規(guī)劃。有以下三種基本的遷移方案:
使用相同的服務器和存儲。
使用相同的服務器,但使用新的存儲。
使用新的服務器和新的存儲。
所有方案都需要確保硬件已通過 Windows Server 2008 徽標計劃的認證,并且已運行故障轉移群集驗證過程且通過了所有的測試。完成這些步驟后,就可繼續(xù)執(zhí)行遷移過程。
并非 Windows Server 2003 服務器群集中的所有資源都可以遷移??蛇w移網絡名稱、IP 地址、物理磁盤、文件共享、分布式文件共享 (DFS) 根、DHCP 和 WINS。也可(有限地)遷移通用服務、通用應用程序和通用腳本資源。
同時,Microsoft Exchange 和 SQL Server® 之類的應用程序都擁有自己的程序來遷移到“故障轉移群集”。打印機可使用“打印管理”管理單元(與“打印服務器角色”一起安裝)遷移到 Windows Server 2008,從而先將打印機導出然后再將其導入新配置的高度可用的打印服務器。無法遷移第三方資源類型。
遷移過程不會遷移任何數據。它會將群集配置設置從 Windows Server 2003 遷移到 Windows Server 2008。
遷移過程完成時,所有的遷移資源最初都處于脫機狀態(tài)。原因是可能存在其他必要的步驟。因此,在開始使用群集之前,必須查看遷移后報告以了解還需要執(zhí)行哪些步驟(如果遷移到新存儲則還需要執(zhí)行數據遷移)。例如,如果遷移 DHCP 服務器,必須在群集中的所有節(jié)點上安裝“DHCP 服務器角色”。如果遷移 WINS 服務器,必須在群集中的所有節(jié)點上安裝“WINS 服務器”功能。
相關文章
與Windows2003相比,Windows2008群集改進了許多功能。其中最引人注目的是仲裁選項的變化。這篇文章給大家介紹了創(chuàng)建Windows2008群集的相關知識,需要的朋友參考下吧2017-12-21


