Redis?集群模式(Cluster)原理詳解
1、簡述
Redis Cluster 集群中每個節(jié)點負責整個集群的一部分數(shù)據(jù),每個節(jié)點上的數(shù)據(jù)多少可能不一樣,節(jié)點之間通過一種特殊的二進制協(xié)議交互集群信息。
Redis Cluster將所有數(shù)據(jù)劃分為16384個槽位,每個節(jié)點負責其中一部分槽位,槽位信息存儲于每個節(jié)點中,當redis客戶端來連接集群時,也會得到一份集群的槽位配置信息,這樣當客戶端要查找某個key時,可以直接定位到目標節(jié)點。
客戶端為了可以直接找到具體key所在的節(jié)點,需要緩存槽位相關信息,這樣就可快速定位到相對應的節(jié)點,同時可能存在客戶端與服務器存儲槽位信息不一致的情況,故需要糾正機制來實現(xiàn)槽位信息的校驗調(diào)整。
2、槽位定位算法
Redis Cluster默認會對key值使用crc16算法進行hash得到一個整數(shù)值,然后用該整數(shù)值對16384進行取模來得到具體槽位。Redis Cluster還允許用戶強制把某個key掛在特定槽位上,通過key字符串里面嵌入tag標記以此來強制key所掛的槽位等于tag所在的槽位。
3、跳轉機制
當客戶端向一個錯誤節(jié)點發(fā)送指令后,該節(jié)點會發(fā)現(xiàn)指令的key所在槽位并不歸自己管,此時它會向客戶端發(fā)送一個特殊的跳轉指令攜帶目標操作的節(jié)點地址,告訴客戶端去連接該節(jié)點以獲取數(shù)據(jù)??蛻舳嗽谑盏組OVED指令后,要立即糾正本地槽位映射表,后續(xù)所有key將使用新的槽位映射表
4、key 遷移(redis-trib為例)
Redis遷移的單位是槽,即一個槽一個槽的遷移,當一個槽正在遷移時,這個槽就處于中間過渡狀態(tài)。如圖,這個槽在源節(jié)點的狀態(tài)為migrating,在目標節(jié)點的狀態(tài)為importing,表示數(shù)據(jù)正在從源節(jié)點流向目標節(jié)點。
redis-trib會在源節(jié)點和目標節(jié)點設置好中間狀態(tài),然后一次性獲取元節(jié)點槽位的多有key列表(keysinslot指令,也可部分獲取),然后挨個key進行遷移。每個key的遷移過程以源節(jié)點作為目標節(jié)點的“客戶端”,源節(jié)點對當前key執(zhí)行dump指令得到序列化內(nèi)容,然后通過“客戶端”向目標節(jié)點發(fā)送restore指令攜帶序列化的內(nèi)容作為參數(shù),目標節(jié)點在進行反序列化將內(nèi)容恢復到目標節(jié)點內(nèi)存中,然后返回“客戶端”ok,源節(jié)點“客戶端”收到后再把當前節(jié)點的key刪掉就完成了單個key遷移的全過程。
遷移過程是同步的,在目標節(jié)點執(zhí)行restore指令到源節(jié)點刪除key之間,源節(jié)點的主線程會處于阻塞狀態(tài),直到key被成功刪除。
遷移過程中,如果每個key的內(nèi)容都很小,那么migrate過程會很快,幾乎不會影響客戶端的正常訪問,如果key的內(nèi)容很大,因為migrate過程是阻塞的,所以會導致源節(jié)點和目標節(jié)點 卡頓,影響集群穩(wěn)定性,所以要避免大key。
5、容錯
當主節(jié)點發(fā)生故障,集群會自動將從節(jié)點提升為主節(jié)點,如果主節(jié)點沒有從節(jié)點,則發(fā)生故障時,集群不可用。同時Redis也提供了一個參數(shù) cluster-require-full-coverage 可以允許部分節(jié)點發(fā)生故障,其余節(jié)點可正常提供服務。
6、網(wǎng)絡抖動
由于網(wǎng)絡抖動問題導致主從頻繁切換,Redis Cluster 提供 cluster-node-timeout 參數(shù),當某個節(jié)點持續(xù)時間timeout時間失聯(lián)時,才可以認定該節(jié)點出現(xiàn)故障,需要進行主從切換。同時參數(shù) cluster-slave-validity-factory 作為倍乘系數(shù)放大這個超時時間來寬容容錯的緊急程度,系數(shù)為零,主從切換不會抗拒網(wǎng)絡抖動,系數(shù)大于1則就成了主從切換的松弛系數(shù)。
7、可能下線(PFail)與確定下線(Fail)
因為Redis Cluster是去中心化的,一個節(jié)點認為某個節(jié)點失聯(lián)了并不代表所有節(jié)點都認為它失聯(lián)了,所以集群會通過以此協(xié)商過程,只有當大多數(shù)節(jié)點認為某個節(jié)點失聯(lián)了,那么該節(jié)點才需要進行主從切換來容錯。
Redis 集群節(jié)點采用Gossip協(xié)議來廣播自己的狀態(tài)以及來改變對整個集群的認知。當一個節(jié)點發(fā)現(xiàn)某個節(jié)點失聯(lián)后(Pfail),它會將該失聯(lián)信息廣播到整個集群,其他節(jié)點就會收到節(jié)點失聯(lián)信息,如果收到某個節(jié)點失聯(lián)的節(jié)點數(shù)量(PFail Count)已經(jīng)達到集群的大多數(shù),則可以標記該失聯(lián)節(jié)點為確定下線狀態(tài)(Fail),然后廣播到其它節(jié)點該節(jié)點確定下線的事實,并立即對該失聯(lián)節(jié)點進行主從切換。
8、槽位遷移感知
客戶端保存了槽位與節(jié)點的映射關系表,它需要及時得到更新,才可以正常地將某條指令發(fā)送到正確的節(jié)點中。Cluster中存在兩條特殊的error指令:
- MOVED指令:用來糾正槽位,客戶端會刷新自己的槽位關系表。
- ASKING指令:用來臨時糾正槽位,客戶端不會刷新自己的槽位關系表。
9、集群變更感知
當服務器節(jié)點變更時,客戶端如何得到通知并實時刷新自己的節(jié)點關系表?分為兩種情況:
- 目標節(jié)點掛掉了,客戶端會拋出一個 ConnectionError,緊接著會隨機挑選一個節(jié)點來重試,這時被重試的節(jié)點會通過MOVED指令告知目標槽位被分配到新的節(jié)點地址。
- 運維手動修改集群信息,將主節(jié)點切換為其他節(jié)點,并將主節(jié)點移除。這時打在舊節(jié)點上的指令會收到ClusterDown的錯誤,告知當前節(jié)點所在集群不可用(當前節(jié)點已被孤立,不在屬于之前集群),這時客戶端就會關閉所有連接,清空槽位映射關系表,然后向上報錯,待下一條指令過來時,就會重新嘗試初始化節(jié)點信息。
到此這篇關于Redis 集群模式(Cluster)原理詳解的文章就介紹到這了,更多相關Redis 集群模式內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
redis key過期監(jiān)聽的實現(xiàn)示例
在Redis中,我們可以為Key設置過期時間,當Key的過期時間到達后,Redis會自動將該Key標記為已失效,本文就來介紹一下redis key過期監(jiān)聽的實現(xiàn)示例,感興趣的可以了解一下2024-03-03