Redis Sentinel服務(wù)配置流程(詳解)
1、Redis Sentinel服務(wù)配置
1.1簡介
Redis 的 Sentinel 系統(tǒng)用于管理多個 Redis 服務(wù)器(instance), 該系統(tǒng)執(zhí)行以下三個任務(wù):
監(jiān)控(Monitoring): Sentinel 會不斷地檢查你的主服務(wù)器和從服務(wù)器是否運作正常。
提醒(Notification): 當(dāng)被監(jiān)控的某個 Redis 服務(wù)器出現(xiàn)問題時, Sentinel 可以通過API 向管理員或者其他應(yīng)用程序發(fā)送通知。
自動故障遷移(Automatic failover): 當(dāng)一個主服務(wù)器不能正常工作時, Sentinel 會開始一次自動故障遷移操作, 它會將失效主服務(wù)器的其中一個從服務(wù)器升級為新的主服務(wù)器, 并讓失效主服務(wù)器的其他從服務(wù)器改為復(fù)制新的主服務(wù)器; 當(dāng)客戶端試圖連接失效的主服務(wù)器時, 集群也會向客戶端返回新主服務(wù)器的地址, 使得集群可以使用新主服務(wù)器代替失效服務(wù)器。
Redis Sentinel 是一個分布式系統(tǒng), 你可以在一個架構(gòu)中運行多個 Sentinel 進(jìn)程(progress), 這些進(jìn)程使用流言協(xié)議(gossip protocols)來接收關(guān)于主服務(wù)器是否下線的信息, 并使用投票協(xié)議(agreement protocols)來決定是否執(zhí)行自動故障遷移,以及選擇哪個從服務(wù)器作為新的主服務(wù)器。
雖然 Redis Sentinel 釋出為一個單獨的可執(zhí)行文件 redis-sentinel , 但實際上它只是一個運行在特殊模式下的 Redis 服務(wù)器, 你可以在啟動一個普通 Redis 服務(wù)器時通過給定 --sentinel 選項來啟動Redis Sentinel 。
1.2相關(guān)配置
案例:
如果要監(jiān)控兩個redis實例,可以進(jìn)行如下配置Redis安裝目錄下sentinel.conf文件:
常規(guī)配置:
port 26379
daemonize yes
logfile "/var/log/redis/sentinel.log"
#master 7000
sentinel monitor master1 127.0.0.1 7000 2 #配置master名、ip、port、需要多少個sentinel才能判斷[客觀下線](2)
sentinel down-after-milliseconds master-7000 30000 #配置sentinel向master發(fā)出ping,最大響應(yīng)時間、超過則認(rèn)為主觀下線
sentinel parallel-syncs master-7000 1 #配置在進(jìn)行故障轉(zhuǎn)移時,運行多少個slave進(jìn)行數(shù)據(jù)備份同步(越少速度越快)
sentinel failover-timeout master-7000 180000 #配置當(dāng)出現(xiàn)failover時下一個sentinel與上一個sentinel對[同一個master監(jiān)測的時間間隔](最后設(shè)置為客觀下線)
#master 7001
sentinel monitor master2 127.0.0.1 7001 1
sentinel down-after-milliseconds master-7001 30000
sentinel parallel-syncs master-7001 1
sentinel failover-timeout master-7001 180000
特殊配置:
min-slaves-to-write 1
min-slaves-max-lag 10
通過上面的配置,當(dāng)一個redis是master時,如果它不能向至少一個slave寫數(shù)據(jù)(上面的min-slaves-to-write指定了slave的數(shù)量),它將會拒絕接受客戶端的寫請求。由于復(fù)制是異步的,master無法向slave寫數(shù)據(jù)意味著slave要么斷開連接了,要么不在指定時間內(nèi)向master發(fā)送同步數(shù)據(jù)的請求了(上面的min-slaves-max-lag指定了這個時間)。
1.3 相關(guān)術(shù)語說明
Sentinel包括兩個重要的術(shù)語:<主觀下線和客觀下線>
1. 主觀下線(Subjectively Down, 簡稱 SDOWN)指的是單個 Sentinel 實例對服務(wù)器做出的下線判斷。
2. 客觀下線(Objectively Down, 簡稱 ODOWN)指的是多個 Sentinel 實例在對同一個服務(wù)器做出 SDOWN 判斷, 并且通過SENTINEL is-master-down-by-addr 命令互相交流之后, 得出的服務(wù)器下線判斷。
客觀下線條件只適用于主服務(wù)器: 對于任何其他類型的 Redis 實例, Sentinel 在將它們判斷為下線前不需要進(jìn)行協(xié)商, 所以從服務(wù)器或者其他 Sentinel 永遠(yuǎn)不會達(dá)到客觀下線條件。
只要一個 Sentinel 發(fā)現(xiàn)某個主服務(wù)器進(jìn)入了客觀下線狀態(tài), 這個Sentinel 就可能會被其他 Sentinel 推選出, 并對失效的主服務(wù)器執(zhí)行自動故障遷移操作。
每個Sentinel實例都執(zhí)行的定時任務(wù)
1. 每個Sentinel 以每秒鐘一次的頻率向它所知的主服務(wù)器、從服務(wù)器以及其他 Sentinel 實例發(fā)送一個 PING 命令。
2. 如果一個實例(instance)距離最后一次有效回復(fù) PING 命令的時間超過 down-after-milliseconds 選項所指定的值, 那么這個實例會被 Sentinel 標(biāo)記為主觀下線。 一個有效回復(fù)可以是: +PONG 、 -LOADING 或者-MASTERDOWN 。
3. 如果一個主服務(wù)器被標(biāo)記為主觀下線, 那么正在監(jiān)視這個主服務(wù)器的所有 Sentinel 要以每秒一次的頻率確認(rèn)主服務(wù)器的確進(jìn)入了主觀下線狀態(tài)。
4. 如果一個主服務(wù)器被標(biāo)記為主觀下線, 并且有足夠數(shù)量的 Sentinel (至少要達(dá)到配置文件指定的數(shù)量)在指定的時間范圍內(nèi)同意這一判斷, 那么這個主服務(wù)器被標(biāo)記為客觀下線。
5. 在一般情況下, 每個 Sentinel 會以每10 秒一次的頻率向它已知的所有主服務(wù)器和從服務(wù)器發(fā)送 INFO 命令。 當(dāng)一個主服務(wù)器被 Sentinel 標(biāo)記為客觀下線時, Sentinel 向下線主服務(wù)器的所有從服務(wù)器發(fā)送 INFO 命令的頻率會從 10 秒一次改為每秒一次。
6. 當(dāng)沒有足夠數(shù)量的 Sentinel 同意主服務(wù)器已經(jīng)下線, 主服務(wù)器的客觀下線狀態(tài)就會被移除。 當(dāng)主服務(wù)器重新向 Sentinel 的 PING 命令返回有效回復(fù)時, 主服務(wù)器的主管下線狀態(tài)就會被移除。
1.4服務(wù)日志說明
Sentinel服務(wù)啟動后會打印一些相關(guān)日志信息,以下是相關(guān)日志特殊字符說明:
+reset-master <instance details> :主服務(wù)器已被重置。
+slave <instance details> :一個新的從服務(wù)器已經(jīng)被 Sentinel 識別并關(guān)聯(lián)。
+failover-state-reconf-slaves <instancedetails> :故障轉(zhuǎn)移狀態(tài)切換到了reconf-slaves 狀態(tài)。
+failover-detected <instance details>:另一個 Sentinel 開始了一次故障轉(zhuǎn)移操作,或者一個從服務(wù)器轉(zhuǎn)換成了主服務(wù)器。
+slave-reconf-sent <instance details>:領(lǐng)頭(leader)的 Sentinel 向?qū)嵗l(fā)送了 SLAVEOF 命令,為實例設(shè)置新的主服務(wù)器。
+slave-reconf-inprog <instancedetails> :實例正在將自己設(shè)置為指定主服務(wù)器的從服務(wù)器,但相應(yīng)的同步過程仍未完成。
+slave-reconf-done <instance details>:從服務(wù)器已經(jīng)成功完成對新主服務(wù)器的同步。
-dup-sentinel <instance details> :對給定主服務(wù)器進(jìn)行監(jiān)視的一個或多個 Sentinel 已經(jīng)因為重復(fù)出現(xiàn)而被移除 —— 當(dāng) Sentinel 實例重啟的時候,就會出現(xiàn)這種情況。
+sentinel <instance details> :一個監(jiān)視給定主服務(wù)器的新 Sentinel 已經(jīng)被識別并添加。
+sdown <instance details> :給定的實例現(xiàn)在處于主觀下線狀態(tài)。
-sdown <instance details> :給定的實例已經(jīng)不再處于主觀下線狀態(tài)。
+odown <instance details> :給定的實例現(xiàn)在處于客觀下線狀態(tài)。
-odown <instance details> :給定的實例已經(jīng)不再處于客觀下線狀態(tài)。
+new-epoch <instance details> :當(dāng)前的紀(jì)元(epoch)已經(jīng)被更新。
+try-failover <instance details> :一個新的故障遷移操作正在執(zhí)行中,等待被大多數(shù) Sentinel 選中(waiting to be elected by themajority)。
+elected-leader <instance details> :贏得指定紀(jì)元的選舉,可以進(jìn)行故障遷移操作了。
+failover-state-select-slave <instancedetails> :故障轉(zhuǎn)移操作現(xiàn)在處于select-slave 狀態(tài) —— Sentinel 正在尋找可以升級為主服務(wù)器的從服務(wù)器。
no-good-slave <instance details> :Sentinel 操作未能找到適合進(jìn)行升級的從服務(wù)器。Sentinel 會在一段時間之后再次嘗試尋找合適的從服務(wù)器來進(jìn)行升級,又或者直接放棄執(zhí)行故障轉(zhuǎn)移操作。
selected-slave <instance details> :Sentinel 順利找到適合進(jìn)行升級的從服務(wù)器。
failover-state-send-slaveof-noone<instance details> :Sentinel 正在將指定的從服務(wù)器升級為主服務(wù)器,等待升級功能完成。
failover-end-for-timeout <instancedetails> :故障轉(zhuǎn)移因為超時而中止,不過最終所有從服務(wù)器都會開始復(fù)制新的主服務(wù)器(slaves will eventually be configured to replicate with the newmaster anyway)。
failover-end <instance details> :故障轉(zhuǎn)移操作順利完成。所有從服務(wù)器都開始復(fù)制新的主服務(wù)器了。
+switch-master <master name><oldip> <oldport> <newip> <newport> :配置變更,主服務(wù)器的 IP 和地址已經(jīng)改變。 這是絕大多數(shù)外部用戶都關(guān)心的信息。
+tilt :進(jìn)入 tilt 模式。
-tilt :退出 tilt 模式。
1.5測試驗證
可以對master-slave進(jìn)行測試,將master關(guān)閉,此時slave會自動充當(dāng)新的new-master;
當(dāng)old-master恢復(fù)后,會充當(dāng)new-master的slave,即:在這個過程中,sentinel.conf會被改寫,改寫為當(dāng)前監(jiān)控的主機(jī)master服務(wù);
如下圖測試所示:
Master服務(wù)停止:
Old-Master恢復(fù)服務(wù):
以上這篇Redis Sentinel服務(wù)配置流程(詳解)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
springboot整合使用云服務(wù)器上的Redis方法
這篇文章主要介紹了springboot整合使用云服務(wù)器上的Redis,整合步驟通過導(dǎo)入依賴,配置yml文件,注入redisTemplate結(jié)合實例代碼給大家介紹的非常詳細(xì),文中給大家分享了可能遇到的坑,感興趣的朋友跟隨小編一起看看吧2022-09-09Redis高級數(shù)據(jù)類型Hyperloglog、Bitmap的使用
很多小伙伴在面試中都會被問道 Redis的常用數(shù)據(jù)結(jié)構(gòu)有哪些?可能很大一部分回答都是 string、hash、list、set、zset,但其實還有Hyperloglog和Bitmap,本文就來介紹一下2021-05-05詳解如何發(fā)現(xiàn)并解決Redis熱點Key問題
Redis 熱點 Key 是指在某一時間段內(nèi),被大量的讀寫操作命中的 Key,這種情況可能會導(dǎo)致性能瓶頸,數(shù)據(jù)一致性問題,緩存擊穿等問題,所以本文給大家介紹了如何發(fā)現(xiàn)并解決Redis熱點Key問題,需要的朋友可以參考下2024-05-05關(guān)于Redis未授權(quán)訪問漏洞利用的介紹與修復(fù)建議
Redis是一個開源的使用ANSI C語言編寫、支持網(wǎng)絡(luò)、可基于內(nèi)存亦可持久化的日志型、Key-Value數(shù)據(jù)庫,并提供多種語言的API,下面這篇文章主要給大家介紹了關(guān)于Redis未授權(quán)訪問漏洞利用的介紹和修復(fù)建議,文中介紹的非常詳細(xì),需要的朋友可以參考下。2017-07-07Redisson之lock()和tryLock()的區(qū)別及說明
這篇文章主要介紹了Redisson之lock()和tryLock()的區(qū)別及說明,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教2023-12-12