Redis跳躍表的基本原理和實(shí)現(xiàn)
一、概述
跳躍表(skiplist)是一種有序數(shù)據(jù)結(jié)構(gòu),它通過在每個節(jié)點(diǎn)中維持多個指向其他節(jié)點(diǎn)的指針,從而達(dá)到快速訪問節(jié)點(diǎn)的目的。
如下,對于單個鏈表來講,即便鏈表中存儲的數(shù)據(jù)是有序的,如果我們要向在其中查找某個數(shù)據(jù),它只能從頭到尾遍歷鏈表。這樣查找效率就會很低,時(shí)間復(fù)雜度會很高,達(dá)到了O(n)。
如果我們想要提高其查詢效率,可以考慮在鏈表上構(gòu)建索引的 方式,每兩個節(jié)點(diǎn)提取一個節(jié)點(diǎn)到上級,我們把抽出來的那一級就叫做索引,如下:
此時(shí),我們假設(shè)要查找節(jié)點(diǎn)8,我們可以先在索引層遍歷,當(dāng)遍歷到索引層中值為7的節(jié)點(diǎn)時(shí),發(fā)現(xiàn)下一個節(jié)點(diǎn)是9,那么要查找的節(jié)點(diǎn)肯定在這兩個節(jié)點(diǎn)之間,我們下降到鏈表層繼續(xù)遍歷就找到了8這個節(jié)點(diǎn)。原來我們在單鏈表中找到8這個節(jié)點(diǎn)要遍歷8個節(jié)點(diǎn),而現(xiàn)在有了一級索引后,只需要遍歷5個節(jié)點(diǎn)。
從上個例子中,我們可以看出,加來一層索引后,查找一個節(jié)點(diǎn)需要遍歷的節(jié)點(diǎn)個數(shù)減少了,也就是說查詢效率得到了提升,同理我們在一級索引的基礎(chǔ)上,在加二級索引。
從圖中我們可以看出,查找效率又有了提升,因?yàn)樵谶@里例子中我們的數(shù)據(jù)量很少,當(dāng)有大量的數(shù)據(jù)時(shí),我們可以增加多級索引,在查詢時(shí),效率可以得到明顯的提升。像這種鏈表增加多種索引的結(jié)構(gòu),就是跳躍表。
Redis使用跳躍表作為有序集合鍵的底層實(shí)現(xiàn)之一,如果一個有序集合包含的元素?cái)?shù)量比較多,又或者有序集合中元素的成員(member)是比較長的字符串時(shí),Redis就會使用跳躍表來作為有序集合鍵的底層實(shí)現(xiàn)。
二、跳躍表的實(shí)現(xiàn)
Redis的跳躍表由zskiplistNode和zskiplist兩個結(jié)構(gòu)定義,其中zskiplistNode結(jié)構(gòu)用于表示跳躍表節(jié)點(diǎn),而zskiplist結(jié)構(gòu)則用于保存跳躍表節(jié)點(diǎn)的相關(guān)信息,比如節(jié)點(diǎn)的數(shù)量,以及指向表頭節(jié)點(diǎn)和表尾節(jié)點(diǎn)的指針等等,如下,是一個跳躍表的結(jié)構(gòu):
上圖片最左邊的是zskiplist結(jié)構(gòu),該結(jié)構(gòu)包含以下屬性:
- header:指向跳躍表的表頭節(jié)點(diǎn),通過這個指針程序定位表頭節(jié)點(diǎn)的時(shí)間復(fù)雜度就為O(1);
- tail:指向跳躍表的表尾節(jié)點(diǎn),通過這個指針程序定位表尾節(jié)點(diǎn)的時(shí)間復(fù)雜度就為O(1);
- level:記錄目前跳躍表內(nèi),層數(shù)最大的那個節(jié)點(diǎn)的層數(shù)(表頭節(jié)點(diǎn)的層數(shù)不計(jì)算在內(nèi));通過這個屬性可以再O(1)的時(shí)間復(fù)雜度內(nèi)獲取層高最高的節(jié)點(diǎn)的層數(shù)
- length:記錄跳躍表的長度,也即是,跳躍表目前包含節(jié)點(diǎn)的數(shù)量(表頭節(jié)點(diǎn)不計(jì)算在內(nèi))通過這個屬性,程序可以再O(1)的時(shí)間復(fù)雜度內(nèi)返回跳躍表的長度
上圖位于zskiplist結(jié)構(gòu)右方的是四個zskiplistNode結(jié)構(gòu),該結(jié)構(gòu)包含以下屬性:
- 層(level):節(jié)點(diǎn)中用L1、L2、L3等字樣標(biāo)記節(jié)點(diǎn)的各個層,L1代表第一層,L2代表第二層,以此類推。每個層都帶有兩個屬性:前進(jìn)指針和跨度。前進(jìn)指針用于訪問位于表尾方向的其他節(jié)點(diǎn),而跨度則記錄了前進(jìn)指針?biāo)赶蚬?jié)點(diǎn)和當(dāng)前節(jié)點(diǎn)的距離(跨度越大,距離越遠(yuǎn))。在上面的圖片中,連線上帶有數(shù)字的箭頭就代表前進(jìn)指針,而那個數(shù)字就是跨度。當(dāng)程序從表頭向表尾進(jìn)行遍歷時(shí),訪問會沿著層的前進(jìn)指針進(jìn)行。
- 后退(backward)指針:節(jié)點(diǎn)中用BW字樣標(biāo)記節(jié)點(diǎn)的后退指針,它指向位于當(dāng)前節(jié)點(diǎn)的前一個節(jié)點(diǎn)。后退指針在程序從表尾向表頭遍歷時(shí)使用
- 分值(score):各個節(jié)點(diǎn)中的1.0、2.0和3.0是節(jié)點(diǎn)所保存的分值。在跳躍表中,節(jié)點(diǎn)按各自所保存的分值從小到大排列。
- 成員對象(obj):各個節(jié)點(diǎn)中的o1、o2和o3是節(jié)點(diǎn)所保存的成員對象
2.1 跳躍表節(jié)點(diǎn)的zskiplisNode結(jié)構(gòu)定義
typedef struct zskiplistNode { // 層 struct zskiplistLevel { // 前進(jìn)指針 struct zskiplistNode *forward; // 跨度 unsigned int span; } level[]; // 后退指針 struct zskiplistNode *backward; // 分值 double score; // 成員對象 robj *obj; } zskiplistNode;
層:跳躍表節(jié)點(diǎn)的level數(shù)組可以包含多個元素,每個元素都包含一個指向其他節(jié)點(diǎn)的指針,程序可以通過這些層來加快訪問其他節(jié)點(diǎn)的速度,一般來說,層的數(shù)量越多,訪問其他節(jié)點(diǎn)的速度就越快。
每個層都有一個指向表尾方向的前進(jìn)指針(level[i].forward屬性),用于從表頭向表尾方向訪問節(jié)點(diǎn)
層的跨度(level[i].span屬性)用于記錄兩個節(jié)點(diǎn)之間的距離。
節(jié)點(diǎn)的后退指針(backward屬性)用于從表尾向表頭方向訪問節(jié)點(diǎn):跟可以一次跳過多個節(jié)點(diǎn)的前進(jìn)指針不同,因?yàn)槊總€節(jié)點(diǎn)只有一個后退指針,所以每次只能后退至前一個節(jié)點(diǎn)
節(jié)點(diǎn)的分值(score屬性)是一個double類型的浮點(diǎn)數(shù),跳躍表中的所有節(jié)點(diǎn)都按分值從小到大來排序;
節(jié)點(diǎn)的成員對象(obj屬性)是一個指針,它指向一個字符串對象,而字符串對象則保存著一個SDS值
2.2 zskiplist結(jié)構(gòu)的定義
typedef struct zskiplist { // 表頭節(jié)點(diǎn)和表尾節(jié)點(diǎn) structz skiplistNode *header, *tail; // 表中節(jié)點(diǎn)的數(shù)量 unsigned long length; // 表中層數(shù)最大的節(jié)點(diǎn)的層數(shù) int level; } zskiplist;
header和tail指針分別指向跳躍表的表頭和表尾節(jié)點(diǎn),通過這兩個指針,程序定位表頭節(jié)點(diǎn)和表尾節(jié)點(diǎn)的復(fù)雜度為O(1)。
通過使用length屬性來記錄節(jié)點(diǎn)的數(shù)量,程序可以在O(1)復(fù)雜度內(nèi)返回跳躍表的長度。
三、結(jié)束
Redis使用跳躍表作為有序集合鍵的底層實(shí)現(xiàn)之一,如果一個有序集合包含的元素?cái)?shù)量比較多,又或者有序集合中元素的成員(member)是比較長的字符串時(shí),Redis就會使用跳躍表來作為有序集合鍵的底層實(shí)現(xiàn)。之所以如此,是因?yàn)?strong>跳躍表在鏈表的基礎(chǔ)上增加了多級索引以提升查找的效率,但其是一個空間換時(shí)間的方案,必然會帶來一個問題——索引是占內(nèi)存的。原始鏈表中存儲的有可能是很大的對象,而索引結(jié)點(diǎn)只需要存儲關(guān)鍵值值和幾個指針,并不需要存儲對象,因此當(dāng)節(jié)點(diǎn)本身比較大或者元素?cái)?shù)量比較多的時(shí)候,其優(yōu)勢必然會被放大,而缺點(diǎn)則可以忽略。
到此這篇關(guān)于Redis跳躍表的基本原理和實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)Redis跳躍表內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Redis 單節(jié)點(diǎn)部署的實(shí)現(xiàn)
本文主要介紹了Redis 單節(jié)點(diǎn)部署的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-06-06