Redis數(shù)據(jù)結(jié)構(gòu)之鏈表與字典的使用
今天我們來聊一聊Redis中的鏈表與字典,具體如下:
鏈表
關(guān)于鏈表的基礎(chǔ)概念其實你在學(xué)習(xí)Redis之前一定積累了不少,所以本文將默認(rèn)你已經(jīng)掌握了鏈表相關(guān)的基礎(chǔ)知識,而Redis的鏈表其實也就是普通的鏈表~
因為Redis是使用C語言編寫的,因此Redis的數(shù)據(jù)結(jié)構(gòu)的定義都是使用C語法定義的,你不需要完全理解下方C語言聲明結(jié)構(gòu)體的語法,但我認(rèn)為依靠大家的Java知識也能理解這就像是在Java中定義了一個鏈表對象
Redis鏈表節(jié)點的結(jié)構(gòu)
typedef struct listNode { struct listNode *prev; //指向前一個鏈表節(jié)點 struct listNode *next; //指向后一個鏈表節(jié)點 void *value; //當(dāng)前節(jié)點的值(可以按需設(shè)定不同數(shù)據(jù)類型的value) } listNode;
很明顯,當(dāng)每一個節(jié)點內(nèi)記錄了前后兩個節(jié)點位置之后,鏈表節(jié)點之間就能夠彼此前后相連,組成雙向通行車道(可以雙向遍歷)
Redis鏈表的表示
上面講解了Redis的鏈表的節(jié)點表示,并由此引申了一下可以借此構(gòu)建Redis雙端鏈表,而事實上,對于每一個存在的雙端鏈表,Redis使用一個list結(jié)構(gòu)來表示
typedef struct list { listNode *head; //表頭節(jié)點 listNode *tail; //表尾節(jié)點 unsigned long len; //鏈表所包含的節(jié)點的數(shù)量 void *(*dup)(void *ptr); //節(jié)點復(fù)制函數(shù) void (*free)(void *ptr); //節(jié)點釋放函數(shù) void (*match)(void *ptr, void *key);//節(jié)點值對比函數(shù) } list;
很明顯,你看到三個好像是返回值為void的函數(shù),但是看不懂C語法,沒關(guān)系,傳統(tǒng)后端功夫,自然是點到為止
Redis鏈表用在哪
我不想現(xiàn)在就告訴你,鏈表被廣泛用于實現(xiàn)Redis的各種功能,比如列表鍵、發(fā)布于訂閱、慢查詢、監(jiān)視器等,等我們后面講到這幾部分的時候,白澤再結(jié)合鏈表和你細(xì)說~
字典
和鏈表一樣,Redis所使用的C語言并沒有內(nèi)置字典這種數(shù)據(jù)結(jié)構(gòu),因此Redis構(gòu)建了自己的字典實現(xiàn)。如果你學(xué)過數(shù)據(jù)結(jié)構(gòu),你會發(fā)現(xiàn)Redis的字典事實上就是數(shù)據(jù)結(jié)構(gòu)中的鄰接表,即使沒學(xué)過,往下看就好啦~
Redis字典結(jié)構(gòu)總覽
數(shù)組 + 鏈表 ==> 鄰接表,實錘
Redis字典結(jié)構(gòu)分解
還記得嗎,上面我們說Redis鏈表可以用list描述,但是鏈表存儲的數(shù)據(jù)本質(zhì)上,是由一系列l(wèi)istNode節(jié)點通過前后指針相連存儲的;類似的,Redis字典可以用如下dict描述,但是字典存儲的數(shù)據(jù)本質(zhì)上,是由數(shù)組 + 若干鏈表組合得到的數(shù)據(jù)結(jié)構(gòu)存儲的,字典dict結(jié)構(gòu)如下:
typedef struct dict { dictType *type; //類型特定函數(shù) void *privdata; //私有數(shù)據(jù) dictht ht[2]; //哈希表數(shù)組 int trehashidx; //rehash索引,當(dāng)rehash不在進(jìn)行時,值為-1 } dict;
現(xiàn)在你只需要關(guān)注其中的哈希表數(shù)組ht[2],它的數(shù)據(jù)類型為dictht,因此也是一種復(fù)合的數(shù)據(jù)結(jié)構(gòu),如下:
typedef struct dictht { dictEntry **table; //哈希表數(shù)組 unsigned long size; //哈希表大小 unsigned long sizemax; //哈希表大小掩碼,用于計算索引值,等于size - 1 unsigned long used; //該哈希表已有節(jié)點的數(shù)量 } dictht;
哈希表dictht是Redis字典的核心,dictht的四個屬性中,size、sizemax、used都是用于描述table屬性整體狀態(tài)??吹竭@你就明白了,dictht的核心是dictEntry類型的table屬性(再次提醒,如果沒有C語言的基礎(chǔ),本文中一切你看不懂的語法,包括數(shù)據(jù)類型,你只需要一眼帶過即可,我們的目的是學(xué)習(xí)Redis的設(shè)計思想)
table屬性是一個數(shù)組,數(shù)組中的每個元素都是一個指向dictEntry結(jié)構(gòu)的指針,每個dictEntry結(jié)構(gòu)保存一個鍵值對,并含有一個指向下一個dictEntry的指針,結(jié)構(gòu)如下:
typedef struct dictEntry { void *key; //鍵 union { //值(可以是一個指針,可以是一個uint64_t類型的整數(shù),也可以是一個int64_t類型的整數(shù)) void *val; uint64_t u64; int64_t s64; } v; struct dictEntry *next;//指向下個哈希表節(jié)點,形成鏈表 } dictEntry;
哈希算法
我們知道,字典是用來存儲數(shù)據(jù)的,并且是以鍵值對的形式存儲的,那么我每次存入一個鍵值對放在字典的哪里?這就是哈希算法為你解決的事情:程序需要先根據(jù)鍵值對的鍵計算出哈希值和索引值,然后再根據(jù)索引值,將包含新鍵值對的哈希表節(jié)點放到哈希表數(shù)組的指定索引上面
比如我已經(jīng)有下面這個字典,然后要插入一個鍵值對數(shù)據(jù):k1 : v1,則程序有如下計算過程:(用戶只是往Redis服務(wù)器中插入了一條數(shù)據(jù),下面都是程序內(nèi)部的工作~)
hash = dict->type->hashFunction(k1); //計算k1鍵的hash值(得到某個數(shù)值) index = hash & dict->ht[0].sizemask = 1; //計算k1鍵插入位置的索引值
解決鍵沖突
鍵沖突:當(dāng)不同的key值計算得到的dictEntry索引值相同時,就稱發(fā)生鍵沖突(我要插入的位置已經(jīng)被占用了,插入使得鏈表長度由1變多,當(dāng)然第一次插入不算沖突)
解決方法:
就像上面我要插入一個k1 :v1的鍵值對,并計算得到插入位置的索引為1(但是distEntry數(shù)組中索引為1的位置已經(jīng)有k0 :v0鍵值對存放了),因此程序會在哈希表ht[0]的dictEntry數(shù)組的索引為1的位置上插入一個dictEntry節(jié)點,放在原本鏈表首部的前一位置(搶占首位),其中存放著k1 : v1鍵值對,插入后的圖如下:
你可能疑惑新插入的鍵值對的位置在每個dictEntry鏈表的最前面,而不是尾部,原因是每個dictEntry中除了保存鍵值對之外,只記錄了下一個dictEntry的地址(上面我已經(jīng)給出了dictEntry的結(jié)構(gòu)了~),程序無法直接得到dictEntry鏈表的最后一個節(jié)點,但可以直接得到第一個節(jié)點(通過dictEntry數(shù)組索引直接定位),因此每次插入的dictEntry節(jié)點(鍵值對)都將直接插入到對應(yīng)索引的鏈表的頭部(因此dictEntry數(shù)組的內(nèi)容是不斷在變的)
一句話來說:distEntry數(shù)組幫助使用索引定位,distEntry鏈表,用于處理沖突,不斷維護(hù)所存儲的鍵值對數(shù)據(jù)
rehash
隨著操作的不斷執(zhí)行(增、刪、改、查),哈希表保存的鍵值對會逐漸增多或者減少,為了讓哈希表的負(fù)載因子維持在一個合理范圍內(nèi),當(dāng)哈希表保存的鍵值對數(shù)量太多或太少時,程序會對哈希表的大小進(jìn)行相應(yīng)的擴(kuò)展或者收縮(不知道你是否記得還有一個哈希表ht[1]的存在,這個表就是為了和ht[0]配合進(jìn)行rehash而存在的)
rehash步驟:
為字典的ht[1]哈希表分配空間
如果程序執(zhí)行擴(kuò)展操作:
ht[1].size = 第一個大于等于ht[0].used * 2(ht[0]已經(jīng)使用的空間大小乘2)的2的n次方冪
如果程序執(zhí)行收縮操作:
ht[1].size = 第一個大于等于ht[0].used(ht[0]已經(jīng)使用的空間大?。┑?的n次方冪
將保存在ht[0]上的鍵值對rehash到ht[1]上,因為size不同,所以是重新hash,而不是整體復(fù)制
當(dāng)ht[0]內(nèi)鍵值對全部遷移到ht[1]中后,釋放ht[0],然后將ht[1]和ht[0]的互換(rehash結(jié)束),此時ht[0]就是一個rehash后的哈希表,而ht[1]依舊為空表,為下次rehash做準(zhǔn)備
漸進(jìn)式rehash
上面提到的在哈希表ht[0]的負(fù)載因子過大或者過小會觸發(fā)rehash,但是,事實上rehash遷移的過程不是一蹴而就的(很明顯,如果數(shù)據(jù)ht[0]的數(shù)據(jù)很多,每次rehash如果都遷移全部數(shù)據(jù),需要花費較大時間等待,用戶在rehash期間訪問Redis服務(wù)器將會陷入無響應(yīng)的狀態(tài))
漸進(jìn)式過程:
將rehash的過程分?jǐn)傇诤罄m(xù)的每次增、刪、改、查操作上,在rehash期間,每次對字典執(zhí)行操作,程序除了執(zhí)行指定操作外,還會順帶將ht[0]哈希表在rehashidx索引(從0開始,-1表示rehash未開始)上的所有鍵值對rehash到ht[1],當(dāng)每次局部rehash工作完成后,程序?qū)ehashidx屬性的值增一
注意:每次對字典進(jìn)行增、刪、改、查會在ht[0]和ht[1]上同時進(jìn)行,比如查找一個鍵,則會現(xiàn)在ht[0]上查找,沒找到再去ht[1]上查找,諸如此類,除了增加操作每次都將直接hash到ht[1]上,不會對ht[0]執(zhí)行任何添加操作
到此這篇關(guān)于Redis數(shù)據(jù)結(jié)構(gòu)之鏈表與字典的使用的文章就介紹到這了,更多相關(guān)Redis 鏈表與字典內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
SpringBoot整合Mybatis-plus和Redis實現(xiàn)投票功能
投票功能是一個非常常見的Web應(yīng)用場景,這篇文章將為大家介紹一下如何將Redis和Mybatis-plus整合到SpringBoot中,實現(xiàn)投票功能,感興趣的可以了解一下2023-05-05Quarkus集成redis操作Redisson實現(xiàn)數(shù)據(jù)互通
這篇文章主要為大家介紹了Quarkus集成redis操作Redisson實現(xiàn)數(shù)據(jù)互通的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2022-02-02