淺析Redis中String數(shù)據(jù)類(lèi)型及其底層編碼
從 RedisObject 說(shuō)起
在 Redis 中,任意數(shù)據(jù)類(lèi)型的鍵和值都會(huì)被封裝為一個(gè) RedisObject ,也叫做Redis對(duì)象,源碼如下
/*server.h*/ typedef struct redisObject { unsigned type:4; unsigned encoding:4; unsigned lru:LRU_BITS; /* LRU time (relative to global lru_clock) or * LFU data (least significant 8 bits frequency * and most significant 16 bits access time). */ int refcount; void *ptr; } robj;
我們來(lái)看一下這個(gè)結(jié)構(gòu)體中的成員變量分別代表什么:
unsigned type:4
:對(duì)象類(lèi)型,分別是string hash list set zset
,占 4 個(gè) bit 位,如下所示
#define OBJ_STRING 0 /* String object. */ #define OBJ_LIST 1 /* List object. */ #define OBJ_SET 2 /* Set object. */ #define OBJ_ZSET 3 /* Sorted set object. */ #define OBJ_HASH 4 /* Hash object. */
unsigned encoding:4
: 底層編碼方式,共有 11 種,4 個(gè) bit 位unsigned lru:LRU_BITS
:該對(duì)象最后一次被訪(fǎng)問(wèn)的時(shí)間,占 24 個(gè) bit ,在 Redis 內(nèi)存回收中起到關(guān)鍵作用int refcount
:對(duì)象引用計(jì)數(shù)器,計(jì)數(shù)器為 0 則說(shuō)明對(duì)象無(wú)人引用,可以被回收void *ptr
:指針,指向存放實(shí)際數(shù)據(jù)的空間
我們注意到,在 Redis 中有 5 中數(shù)據(jù)結(jié)構(gòu)(用戶(hù)使用的),但在底層卻有 11 種編碼方式,Redis 會(huì)根據(jù)存儲(chǔ)的數(shù)據(jù)類(lèi)型、存儲(chǔ)數(shù)據(jù)的大小,選擇不同的編碼方式,以獲得最優(yōu)的性能。一種數(shù)據(jù)結(jié)構(gòu)會(huì)對(duì)應(yīng)多種數(shù)據(jù)結(jié)構(gòu),如下表所示。
數(shù)據(jù)類(lèi)型 | 編碼方式 |
---|---|
OBJ_STRING | int、embstr、raw |
OBJ_LIST | LinkedList和ZipList(3.2以前)、QuickList(3.2以后) |
OBJ_SET | intset、HT |
OBJ_ZSET | ZipList、HT、SkipList |
OBJ_HASH | ZipList、HT |
下面,我們現(xiàn)在介紹以下 String 數(shù)據(jù)類(lèi)型,及其底層的編碼方式。
Redis 數(shù)據(jù)結(jié)構(gòu) -- String
String 類(lèi)型的基本介紹和命令
String 類(lèi)型,也就是字符串類(lèi)型,是Redis中最簡(jiǎn)單的存儲(chǔ)類(lèi)型。它可以存儲(chǔ)字符串、整數(shù)或浮點(diǎn)數(shù)。下面是一些 String 類(lèi)型常用的命令
SET key value
:設(shè)置指定 key 的值為指定的字符串或數(shù)字。GET key
:獲取指定 key 的值。
本地虛擬機(jī)redis:0>set key01 value01
"OK"
本地虛擬機(jī)redis:0>get key01
"value01"
INCR key
:將指定 key 的值加 1,如果該 key 不存在,則先將其設(shè)置為 0,再進(jìn)行加 1 操作。DECR key
:將指定 key 的值減 1,如果該 key 不存在,則先將其設(shè)置為 0,再進(jìn)行減 1 操作。INCRBY key increment
:將指定 key 的值增加指定的增量。DECRBY key decrement
:將指定 key 的值減少指定的減量。APPEND key value
:將指定的值追加到指定 key 的值的末尾。STRLEN key
:返回指定 key 的值的長(zhǎng)度。GETRANGE key start end
:返回指定 key 的值的子字符串,根據(jù)起始位置和結(jié)束位置指定。SETRANGE key offset value
:將指定 key 的值從指定偏移位置開(kāi)始,替換為指定的字符串。MSET key1 value1 [key2 value2 ...]
:同時(shí)設(shè)置多個(gè) key 的值。(”[ ]” 中括號(hào)內(nèi)表示可選)MGET key1 [key2 ...]
:獲取多個(gè) key 的值。
?? 這里僅給出 SET、GET 命令,其他的請(qǐng)自行測(cè)試。這些命令只是 Redis String 類(lèi)型命令的一小部分,Redis 還提供了其他更多的命令來(lái)處理 String 類(lèi)型的數(shù)據(jù)。你可以參考 Redis 官方文檔以獲取完整的命令列表和詳細(xì)的命令說(shuō)明。
String 類(lèi)型的底層實(shí)現(xiàn)
在 Redis 中,String 類(lèi)型的數(shù)據(jù)結(jié)構(gòu)并不是采用 C 語(yǔ)言中自帶的字符串類(lèi)型,C 語(yǔ)言中的數(shù)據(jù)結(jié)構(gòu)存在很多問(wèn)題,比如:
- 獲取字符串長(zhǎng)度的需要通過(guò)運(yùn)算
- 非二進(jìn)制安全
- 不可修改
因此,String 在 Redis 中有其他三種編碼方式: int、embstr、raw
。其中, raw 和 embstr 類(lèi)型,都是基于動(dòng)態(tài)字符串(SDS)實(shí)現(xiàn)的,下面我們先來(lái)看看動(dòng)態(tài)字符串的結(jié)構(gòu)是怎樣的。
動(dòng)態(tài)字符串(SDS)
動(dòng)態(tài)字符串的結(jié)構(gòu)體如下
struct __attribute__ ((__packed__)) hisdshdr8 { uint8_t len; /* used */ uint8_t alloc; /* excluding the header and null terminator */ unsigned char flags; /* 3 lsb of type, 5 unused bits */ char buf[]; };
這里解釋一下結(jié)構(gòu)體中各個(gè)成員變量的作用:
len
:已經(jīng)保存的字符串字節(jié)數(shù),不包含結(jié)束標(biāo)示alloc
:申請(qǐng)的總的字節(jié)數(shù),不包含結(jié)束標(biāo)示flags
:不同的 SDS 的頭類(lèi)型,用來(lái)控制 SDS 的頭大小buf[]
:真正存儲(chǔ)數(shù)據(jù)
我們先來(lái)聊一下 flags
這個(gè)成員變量。在 redis 中其實(shí)定義了 5 個(gè) SDS結(jié)構(gòu)體(其中 hisdshdr5 已經(jīng)棄用)如圖所示。他們之間的主要區(qū)別在于 len 和 alloc 的長(zhǎng)度不同。
在 redis 中,為了盡可能地節(jié)省內(nèi)存空間,當(dāng)字符串長(zhǎng)度在不同的區(qū)間時(shí),會(huì)選擇不同的結(jié)構(gòu)體,例如:
- 當(dāng)字符串長(zhǎng)度在 0~255 個(gè)字節(jié)之間時(shí),會(huì)選擇 hisdshdr8 ,這樣一來(lái),用于表示字符串字節(jié)數(shù)和申請(qǐng)的總字節(jié)數(shù)的空間就會(huì)被大大節(jié)省,以此類(lèi)推。
例如,一個(gè)包含字符串“name”的 sds 結(jié)構(gòu)如下:
SDS之所以叫做動(dòng)態(tài)字符串,是因?yàn)樗?strong>具備動(dòng)態(tài)擴(kuò)容的能力,例如一個(gè)內(nèi)容為 “hello” 的 SDS,假如我們要給這個(gè) SDS 追加一段字符串 ”world” ,這里首先會(huì)申請(qǐng)新內(nèi)存空間:
- 如果新字符串小于1M,則新空間為擴(kuò)展后字符串長(zhǎng)度的兩倍+1
- 如果新字符串大于1M,則新空間為擴(kuò)展后字符串長(zhǎng)度+1M+1。
這種機(jī)制稱(chēng)為內(nèi)存預(yù)分配。內(nèi)存預(yù)分配可以減少進(jìn)行內(nèi)存重新分配的開(kāi)銷(xiāo),減少內(nèi)存碎片,使得 redis 的性能得到提高,空間利用率也得到提高。
String 的三種編碼方式
RAW
- raw 是 string 的基本編碼方式,基于簡(jiǎn)單動(dòng)態(tài)字符串(SDS)實(shí)現(xiàn),存儲(chǔ)上限為512mb。當(dāng)一個(gè)字符串采用 raw 的編碼方式的時(shí)候,它的結(jié)構(gòu)如圖所示。
EMBSTR
- 如果存儲(chǔ)在 SDS 中的數(shù)據(jù)小于等于 44 字節(jié),則會(huì)采用 EMBSTR 編碼,此時(shí) **RedisObject 與 SDS 是一段連續(xù)空間。而不是像 RAW 的編碼方式一樣,由 ptr 指向另外一片空間,**申請(qǐng)內(nèi)存時(shí)只需要調(diào)用一次內(nèi)存分配函數(shù),效率更高。結(jié)構(gòu)如下,
?? 為什么是 44 字節(jié)?Redis 默認(rèn)的內(nèi)存分配器 jemalloc 分配內(nèi)存大小的單位是 $2^n$ ,因此,如果分配的空間大小為 2、4 、8 … 字節(jié)等 $2^n$ 字節(jié),就不會(huì)產(chǎn)生內(nèi)存碎片。
而 redisObject
和 hisdshdr8
中 len alloc flags
三個(gè)成員變量加起來(lái)剛剛好是 16 + 4 = 20 字節(jié),如果 char[]
(數(shù)據(jù)大?。┑拇笮?44 字節(jié)時(shí),加起來(lái)剛剛好是 64 字節(jié),也即 262^626 不會(huì)產(chǎn)生內(nèi)存碎片。
- RAW 和 EMBSTR 的編碼演示
/* 44個(gè)v,采用embstr編碼*/ 本地虛擬機(jī)redis:0>set key vvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvv "OK" 本地虛擬機(jī)redis:0>object encoding key "embstr" /* 45個(gè)v,采用embstr編碼*/ 本地虛擬機(jī)redis:0>set key vvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvvv "OK" 本地虛擬機(jī)redis:0>object encoding key "raw"
INT
- 如果存儲(chǔ)的字符串是整數(shù)值,并且大小在 LONG MAX 范圍內(nèi),則會(huì)采用 INT 編碼
- 直接將數(shù)據(jù)保存在 RedisObject 的 ptr 指針位置(剛好8字節(jié)),不再需要SDS了。
- INT 編碼演示
本地虛擬機(jī)redis:0>set key 12 "OK" 本地虛擬機(jī)redis:0>object encoding key "int"
寫(xiě)在最后:在使用 string 類(lèi)型時(shí),盡可能讓其長(zhǎng)度小于 44 字節(jié),或者使用整數(shù)表示,使其使用 EMBSTR 和 INT 編碼
以上就是淺析Redis中String數(shù)據(jù)類(lèi)型及其底層編碼的詳細(xì)內(nèi)容,更多關(guān)于Redis Redis數(shù)據(jù)類(lèi)型及編碼的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Redis數(shù)據(jù)導(dǎo)入導(dǎo)出以及數(shù)據(jù)遷移的4種方法詳解
這篇文章主要介紹了Redis數(shù)據(jù)導(dǎo)入導(dǎo)出以及數(shù)據(jù)遷移的4種方法詳解,需要的朋友可以參考下2020-02-02使用Spring?Boot實(shí)現(xiàn)Redis鍵過(guò)期回調(diào)功能示例詳解
這篇文章主要介紹了使用Spring?Boot實(shí)現(xiàn)Redis鍵過(guò)期回調(diào)功能,就是一個(gè)實(shí)現(xiàn)Redis鍵過(guò)期回調(diào)功能的Spring?Boot應(yīng)用的示例,代碼簡(jiǎn)單易懂,對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-07-07Redis數(shù)據(jù)庫(kù)的使用場(chǎng)景介紹(避免誤用Redis)
這篇文章主要介紹了Redis數(shù)據(jù)庫(kù)的使用場(chǎng)景介紹(避免誤用Redis),本文用簡(jiǎn)要的語(yǔ)言總結(jié)了Redis數(shù)據(jù)庫(kù)的適應(yīng)場(chǎng)合,人而避免錯(cuò)誤的使用它而產(chǎn)生昂貴的維護(hù)代價(jià),需要的朋友可以參考下2015-03-03Redis報(bào)錯(cuò):Could not create server TCP 
這篇文章主要介紹了Redis報(bào)錯(cuò):Could not create server TCP listening socket 127.0.0.1:6379: bind:解決方法,是安裝與啟動(dòng)Redis過(guò)程中比較常見(jiàn)的問(wèn)題,需要的朋友可以參考下2023-06-06Redis消息隊(duì)列實(shí)現(xiàn)秒殺教程
這篇文章主要介紹了Redis消息隊(duì)列實(shí)現(xiàn)秒殺教程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2025-04-04Redis?的內(nèi)存淘汰策略和過(guò)期刪除策略的區(qū)別
這篇文章主要介紹了Redis?的內(nèi)存淘汰策略和過(guò)期刪除策略的區(qū)別,Redis?是可以對(duì)?key?設(shè)置過(guò)期時(shí)間的,因此需要有相應(yīng)的機(jī)制將已過(guò)期的鍵值對(duì)刪除,而做這個(gè)工作的就是過(guò)期鍵值刪除策略2022-07-07在Centos?8.0中安裝Redis服務(wù)器的教程詳解
由于考慮到linux服務(wù)器的性能,所以經(jīng)常需要把一些中間件安裝在linux服務(wù)上,今天通過(guò)本文給大家介紹下在Centos?8.0中安裝Redis服務(wù)器的詳細(xì)過(guò)程,感興趣的朋友一起看看吧2022-03-03