淺析對(duì)redis?hashtable?的sizemask理解
在 Redis 的哈希表實(shí)現(xiàn)中,index = hash & dict->ht[0].sizemask
是計(jì)算鍵值對(duì)應(yīng)存儲(chǔ)位置的核心操作。這個(gè)操作看起來簡單,但背后涉及哈希表的內(nèi)存布局和性能優(yōu)化策略。我們通過以下步驟逐步解析其原理:
一、哈希表的設(shè)計(jì)目標(biāo)
- 快速定位桶(Bucket):通過鍵的哈希值直接找到對(duì)應(yīng)的存儲(chǔ)位置,時(shí)間復(fù)雜度接近 O(1)。
- 均勻分布鍵值對(duì):減少哈希沖突,避免鏈表過長導(dǎo)致性能下降。
- 高效計(jì)算:避免使用耗時(shí)的取模運(yùn)算(
%
)。
二、哈希表大?。╯ize)的特殊性
Redis 的哈希表大小 size
始終是 2 的冪(如 4, 8, 16, 32 等)。這種設(shè)計(jì)有兩個(gè)關(guān)鍵優(yōu)勢(shì):
- 快速計(jì)算索引:用位運(yùn)算(
&
)替代取模運(yùn)算(%
)。 - 均勻分布哈希值:減少哈希沖突的概率。
三、sizemask 的作用
• 定義:sizemask = size - 1
• 二進(jìn)制特征:當(dāng) size
是 2 的冪時(shí),sizemask
的二進(jìn)制形式為全 1。
例如:
• size = 8
→ sizemask = 7
→ 二進(jìn)制 0111
• size = 16
→ sizemask = 15
→ 二進(jìn)制 1111
四、索引計(jì)算原理
1. 取模運(yùn)算的替代方案
傳統(tǒng)哈希索引計(jì)算使用取模運(yùn)算:
index = hash % size; // 例如 hash=10, size=8 → index=2
但取模運(yùn)算在計(jì)算機(jī)中效率較低(涉及除法操作)。
2. 位運(yùn)算優(yōu)化
當(dāng) size
是 2 的冪時(shí),可以用位運(yùn)算替代:
index = hash & (size - 1); // 即 hash & sizemask
為什么這等價(jià)于取模?
• 因?yàn)?size
是 2 的冪,size - 1
的二進(jìn)制形式為全 1(例如 size=8
對(duì)應(yīng) sizemask=7
,二進(jìn)制 0111
)。
• hash & sizemask
相當(dāng)于保留哈希值的低 n
位(n = log2(size)
),結(jié)果范圍是 0 ≤ index < size
,與 hash % size
等價(jià)。
五、具體示例
假設(shè)哈希表大小 size = 8
(即 sizemask = 7
),哈希值 hash = 10
:
步驟 | 二進(jìn)制表示 | 結(jié)果 |
---|---|---|
hash = 10 | 1010 | 10 |
sizemask = 7 | 0111 | 7 |
hash & sizemask | 1010 & 0111 = 0010 | 2 |
結(jié)果與 10 % 8 = 2
完全一致,但位運(yùn)算比取模運(yùn)算快得多。
六、哈希表擴(kuò)容時(shí)的行為
當(dāng)哈希表需要擴(kuò)容(例如從 size=8
擴(kuò)容到 size=16
):
新 sizemask = 15
(二進(jìn)制 1111
)。哈希值相同的鍵會(huì)分散到更多桶中:
• 例如原哈希值 10
(二進(jìn)制 1010
)在 size=8
時(shí)索引為 2
。
• 擴(kuò)容后 size=16
,索引變?yōu)?10 & 15 = 10
。
七、為什么必須保證 size 是 2 的冪?
如果 size
不是 2 的冪,sizemask
的二進(jìn)制形式將包含 0,導(dǎo)致部分索引永遠(yuǎn)無法被映射到。
例如:
• size = 7
→ sizemask = 6
(二進(jìn)制 0110
)
• 哈希值 5
(二進(jìn)制 0101
)→ 0101 & 0110 = 0100
(索引 4)
• 哈希值 3
(二進(jìn)制 0011
)→ 0011 & 0110 = 0010
(索引 2)
• 索引 1、3、5、7 永遠(yuǎn)無法被訪問,導(dǎo)致哈希分布不均。
八、性能對(duì)比
操作類型 | 指令周期(近似) | 適用場(chǎng)景 |
---|---|---|
位運(yùn)算(& ) | 1 cycle | 快速計(jì)算 |
取模運(yùn)算(% ) | 10-20 cycles | 通用計(jì)算 |
在 Redis 這種高性能場(chǎng)景下,位運(yùn)算的優(yōu)勢(shì)顯著。
九、總結(jié)
• sizemask = size - 1
:當(dāng) size
是 2 的冪時(shí),此公式成立。
• hash & sizemask
:快速計(jì)算鍵的存儲(chǔ)位置,避免取模運(yùn)算。
• 設(shè)計(jì)優(yōu)勢(shì):內(nèi)存對(duì)齊、哈希均勻、計(jì)算高效。
這種設(shè)計(jì)是 Redis 哈希表高性能的核心保障,結(jié)合漸進(jìn)式 rehash 機(jī)制,使得 Redis 能夠高效處理大規(guī)模鍵值對(duì)存儲(chǔ)。
到此這篇關(guān)于redis hashtable 的sizemask理解的文章就介紹到這了,更多相關(guān)redis hashtable 的sizemask內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
內(nèi)存型數(shù)據(jù)庫Redis持久化小結(jié)
redis是一個(gè)支持持久化的內(nèi)存數(shù)據(jù)庫,也就是說redis需要經(jīng)常將內(nèi)存中的數(shù)據(jù)同步到磁盤來保證持久化.redis支持四種持久化方式,一是 Snapshotting(快照)也是默認(rèn)方式,二是Append-only file(縮寫aof)的方式,三是虛擬內(nèi)存方式,四是diskstore方式.今天我們總結(jié)下前2種。2017-09-09Redis內(nèi)存碎片產(chǎn)生原因及Pipeline管道原理解析
這篇文章主要為大家介紹了Redis內(nèi)存碎片產(chǎn)生原因及Pipeline管道原理解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2023-03-03基于Redis 實(shí)現(xiàn)網(wǎng)站PV/UV數(shù)據(jù)統(tǒng)計(jì)
PV和UV是兩個(gè)重要的指標(biāo),本文主要介紹了基于Redis 實(shí)現(xiàn)網(wǎng)站PV/UV數(shù)據(jù)統(tǒng)計(jì),具有一定的參考價(jià)值,感興趣的可以了解一下2025-04-04使用Redis實(shí)現(xiàn)點(diǎn)贊取消點(diǎn)贊的詳細(xì)代碼
這篇文章主要介紹了Redis實(shí)現(xiàn)點(diǎn)贊取消點(diǎn)贊的詳細(xì)代碼,通過查詢某實(shí)體(帖子、評(píng)論等)點(diǎn)贊數(shù)量,需要用到事務(wù)相關(guān)知識(shí),結(jié)合示例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2022-03-03Redis分布式鎖的正確實(shí)現(xiàn)方法總結(jié)
在本篇文章里小編給大家整理的是關(guān)于Redis分布式鎖的正確實(shí)現(xiàn)方式介紹,有興趣的朋友們可以學(xué)習(xí)下。2020-02-02