欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Redis 中的布隆過濾器的實現(xiàn)

 更新時間:2018年10月18日 11:33:14   作者:JayChen  
這篇文章主要介紹了Redis 中的布隆過濾器的實現(xiàn),詳細的介紹了什么是布隆過濾器以及如何實現(xiàn),非常具有實用價值,需要的朋友可以參考下

什么是『布隆過濾器』

布隆過濾器是一個神奇的數(shù)據(jù)結構,可以用來判斷一個元素是否在一個集合中。很常用的一個功能是用來去重。在爬蟲中常見的一個需求:目標網(wǎng)站 URL 千千萬,怎么判斷某個 URL 爬蟲是否寵幸過?簡單點可以爬蟲每采集過一個 URL,就把這個 URL 存入數(shù)據(jù)庫中,每次一個新的 URL 過來就到數(shù)據(jù)庫查詢下是否訪問過。

select id from table where url = 'https://jaychen.cc'

但是隨著爬蟲爬過的 URL 越來越多,每次請求前都要訪問數(shù)據(jù)庫一次,并且對于這種字符串的 SQL 查詢效率并不高。除了數(shù)據(jù)庫之外,使用 Redis 的 set 結構也可以滿足這個需求,并且性能優(yōu)于數(shù)據(jù)庫。但是 Redis 也存在一個問題:耗費過多的內(nèi)存。這個時候布隆過濾器就很橫的出場了:這個問題讓我來。

相比于數(shù)據(jù)庫和 Redis,使用布隆過濾器可以很好的避免性能和內(nèi)存占用的問題。

布隆過濾器本質(zhì)是一個位數(shù)組,位數(shù)組就是數(shù)組的每個元素都只占用 1 bit 。每個元素只能是 0 或者 1。這樣申請一個 10000 個元素的位數(shù)組只占用 10000 / 8 = 1250 B 的空間。布隆過濾器除了一個位數(shù)組,還有 K 個哈希函數(shù)。當一個元素加入布隆過濾器中的時候,會進行如下操作:

  • 使用 K 個哈希函數(shù)對元素值進行 K 次計算,得到 K 個哈希值。
  • 根據(jù)得到的哈希值,在位數(shù)組中把對應下標的值置為 1。

舉個🌰,假設布隆過濾器有 3 個哈希函數(shù):f1, f2, f3 和一個位數(shù)組 arr?,F(xiàn)在要把 https://jaychen.cc 插入布隆過濾器中:

  • 對值進行三次哈希計算,得到三個值 n1, n2, n3。
  • 把位數(shù)組中三個元素 arr[n1], arr[n2], arr[3] 置為 1。

當要判斷一個值是否在布隆過濾器中,對元素再次進行哈希計算,得到值之后判斷位數(shù)組中的每個元素是否都為 1,如果值都為 1,那么說明這個值在布隆過濾器中,如果存在一個值不為 1,說明該元素不在布隆過濾器中。

看不懂文字看下面的靈魂畫手的圖解釋👇👇👇

看了上面的說明,必然會提出一個問題:當插入的元素原來越多,位數(shù)組中被置為 1 的位置就越多,當一個不在布隆過濾器中的元素,經(jīng)過哈希計算之后,得到的值在位數(shù)組中查詢,有可能這些位置也都被置為 1。這樣一個不存在布隆過濾器中的也有可能被誤判成在布隆過濾器中。但是如果布隆過濾器判斷說一個元素不在布隆過濾器中,那么這個值就一定不在布隆過濾器中。簡單來說:

  • 布隆過濾器說某個元素在,可能會被誤判。
  • 布隆過濾器說某個元素不在,那么一定不在。

這個布隆過濾器的缺陷放到上面爬蟲的需求中,可能存在某些沒有訪問過的 URL 可能會被誤判為訪問過,但是如果是訪問過的 URL 一定不會被誤判為沒訪問過。

Redis 中的布隆過濾器

redis 在 4.0 的版本中加入了 module 功能,布隆過濾器可以通過 module 的形式添加到 redis 中,所以使用 redis 4.0 以上的版本可以通過加載 module 來使用 redis 中的布隆過濾器。但是這不是最簡單的方式,使用 docker 可以直接在 redis 中體驗布隆過濾器。

> docker run -d -p 6379:6379 --name bloomfilter redislabs/rebloom
> docker exec -it bloomfilter redis-cli

redis 布隆過濾器主要就兩個命令:

  • bf.add 添加元素到布隆過濾器中:bf.add urls https://jaychen.cc
  • bf.exists 判斷某個元素是否在過濾器中:bf.exists urls https://jaychen.cc。

上面說過布隆過濾器存在誤判的情況,在 redis 中有兩個值決定布隆過濾器的準確率:

  • error_rate :允許布隆過濾器的錯誤率,這個值越低過濾器的位數(shù)組的大小越大,占用空間也就越大。
  • initial_size :布隆過濾器可以儲存的元素個數(shù),當實際存儲的元素個數(shù)超過這個值之后,過濾器的準確率會下降。

redis 中有一個命令可以來設置這兩個值:

bf.reserve urls 0.01 100

三個參數(shù)的含義:

  • 第一個值是過濾器的名字。
  • 第二個值為 error_rate 的值。
  • 第三個值為 initial_size 的值。

使用這個命令要注意一點:執(zhí)行這個命令之前過濾器的名字應該不存在,如果執(zhí)行之前就存在會報錯:(error) ERR item exists

以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。

相關文章

  • redis快速部署為docker容器的方法實現(xiàn)

    redis快速部署為docker容器的方法實現(xiàn)

    部署 Redis 作為 Docker 容器是一種快速、靈活且可重復使用的方式,特別適合開發(fā)、測試和部署環(huán)境,本文主要介紹了redis快速部署為docker容器的方法實現(xiàn),具有一定的參考價值,感興趣的可以了解一下
    2024-05-05
  • Redis操作相關命令之查看、停止、啟動命令

    Redis操作相關命令之查看、停止、啟動命令

    這篇文章主要介紹了Redis操作相關命令之查看、停止、啟動命令,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-09-09
  • 基于Redis的限流器的實現(xiàn)(示例講解)

    基于Redis的限流器的實現(xiàn)(示例講解)

    下面小編就為大家分享一篇基于Redis的限流器的實現(xiàn)(示例講解),具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2017-12-12
  • 深入解析RedisJSON之如何在Redis中直接處理JSON數(shù)據(jù)

    深入解析RedisJSON之如何在Redis中直接處理JSON數(shù)據(jù)

    JSON已經(jīng)成為現(xiàn)代應用程序之間數(shù)據(jù)傳輸?shù)耐ㄓ酶袷?然而,傳統(tǒng)的關系型數(shù)據(jù)庫在處理JSON數(shù)據(jù)時可能會遇到性能瓶頸,本文將詳細介紹RedisJSON的工作原理、關鍵操作、性能優(yōu)勢以及使用場景,感興趣的朋友一起看看吧
    2024-05-05
  • redis分布式ID解決方案示例詳解

    redis分布式ID解決方案示例詳解

    這篇文章主要為大家介紹了redis分布式ID解決方案示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-03-03
  • 一文詳解redis高可用Sentinel?

    一文詳解redis高可用Sentinel?

    本文主要介紹了redis高可用Sentinel的使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2024-05-05
  • redislive監(jiān)控redis服務的圖文教程_動力節(jié)點Java 學院整理

    redislive監(jiān)控redis服務的圖文教程_動力節(jié)點Java 學院整理

    這篇文章主要介紹了redislive監(jiān)控redis服務的圖文教程_動力節(jié)點Java 學院整理,需要的朋友可以參考下
    2017-08-08
  • redis配置standAlone版的jedisPool示例

    redis配置standAlone版的jedisPool示例

    這篇文章主要為大家介紹了redis配置standAlone版的jedisPool示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-07-07
  • Redis壓縮列表的設計與實現(xiàn)

    Redis壓縮列表的設計與實現(xiàn)

    壓縮列表(Ziplist)是 Redis 為了節(jié)省內(nèi)存而設計的一種緊湊型數(shù)據(jù)結構,主要用于存儲長度較短且數(shù)量較少的元素集合,本文給大家介紹了Redis壓縮列表的設計與實現(xiàn),文中通過代碼示例講解的非常詳細,需要的朋友可以參考下
    2024-08-08
  • Redis所實現(xiàn)的Reactor模型設計方案

    Redis所實現(xiàn)的Reactor模型設計方案

    這篇文章主要介紹了Redis所實現(xiàn)的Reactor模型,本文將帶領讀者從源碼的角度來查看redis關于reactor模型的設計,需要的朋友可以參考下
    2024-06-06

最新評論