欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

布隆過濾器面試如何快速判斷元素是否在集合里

 更新時間:2022年03月10日 08:49:07   作者:Q.E.D  
這篇文章主要為大家介紹了布隆過濾器面試中如何快速判斷元素是否在集合里的完美回復(fù),有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步

如何快速判斷一個元素是不是在一個集合里?這個題目是我最近面試的時候常問的一個問題,這個問題不同人都有很多不同的回答。

今天想介紹一個很少有人會提及到的方案,那就是借助布隆過濾器。

1、什么叫布隆過濾器

布隆過濾器(Bloom Filter)是一個叫做 Bloom 的老哥于1970年提出的。

實際上可以把它看作由二進制向量(或者說位數(shù)組)和一系列隨機映射函數(shù)(哈希函數(shù))兩部分組成的數(shù)據(jù)結(jié)構(gòu)。

它的優(yōu)點是空間效率和查詢時間都比一般的算法要好的多,缺點是有一定的誤識別率和刪除困難。

圖片

2、實現(xiàn)原理

先來一張圖

圖片

 布隆過濾器算法主要思想就是利用 n 個哈希函數(shù)進行 hash 過后,得到不同的哈希值,根據(jù) hash 映射到數(shù)組(這個數(shù)組的長度可能會很長很長)的不同的索引位置上,然后將相應(yīng)的索引位上的值設(shè)置為1。

判斷該元素是否出現(xiàn)在集合中,就是利用k個不同的哈希函數(shù)計算哈希值,看哈希值對應(yīng)相應(yīng)索引位置上面的值是否是1,如果有1個不是1,說明該元素不存在在集合中。

但是也有可能判斷元素在集合中,但是元素不在,這個元素所有索引位置上面的1都是別的元素設(shè)置的,這就導(dǎo)致一定的誤判幾率(這就是為什么上面是活可能在一個集合中的根本原因,因為會存在一定的 hash 沖突)。

注意:誤判率越低,相應(yīng)的性能就會越低。

3、作用

布隆過濾器是可以用于判斷一個元素是不是(可能)在一個集合里,并且相比于其它的數(shù)據(jù)結(jié)構(gòu),布隆過濾器在空間和時間方面都有巨大的優(yōu)勢。

注意上面的一個詞:可能。這里先預(yù)留一個懸念,下文會詳細(xì)分析到。

判斷給定數(shù)據(jù)是否存在

防止緩存穿透(判斷請求的數(shù)據(jù)是否有效避免直接繞過緩存請求數(shù)據(jù)庫)等等、郵箱的垃圾郵件過濾、黑名單功能等等。

4、具體實現(xiàn)

看完了布隆過濾器的算法思想,那就開始具體的實現(xiàn)的講解。

我先來舉個例子,假設(shè)有旺財和小強兩個字符串,他們分別經(jīng)過三次的 hash 算法,然后根據(jù) hash 的結(jié)果將對應(yīng)的數(shù)組(假設(shè)數(shù)組長度為 16)的索引位置的值置為1,先來看下旺財這個詞組:

圖片

旺財經(jīng)過三次 hash 過后,值分別為2,4,6 那么根據(jù)可以得到索引值分別為 2、4、6,于是就將該數(shù)組的索引(2、4、6)位置的值置為1,其余當(dāng)做是0,現(xiàn)在假設(shè)需要查找旺財 ,同樣經(jīng)過這個三個hash 然后發(fā)現(xiàn)得到的索引 2、4、6對應(yīng)的位置的值都為1,那么可以判斷旺財可能是存在的。

接著有將小強插入到布隆過濾器中,實際的過程和上面的一樣,假設(shè)得到的下標(biāo)是 1、3、5

圖片

拋開旺財?shù)拇嬖?,小強此時是這樣子在布隆過濾器中的,結(jié)合旺財和小強實際的數(shù)組是這樣子的:

圖片

 現(xiàn)在有來一個數(shù)據(jù):9527,現(xiàn)在要求是判斷 9527 是否存在,假設(shè)9527 經(jīng)過三次 hash 過后得到的下標(biāo)分別為:5、6、7。結(jié)果發(fā)現(xiàn)下標(biāo)為 7 的位置的值為0,那么可以肯定的判斷出,9527 一定不存在。

接著又來了一個 國產(chǎn)007,經(jīng)過三次 hash 過后得到的下標(biāo)分別為:2、3、5,結(jié)果發(fā)現(xiàn) 2、3、5下標(biāo)對應(yīng)的值全是1,于是可以大致判斷出 國產(chǎn)007可能存在。但是實際上經(jīng)過我們剛剛的演示,國產(chǎn)007 根本就不存在,之所以 2、3、5 索引位置的值為1 ,那是因為其他的數(shù)據(jù)設(shè)置的。

說到這里,不知道大家有沒有明白布隆過濾器的作用。

5、代碼的實現(xiàn)

作為 java 程序員,我們真的是很幸福了,我們使用到很多的框架和工具,基本都被封裝好了,布隆過濾器,我們就使用 google 封裝好的工具類。當(dāng)然還有其他方法,大家可以探索探索。

首先添加依賴

<!--布隆過濾依賴-->
<dependency>
    <groupId>com.google.guava</groupId>
    <artifactId>guava</artifactId>
    <version>25.1-jre</version>
</dependency>

代碼的實現(xiàn)

import com.google.common.hash.BloomFilter;
import com.google.common.hash.Funnels;
import java.nio.charset.Charset;
public class BloomFilterDemo {
        public static void main(String[] args) {
        /**
         * 創(chuàng)建一個插入對象為一億,誤報率為0.01%的布隆過濾器
         * 不存在一定不存在
         * 存在不一定存在
         * ----------------
         *  Funnel 對象:預(yù)估的元素個數(shù),誤判率
         *  mightContain :方法判斷元素是否存在
         */
        BloomFilter<CharSequence> bloomFilter = BloomFilter.create(Funnels.stringFunnel(Charset.forName("utf-8")), 100000000, 0.0001);
        bloomFilter.put("死");
        bloomFilter.put("磕");
        bloomFilter.put("Redis");
        System.out.println(bloomFilter.mightContain("Redis"));
        System.out.println(bloomFilter.mightContain("Java"));
    }
}

 具體的解釋已經(jīng)寫在注釋中了。到這里相信大家一定明白了布隆過濾器和其怎么使用了。

6、實戰(zhàn)

我們來模擬這樣的場景:通過布隆過濾器來解決緩存穿透。

首先你的知道什么叫緩存穿透吧?

緩存穿透是指用戶訪問一個緩存和數(shù)據(jù)庫中都沒有的數(shù)據(jù),因為緩存中不存在,所以就會去訪問數(shù)據(jù)庫,如果并發(fā)很高。很容易會擊垮數(shù)據(jù)庫

那布隆過濾器是如何解決這個問題的呢?他

的原理是這樣子的:將數(shù)據(jù)庫中所有的查詢條件,放入布隆過濾器中,當(dāng)一個查詢請求過來時,先經(jīng)過布隆過濾器進行查,如果判斷請求查詢值存在,則繼續(xù)查;如果判斷請求查詢不存在,直接丟棄。

其代碼如下:

String get(String key) {
    String value = redis.get(key);     
    if (value  == null) {
        if(!bloomfilter.mightContain(key)){
            return null; 
        }else{
            value = db.get(key); 
            redis.set(key, value); 
        }    
    }
    return value;
}

7、小結(jié)

本文詳細(xì)介紹了布隆過濾器是什么?有什么作用?實現(xiàn)原理以及從代碼層面多方面來闡述布隆過濾器。希望能為各位在學(xué)習(xí)進階的路上添磚加瓦。

以上就是布隆過濾器面試如何快速判斷元素是否在集合里的詳細(xì)內(nèi)容,更多關(guān)于布隆過濾器面試判斷元素是否在集合里的資料請關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • 解決IDEA中不能正常輸入光標(biāo)變粗的問題

    解決IDEA中不能正常輸入光標(biāo)變粗的問題

    這篇文章主要介紹了在IDEA中不能正常輸入光標(biāo)變粗的解決方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友參考下吧
    2020-09-09
  • Java常用類之System類的使用指南

    Java常用類之System類的使用指南

    System類代表系統(tǒng),系統(tǒng)級的很多屬性和控制方法都放置在該類的內(nèi)部。該類位于java.lang包。本文將通過示例為大家詳細(xì)講講System類的使用,需要的可以參考一下
    2022-07-07
  • Java中char[] 和 String 類型占用字節(jié)大小問題

    Java中char[] 和 String 類型占用字節(jié)大小問題

    這篇文章主要介紹了Java中char[] 和 String 類型占用字節(jié)大小問題,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2019-08-08
  • java實現(xiàn)定制數(shù)據(jù)透視表的示例詳解

    java實現(xiàn)定制數(shù)據(jù)透視表的示例詳解

    數(shù)據(jù)透視表(Pivot?Table)是一種數(shù)據(jù)分析工具,通常用于對大量數(shù)據(jù)進行匯總、分析和展示,本文主要介紹了如何使用Java將計算項添加到數(shù)據(jù)透視表中,感興趣的可以了解下
    2023-12-12
  • iOS獲取AppIcon and LaunchImage''s name(app圖標(biāo)和啟動圖片名字)

    iOS獲取AppIcon and LaunchImage''s name(app圖標(biāo)和啟動圖片名字)

    這篇文章主要介紹了iOS獲取AppIcon and LaunchImage's name(app圖標(biāo)和啟動圖片名字)的相關(guān)資料,非常不錯,具有參考借鑒價值,感興趣的朋友一起學(xué)習(xí)吧
    2016-08-08
  • java正則表達(dá)式處理花括號內(nèi)容替換賦值問題

    java正則表達(dá)式處理花括號內(nèi)容替換賦值問題

    這篇文章主要介紹了java正則表達(dá)式處理花括號內(nèi)容替換賦值問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-05-05
  • Spring?Native打包本地鏡像的操作方法(無需通過Graal的maven插件buildtools)

    Spring?Native打包本地鏡像的操作方法(無需通過Graal的maven插件buildtools)

    這篇文章主要介紹了Spring?Native打包本地鏡像,無需通過Graal的maven插件buildtools,本文探索一下,如果不通過這個插件來生成鏡像,結(jié)合實例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下
    2023-02-02
  • JAVA匿名內(nèi)部類語法分析及實例詳解

    JAVA匿名內(nèi)部類語法分析及實例詳解

    這篇文章主要介紹了JAVA匿名內(nèi)部類語法分析及實例詳解,匿名內(nèi)部類可以使你的代碼更加簡潔,它與局部類很相似,不同的是它沒有類名,如果某個局部類你只需要用一次,那么你就可以使用匿名內(nèi)部類。對此感興趣的可以了解一下
    2020-07-07
  • druid?return行為方法源碼示例解析

    druid?return行為方法源碼示例解析

    這篇文章主要為大家介紹了druid?return行為源碼示例解析,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-09-09
  • mybatis中實現(xiàn)枚舉自動轉(zhuǎn)換方法詳解

    mybatis中實現(xiàn)枚舉自動轉(zhuǎn)換方法詳解

    在使用mybatis的時候經(jīng)常會遇到枚舉類型的轉(zhuǎn)換,下面這篇文章主要給大家介紹了關(guān)于mybatis中實現(xiàn)枚舉自動轉(zhuǎn)換的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面來一起看看吧。
    2017-08-08

最新評論