C++ 位圖及位圖的實(shí)現(xiàn)原理
概念
位圖就是bitmap的縮寫,所謂bitmap,就是用每一位來存放某種狀態(tài),適用于大規(guī)模數(shù)據(jù),該數(shù)據(jù)都是不重復(fù)的簡單數(shù)據(jù)。通常是用來判斷某個數(shù)據(jù)存不存在的
例如:給40億個不重復(fù)的unsigned int的整數(shù),沒排過序的,然后再給一個數(shù),如何快速判斷這個數(shù)是否在那40億個數(shù)當(dāng)中
如果不看數(shù)據(jù)量,我們第一想到的肯定就是依次從頭遍歷,但是這個數(shù)據(jù)量是非常大的,有40億,遍歷40億次消耗的時間和內(nèi)存是非常多的。但是引入位圖后,就可以專門解決這種大量數(shù)據(jù)查找是否存在的問題。查找這個數(shù)是否存在所消耗的時間復(fù)雜度為O(1),且節(jié)省了32倍的容量(下面有解釋)。下面我們一起來看看位圖的原理及代碼實(shí)現(xiàn)
原理
查找一個數(shù)是否存在,其實(shí)答案就是存在或者不存在,這種只需要回答是與否的問題,我們都可以用二進(jìn)制中的位來表示,1表示該數(shù)存在,反之0表示該數(shù)不存在。而位圖中的每個數(shù)據(jù)單元都是一個bit位,這樣子平時我們都要話32位4字節(jié)來存儲數(shù)據(jù),而現(xiàn)在我們只需要花1個字節(jié)就能“存儲數(shù)據(jù)”,在空間上減少了約32倍的容量。例如40G的數(shù)據(jù)我們只要花1.3G來存儲。但是我們平時操作的數(shù)據(jù)類型最小就是一個字節(jié),我們不能直接對位進(jìn)行操作,所以我們可以借助位運(yùn)算來對數(shù)據(jù)進(jìn)行操作。下面我們來看看數(shù)據(jù)在位圖中是如何存儲的
我們這里給出一個數(shù)組
int arr[] = {1,2,4,5,7,10,11,14,16,17,21,23,24,28,29,31};則我們只需要花1個字節(jié)來存這些數(shù)據(jù)
解釋:我們目前很多的機(jī)器都是小端存儲,也就是低地址存低位,一個整形數(shù)據(jù)中,第一個字節(jié)用來存儲0-7的數(shù)字,第二個字節(jié)用來存儲8-15的數(shù)字,第三個字節(jié)用來存儲16-23的數(shù)字,第四個字節(jié)用來存儲24-31的數(shù)字。我們來看看數(shù)字10是如何存儲的。先通過模上32,取余還是10,然后再將4字節(jié)中第10個比特位置為1,則表示該數(shù)字出現(xiàn)過。由于我們的機(jī)器是小端存儲,所以我們的每個比特位都是要從右邊開始計算的,如下圖
所以說我們只需要將對應(yīng)的比特位置為1即可。但是如果我們要存儲的數(shù)據(jù)很大呢?其實(shí)也很簡單,我們可以定義一個數(shù)組,當(dāng)做一個位圖,如果該數(shù)字在0-31之間,我們就存儲在0號下標(biāo)的元素中進(jìn)行操作,如果在32-63之間,則就在1號下標(biāo)之間進(jìn)行操作。計算下標(biāo)我們可以通過模32來獲得下標(biāo)。
我們知道位圖的原理后,我們在通過原理來用代碼實(shí)現(xiàn)一個位圖吧
實(shí)現(xiàn)
成員變量和構(gòu)造函數(shù):在實(shí)現(xiàn)位圖中,我們的成員變量只需要一個數(shù)組就可以實(shí)現(xiàn)。而這個數(shù)組有多我們要開多大呢?數(shù)組多開一個整形空間,就能多存32個數(shù)字,所以我們可以讓用戶提供一個準(zhǔn)確的數(shù),這個數(shù)是一個數(shù)據(jù)量,也是數(shù)的最大范圍。我們可以通過該數(shù)模上32,就可以獲得該數(shù)組的大小,但是0~31模上32為0,我們開0個空間那顯然不合適,所以我們要開range/32 + 1
個空間大小的數(shù)組
存儲數(shù)據(jù):存儲一個數(shù)字num需要3個步驟,第一是需要計算出該值對應(yīng)的數(shù)組下標(biāo)。計算數(shù)組下標(biāo)方式為idx=num / 32;第二步是計算num在對應(yīng)整數(shù)的比特位的位置bitIdx=num%32;第三步是要將計算出來的bite位置為1。我們之前說過,要操作位,我們可以通過位運(yùn)算來操作,可以先將1左移bitIdx位后再和整數(shù)進(jìn)行或運(yùn)算
例如假設(shè)bitIdx=5,數(shù)據(jù)為10010011
1.將1進(jìn)行左移5位==>100000
2.將數(shù)據(jù)和第一步計算出來的結(jié)果進(jìn)行或運(yùn)算
10010011 | 100000 =10110011,此時我們就將指定位置置位1了
查找數(shù)據(jù):要判斷一個數(shù)據(jù)是否存在,其實(shí)和存儲數(shù)據(jù)是類似,也是需要計算出兩個位置idx和bitIdx。然后通過這兩個位置來判斷對應(yīng)位置是否為1,為1則表示該數(shù)字存在。如何判斷呢?我們可以先將數(shù)組下標(biāo)為idx的整數(shù)向右移bitIdx位,然后再和1進(jìn)行與運(yùn)算,如果為1則表示存在,否則不存在
例如假設(shè)bitIdx=5,數(shù)據(jù)為10110011
1.將數(shù)據(jù)進(jìn)行右移5位00000101
2.將第一步計算出來的結(jié)果和1進(jìn)行與運(yùn)算
00000101 & 1 = 1,此時表示該數(shù)字存在,返回true
刪除數(shù)據(jù):刪除數(shù)據(jù)和存儲數(shù)據(jù)操作一樣,唯一的區(qū)別就是將對應(yīng)的bit位置為0。我們可以通過先將1進(jìn)行左移bitIdx位,然后取反,將結(jié)果再和原來數(shù)據(jù)進(jìn)行與運(yùn)算
例如假設(shè)bitIdx=5,數(shù)據(jù)為10110011
1.將1進(jìn)行左移5位后并取反011111
2.將第一步計算出來的結(jié)果和數(shù)據(jù)進(jìn)行與運(yùn)算
10110011 & 011111 = 10010011,刪除成功
代碼:
class BitMap { public: //位圖的內(nèi)存大小和數(shù)據(jù)范圍有關(guān) BitMap(size_t range) :_bit(range / 32 + 1) {} void set(const size_t num) { //計算數(shù)組中的下標(biāo) int idx = num / 32; //計算num在對應(yīng)下標(biāo)整數(shù)中的下標(biāo)位置 int bitIdx = num % 32; //將對應(yīng)的比特位置1 _bit[idx] |= 1 << bitIdx; } bool find(const size_t num) { int idx = num / 32; int bitIdx = num % 32; return (_bit[idx] >> bitIdx) & 1; } void reset(const size_t num) { int idx = num / 32; int bitIdx = num % 32; _bit[idx] &= ~(1 << bitIdx); } private: vector<int> _bit; };
測試截圖:
以上就是C++ 位圖及位圖的實(shí)現(xiàn)原理的詳細(xì)內(nèi)容,更多關(guān)于C++ 位圖的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
詳解C++中的ANSI與Unicode和UTF8三種字符編碼基本原理與相互轉(zhuǎn)換
在C++編程中,我們有時需要去處理字符串編碼的相關(guān)問題,常見的字符編碼有ANSI窄字節(jié)編碼、Unicode寬字節(jié)編碼及UTF8可變長編碼。很多人在處理字符串編碼問題時都會有疑惑,即便是有多年工作經(jīng)驗(yàn)的朋友也可能搞不清楚。所以有必要講一下這三種字符編碼以及如何去使用它們2021-11-11c語言中的局部跳轉(zhuǎn)及全局跳轉(zhuǎn)功能
本文介紹了C語言中的goto語句,以及如何使用setjmp和longjmp實(shí)現(xiàn)跨函數(shù)的跳轉(zhuǎn),詳細(xì)講解了setjmp和longjmp的使用方法和注意事項(xiàng),以及使用這種全局跳轉(zhuǎn)后變量狀態(tài)的不確定性,感興趣的朋友一起看看吧2024-09-09C/C++實(shí)現(xiàn)發(fā)送與接收HTTP/S請求的示例代碼
HTTP(Hypertext Transfer Protocol)是一種用于傳輸超文本的協(xié)議,它是一種無狀態(tài)的、應(yīng)用層的協(xié)議,用于在計算機(jī)之間傳輸超文本文檔,通常在 Web 瀏覽器和 Web 服務(wù)器之間進(jìn)行數(shù)據(jù)通信,本文給大家介紹了C/C++發(fā)送與接收HTTP/S請求,需要的朋友可以參考下2023-11-11用c++實(shí)現(xiàn)將文本每個單詞首字母轉(zhuǎn)換為大寫
本篇文章是對用c++實(shí)現(xiàn)將文本每個單詞首字母轉(zhuǎn)換為大寫的方法進(jìn)行了詳細(xì)的分析介紹,需要的朋友參考下2013-05-05