c# 實現(xiàn)位圖算法(BitMap)
算法原理
BitMap的基本思想就是用一個bit位來標記某個元素對應的Value,而Key即是該元素。由于采用了Bit為單位來存儲數(shù)據(jù),因此可以大大節(jié)省存儲空間。
BitMap可以看成一種數(shù)據(jù)結構。
假設有這樣一個需求:在20億個隨機整數(shù)中找出某個數(shù)m是否存在其中,并假設32位操作系統(tǒng),4G內存。
在Java中,int占4字節(jié),1字節(jié)=8位(1 byte = 8 bit)。
如果每個數(shù)字用int存儲,那就是20億個int,因而占用的空間約為 (2000000000*4/1024/1024/1024)≈7.45G
如果按位存儲就不一樣了,20億個數(shù)就是20億位,占用空間約為 (2000000000/8/1024/1024/1024)≈0.233G
優(yōu)點和缺點
優(yōu)點:由于采用了Bit為單位來存儲數(shù)據(jù)并建立映射關系來查找位置,因此可以大大減少存儲空間,加快在大量數(shù)據(jù)中查詢的時間。(有點哈希表的意思,但哈希中的value值數(shù)據(jù)類型可以豐富多樣,而BitMap最終查到的value只能表示簡單的幾種狀態(tài)。)
缺點:BitMap中的查詢結果(value)能表達的狀態(tài)有限,且所有的數(shù)據(jù)不能重復。即不可對重復的數(shù)據(jù)進行排序和查找。
算法實現(xiàn)(C#)
.NET中已經(jīng)實現(xiàn)了BitMap的數(shù)據(jù)結構——BitArray,建議使用BitMap算法解決問題時直接使用官方的BitArray。
我參照.NET源碼實現(xiàn)了一個簡化版的BitMap,以int數(shù)組存儲位值(最多存21億個位值),代碼如下:
class BitMap { public int Length{ get{ return m_length;} } private int[] m_array; private int m_length; public BitMap(int length): this(length, false) { } //索引根據(jù)需求添加 public bool this[int index] { get { return Get(index); } set { Set(index,value); } } //分配空間以容納長度位值, 位數(shù)組中的所有值都設置為defaultValue。 public BitMap(int length, bool defaultValue) { if (length < 0) { throw new ArgumentOutOfRangeException("length", "長度值不能小于0"); } int arrayLength = length > 0 ? (((length - 1) / 32) + 1) : 0; m_array = new int[arrayLength]; m_length = length; int fillValue = defaultValue ? unchecked(((int)0xffffffff)) : 0; for (int i = 0; i < m_array.Length; i++) { m_array[i] = fillValue; } } //返回位置索引處的位值。 public bool Get(int index) { if (index < 0 || index >= Length) { throw new ArgumentOutOfRangeException("index", "索引值超出范圍"); } return (m_array[index / 32] & (1 << (index % 32))) != 0; } //將位置索引處的位值設置為value。 public void Set(int index, bool value) { if (index < 0 || index >= Length) { throw new ArgumentOutOfRangeException("index", "索引值超出范圍"); } if (value) { m_array[index / 32] |= (1 << (index % 32)); } else { m_array[index / 32] &= ~(1 << (index % 32)); } } }
算法應用
問題1:
給40億個不重復的unsigned int的整數(shù),沒有排過序,然后再給一個數(shù),如果快速判斷這個數(shù)是否在那40億個數(shù)當中。(解決海量數(shù)據(jù)中的查詢問題)
問題1解法:
建立一個位集合,全部初始化為0。遍歷40億個不重復的整數(shù),通過上述提供的一種映射(每個不重復的整數(shù)映射到給定的位)找到其位的位置,標記為1。判斷這個數(shù)是否在大整數(shù)集合中,即通過映射關系計算此整數(shù)的位位置,檢查是否為1,若為1,則存在,若為0,則不存在
問題2:
數(shù)據(jù)庫里存了很多800電話號碼,數(shù)量特別大,以至于內存放不下,如何排序,時間比空間更重要?電話號碼類似于800-810-5555。(高效排序)
問題2解法:
其實就是不重復的任意7位數(shù)及其之內的排序問題。我們用1位來表示電話是否出現(xiàn),遍歷整個電話號序列,設置相應的位,遍歷位圖收集位被設置的號碼即可。查看上述的實現(xiàn)代碼
以上就是c# 實現(xiàn)位圖算法(BitMap)的詳細內容,更多關于c# 位圖算法的資料請關注腳本之家其它相關文章!
相關文章
C#解決多IfElse判斷語句和Switch語句問題的方法分享
這篇文章主要為大家介紹C#如何使用設計模式中的策略模式和委托來解決多個IfElse判斷語句和Switch語句,這種替換方式在其他語言也一樣可以做到,感興趣的可以了解一下2022-12-12C#并發(fā)實戰(zhàn)記錄之Parallel.ForEach使用
這篇文章主要給大家介紹了關于C#并發(fā)實戰(zhàn)記錄之Parallel.ForEach使用的相關資料,文中通過示例代碼介紹的非常詳細,對大家學習或者使用C#具有一定的參考學習價值,需要的朋友們下面來一起學習學習吧2019-08-08C#實現(xiàn)ComboBox控件顯示出多個數(shù)據(jù)源屬性的方法
這篇文章主要介紹了C#實現(xiàn)ComboBox控件顯示出多個數(shù)據(jù)源屬性的方法,實例分析了ComboBox控件的使用技巧,具有一定參考借鑒價值,需要的朋友可以參考下2015-09-09