HashSet底層竟然是HashMap實現(xiàn)問題
HashSet底層竟然是HashMap實現(xiàn)
HashSet雖然實現(xiàn)的是Set - Collection接口,但其源碼是通過new HashMap()實現(xiàn)的,底層數(shù)據(jù)結(jié)構(gòu)是哈希表,存取都比較快,線程不安全。
特點
1. 無序集合,不保證存儲元素的順序,沒有索引
2. 不能存儲重復元素
3. 可以存儲Null
存取基本操作
Iterator的獲取跟ArrayList一樣:
HashSet<String> hashSet = new HashSet<>(); hashSet.add("asf"); hashSet.add("bnk"); hashSet.add("lsk"); hashSet.add("owie"); System.out.println(hashSet); Iterator<String> it = hashSet.iterator(); while (it.hasNext()) { String ele = (String) it.next(); System.out.println(ele); } System.out.println("---------------------------"); for (String ele : hashSet) { System.out.println(ele); }
查看HashSet源碼,其操作底層都是通過調(diào)用HashMap方法實現(xiàn)的,HashSet會將元素存儲在HashMap的key集合中,然后為value賦一個static空對象PRESENT。
HashSet不能存儲重復元素,因為HashMap的key集合不可以重復,本質(zhì)也是通過equals()和hashCode()來判定兩個對象是否重復,因此將對象存儲在HashSet之前,必須先重寫對象的equals()和hashCode()方法。
hashCode原則:
兩個對象的hashCode()相等,equals()未必返回true
兩個對象equals()返回true,它們的hashCode()一定相等
HashMap中,只有兩個對象hashCode()相等,且equals()相同,才判定為重復元素,重寫對象的equals()方法一定要同時重寫hashCode()以符合原則。
HashSet底層實現(xiàn)解析
1.實現(xiàn)了Set接口
2.底層實際上是HashMap()
底層數(shù)據(jù)結(jié)構(gòu)為:Node[]數(shù)組 + 單鏈表 + 紅黑樹
Set set = new HashSet();使用無參構(gòu)造方法創(chuàng)建hashset對象,實際上創(chuàng)建了hashmap,初始大小默認為16,加載因子默認為 0.75.
當調(diào)用add方法添加元素時,其實調(diào)用的是map.put()方法
這里的key就是要添加的元素,value是一個object類型的共享常量,占了一個坑位,并沒有實際意義。
當返回值為null的時候,說明添加成功
解析:首先,調(diào)用map.put();方法,跟蹤發(fā)現(xiàn)實際上調(diào)用putVal();方法
參數(shù)說明:hash(key):hash()函數(shù)的返回值,返回的并不是key的hashCode值,而是經(jīng)過處理hashCode得到的值(目的就是盡可能減少hash沖突),(若待加入元素 key 為 基礎(chǔ)數(shù)據(jù)類型 或 封裝數(shù)據(jù)類型(Java中已經(jīng)重寫),不需要重寫 equals 和 hashCode方法;若key為自定義數(shù)據(jù)類型,往往需要重寫 equals 和 hashCode 方法。
例(不重寫方法):
輸出:
說明是兩個不同的對象,但是理論上應(yīng)該是相同對象。
具體要不要重寫方法以及如何重寫,都要根據(jù)實際需求決定
key:待添加的元素。
value:共享常量PRESENT,沒有實際意義(因為創(chuàng)建的是hashset對象,并沒有value,但是當頂層創(chuàng)建的是hashmap對象時候,調(diào)用的直接是map.put()方法,那value對應(yīng)的就是實際當中的value,就沒有PRESENT了)。
onlyIfAbsent*:若為true,則不改變現(xiàn)存的value,默認為false。
evict*:若為false,表示當前表處于創(chuàng)建模式。
putVal();方法的具體實現(xiàn)
(1)首次添加元素 key
首先,創(chuàng)建兩個臨時變量 Node類型的數(shù)組 Node[] tab,Node<k,v>類型的 p,判斷當前hash表是否為空,若滿足條件,調(diào)用resize()方法,擴容。
resize()方法:
由于用無參構(gòu)造器創(chuàng)建對象,因此hashtable為空,oldCap為0,oldThr為0,if條件不滿足跳過,進入else
新數(shù)組容量 newCap 為默認大小 16,新的加載因子為默認 0.75,newThr為擴容閾值(即當數(shù)組的數(shù)據(jù)量達到閾值以后,就會擴容,目的就是當并發(fā)量過大以后,能夠有緩沖空間)。
newThr = 加載因子*數(shù)組大小 ,在大小都默認的情況下,閾值為12
最后 return 擴容后的數(shù)組,并返回 putVal(); 方法中繼續(xù):
在 if ((p = tab[i = (n - 1) & hash]) == null) 中,首先用算法 i = (n - 1) & hash獲得當前 待添加元素 key 應(yīng)該添加的數(shù)組下標 i ,同時獲取到當前位置上的所存儲的鏈表的頭節(jié)點,并將節(jié)點賦值給變量 p ,若該節(jié)點為空(即當前位置無數(shù)據(jù)),就把待添加元素 key 封裝成一個節(jié)點Node,放到當前位置當作該鏈表的頭節(jié)點。
最后操作計數(shù)+1,數(shù)據(jù)量size+1,并且若size大于擴容閾值,則進行擴容。返回 null 表示添加成功。(到此往數(shù)組中首次添加元素操作結(jié)束)
(2)添加重復元素流程分析
在鏈表上找是否有重復元素,只能從頭節(jié)點遍歷該鏈表。當 if 條件判斷當前下標 i 位置上不為空的時候(即鏈表頭節(jié)點),就要開始遍歷。
定義需要的變量 Node<k,v> e (一個指針) ,以及 K k首先判斷頭節(jié)點是否與待添加的元素重復:
1)hash值是否相等,這是前提(重復元素hashCode值必相等,則hash值也必相等)
2)待添加元素 key 與 當前節(jié)點的 key 是否是同一對象,或者帶添加的 key 與當前節(jié)點的 key 內(nèi)容 是否相等,兩者若有一個相同則說明是重復元素
若頭節(jié)點就重復,則把頭節(jié)點 p 賦給 e;(否則,判斷當前頭節(jié)點 p 是否是紅黑樹類型)
若是樹類型,則按照樹節(jié)點進行操作。若不是樹類型,則繼續(xù)遍歷當前鏈表:
這里的 for 是一個死循環(huán),退出的條件就是找到重復元素或遍歷到鏈表結(jié)尾(肯定可以退出)。
判斷是否重復,與上面的條件一樣。
①若遍歷到結(jié)尾沒有發(fā)現(xiàn)重復元素,則將待添加的元素 key 封裝成Node對象,添加在鏈表結(jié)尾,同時,檢查當前鏈表節(jié)點數(shù)量是否達到樹化(將鏈表轉(zhuǎn)成紅黑樹)的閾值默認是 8,若達到閾值,則首先檢查當前數(shù)組的大小是否達到64,若達到,則將該鏈表轉(zhuǎn)成紅黑樹;若沒達到64,則先對數(shù)組進行擴容;否則退出循環(huán),返回 e 為空。static final int TREEIFY_THRESHOLD = 8;
②若遍歷發(fā)現(xiàn)有重復元素,退出循環(huán),此時的變量 e 就是重復元素。若頂層創(chuàng)建的對象是HashSet();則下面的語句沒有意義,因為value值是共享的PRESENT;若是頂層是 HashMap(k,v) 對象,下面語句表達的是:當在map數(shù)組中發(fā)現(xiàn)已經(jīng)存入key了,就把待添加鍵值對的value 替換掉舊的value,key不變。
不管創(chuàng)建哪種對象,返回值都不為空,說明添加失敗。(到此添加重復元素流程結(jié)束)
補充總結(jié):
①hashSet()底層實現(xiàn)的其實是hashMap(),數(shù)據(jù)結(jié)構(gòu)相同都是數(shù)組+單鏈表,元素數(shù)據(jù)類型是HashMap的內(nèi)部類Node類型–Node<k,v>
②利用無參構(gòu)造方法創(chuàng)建HashSet,默認大小16,加載因子 0.75,擴容為原大小的 2 倍,擴容閾值 = 數(shù)組大小 * 加載因子。(也可用有參構(gòu)造方法創(chuàng)建對象,設(shè)定大小或加載因子)
③HashSet中的add();方法其實就是map.put()方法,只是由于添加的都是單一元素(參數(shù)key),并不是<k,v>鍵值對,所以統(tǒng)一用共享value(常量PRESENT)。
④HashSet不允許存儲元素重復,就和HashMap不允許重復的key一樣,只是HahsSet沒有用到value。
⑤添加元素的時候,要先得到key的hashCode值,經(jīng)過hash函數(shù)后得到hash值,再經(jīng)過一次計算得到待添加的key應(yīng)該存放的數(shù)組下標。若當前下標對應(yīng)位置不為空,則遍歷該鏈表,查找是否有重復元素(若重復,則不添加;反之,加在鏈表尾部);若當前下標位置上為空,則之間添加到當前位置并作為頭節(jié)點。(這也就是為什么,實際存儲順序和實際輸出順序不一致)
總結(jié)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Java簡單實現(xiàn)SpringMVC+MyBatis分頁插件
自己最近搭建的一個SpringMVC+Mybatis的框架 屬于無實體類的框架 并實現(xiàn)了Myabtis的自動分頁和總數(shù)查詢 只要傳入分頁參數(shù)便能自動查詢總數(shù)和分頁 總數(shù)封裝在參數(shù)里面執(zhí)行查詢后可以直接從參數(shù)中獲取2015-09-09深入淺析Java中普通代碼塊、構(gòu)造代碼塊與靜態(tài)代碼塊
這篇文章主要介紹了Java中普通代碼塊、構(gòu)造代碼塊與靜態(tài)代碼塊的相關(guān)資料,靜態(tài)代碼塊>Main()>構(gòu)造代碼塊 。非常不錯,具有參考借鑒價值,需要的朋友可以參考下2016-08-08spring data jpa 查詢自定義字段,轉(zhuǎn)換為自定義實體方式
這篇文章主要介紹了spring data jpa 查詢自定義字段,轉(zhuǎn)換為自定義實體方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-06-06springboot+quartz以持久化的方式實現(xiàn)定時任務(wù)的代碼
這篇文章主要介紹了springboot+quartz以持久化的方式實現(xiàn)定時任務(wù)的相關(guān)知識,本文通過實例代碼給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-07-07java httpclient設(shè)置超時時間和代理的方法
這篇文章主要介紹了java httpclient設(shè)置超時時間和代理的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2020-02-02