Java集合框架之Set和Map詳解
Set接口
set接口等同于Collection接口,不過其方法的行為有更嚴謹?shù)亩x。set的add方法不允許增加重復(fù)的元素。要適當(dāng)?shù)囟xset的equals方法:只要倆個set包含同樣的元素就認為它們是相同的,而不要求這些元素有相同的順序。hashCode方法的定義要保證包含相同元素的倆個set會得到相同的散列碼。
——Java核心技術(shù) 卷一
public interface Set<E> extends Collection<E> {
//一些方法
}
set不允許包含相同的元素,如果調(diào)用 add 方法來添加倆個相同的元素,那么在添加第二個元素時就會返回 false。這個接口有倆個比較常用的實現(xiàn)類:HashSet,TreeSet。HashSet是一個沒有重復(fù)元素的一個無序集合,而TreeSet是一個有序集。

HashSet
HashSet 使用數(shù)組和鏈表來實現(xiàn)散列表,不同 hashcode 的值存放在不同數(shù)組下標的位置,相同 hashcode 的值存放在相同數(shù)組下標的鏈表上的不同位置上。
public class HashSet<E>
extends AbstractSet<E>
implements Set<E>, Cloneable, java.io.Serializable{
//一些方法
}
HashSet類中有四個構(gòu)造方法:
public HashSet() //構(gòu)造一個空的散列集 public HashSet(Collection<? extends E> c) //構(gòu)造一個散列集,并將集合中的所有元素添加到這個散列集中 public HashSet(int initialCapacity, float loadFactor) //構(gòu)造一個有指定容量和裝填因子的空散列集 public HashSet(int initialCapacity) //構(gòu)造一個指定容量的空散列集
現(xiàn)在讓我們來看一下add方法的源碼:
public boolean add(E e) {
return map.put(e, PRESENT)==null;
}
可以看到這里面是調(diào)用了 map.put() 方法,map 在HashSet中的聲明如下:
private transient HashMap<E,Object> map;
由此可見HashSet和HashMap有很緊密的聯(lián)系。
HashSet的底層是用一個HashMap來實現(xiàn)的。HashSet再添加時如何擴容問題在下文HashMap中再詳細介紹。
散列表
Java中,散列表用鏈表,數(shù)組實現(xiàn)。也就可以這么理解,在數(shù)組不同索引位置上放的是一個鏈表,要想查找表中對象的位置,要先計算它的散列碼,然后與數(shù)組長度取余,所得到的結(jié)果就是保存這個元素的索引。在保存對象時,通過這個計算方式得到了索引位置,如果這個位置沒有其他元素,那就將元素直接插入到該位置就好了,如果這個位置已經(jīng)有其他元素了,那么需要將這個新的對象與已有的對象進行比較,查看這個對象是否已經(jīng)存在。如果不存在就在鏈表的末尾存儲這個對象。
TreeSet
public class TreeSet<E> extends AbstractSet<E>
implements NavigableSet<E>, Cloneable, java.io.Serializable{
//一些方法
}
樹集是一個有序集合,可以以任意順序?qū)⒃夭迦爰现小?/p>
![[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-LmJuZcAV-1639916281542)(C:\Users\DELL\AppData\Roaming\Typora\typora-user-images\1639904244362.png)]](http://img.jbzj.com/file_images/article/202112/2021122108461218.png)
TreeSet排序是用一個紅黑樹完成的,每次將一個元素添加到樹中時,都會將其放置到正確的排序位置上。由于樹集時有序的,所以將一個元素添加到樹中要比添加到散列表中慢,所以如果不需要數(shù)據(jù)是有序的,就沒必要為了排序而影響性能。
它也有四個構(gòu)造函數(shù):
public TreeSet() //構(gòu)造一個空的樹集,排序方式是自然排序 public TreeSet(Comparator<? super E> comparator) //構(gòu)造一個空樹集,指定比較器,就是排序方式 public TreeSet(Collection<? extends E> c) //構(gòu)造一個樹集,并將集合中的所有元素添加到這個樹集中 public TreeSet(SortedSet<E> s) //構(gòu)造一個樹集,并增加一個集合或者有序集中的所有元素,如果是有序集的話,要使用同樣的順序。
上面提到的自然排序是用元素的 compareTo() 方法來比較元素的大小關(guān)系(比如你存入v,b,a,就會輸出a,b,v),然后將集合元素按照升序排列。
Map接口
集是一個集合,允許你快速的查找現(xiàn)有的元素。但是要查找一個元素,需要有所要查找的那個元素的準確副本。這不是一種常見的查找方式。通常,我們知道某些關(guān)鍵信息,希望查找與之關(guān)聯(lián)的元素。映射(map)數(shù)據(jù)結(jié)構(gòu)就是為此設(shè)計的。映射用來存放鍵 / 值對。如果提供了鍵,就可以查找到值。
——Java核心技術(shù)
public interface Map<K,V> {
int size(); //返回映射中的元素數(shù)
V get(Object key); //返回指定鍵對應(yīng)的值
V remove(Object key); //從映射中刪除指定鍵對應(yīng)的元素。
}
Java為映射提供了倆個通用的實現(xiàn):HashMap和TreeMap
HashMap
public class HashMap<K,V> extends AbstractMap<K,V>
implements Map<K,V>, Cloneable, Serializable {
}
實現(xiàn)了Map接口,存儲的內(nèi)容是鍵值對(key-value)映射,將鍵進行散列,散列或比較函數(shù)只應(yīng)用于鍵,與鍵相關(guān)的值不進行散列或比較。
HashMap底層的結(jié)構(gòu)是,散列表(數(shù)組和鏈表)和紅黑樹
![[外鏈圖片轉(zhuǎn)存失敗,源站可能有防盜鏈機制,建議將圖片保存下來直接上傳(img-oi9ZErOs-1639916281543)(C:\Users\DELL\AppData\Roaming\Typora\typora-user-images\1639910918514.png)]](http://img.jbzj.com/file_images/article/202112/2021122108461219.png)
我用反射的方式輸出了這個map的容量,可以看到如果使用無參的構(gòu)造方法,那么map的容量默認為16。我們也可以通過傳參的方式,來指定它的容量,值的一提的是,你指定的容量,一定要為 2 的冪次方,且要小于 int 范圍內(nèi)最大的 2 的冪次方數(shù)(1073741824)。
//指定容量 HashMap<String,String> map = new HashMap<String, String>(8);
這個構(gòu)造方法還是調(diào)用了下面的這個構(gòu)造方法,只是把默認的負載因子值傳進去了:
put方法,直接看源碼:
public V put(K key, V value) {
return putVal(hash(key), key, value, false, true);
}
調(diào)用put方法后,會根據(jù)鍵值來計算一個值(位置),然后調(diào)用putVal來存放元素。
final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
boolean evict) {
Node<K,V>[] tab; Node<K,V> p; int n, i;
//hash表為空或者長度為0的話,創(chuàng)建hash表
if ((tab = table) == null || (n = tab.length) == 0)
n = (tab = resize()).length;//resize()HashMap擴容的方法
if ((p = tab[i = (n - 1) & hash]) == null)
//如果位置上沒有元素,就加進去,成為鏈表的頭結(jié)點
tab[i] = newNode(hash, key, value, null);
else {
Node<K,V> e; K k;
if (p.hash == hash &&
((k = p.key) == key || (key != null && key.equals(k))))
e = p;
//如果這個值的類型為樹結(jié)構(gòu)的話,就直接添加到樹中,不會判斷是否超過8
else if (p instanceof TreeNode)
e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
else {
//binCount鏈表的長度
for (int binCount = 0; ; ++binCount) {
if ((e = p.next) == null) {
//如果鏈表不為空,就往下一個節(jié)點添加
p.next = newNode(hash, key, value, null);
//如果這個鏈表的長度大于8,就會轉(zhuǎn)為紅黑樹存儲
if (binCount >= TREEIFY_THRESHOLD - 1)
treeifyBin(tab, hash);
break;
}
if (e.hash == hash &&
((k = e.key) == key || (key != null && key.equals(k))))
break;
p = e;
}
}
//如果該鍵已經(jīng)有映射關(guān)系的話,用這次的值覆蓋掉之前的值
if (e != null) { // existing mapping for key
V oldValue = e.value;
if (!onlyIfAbsent || oldValue == null)
e.value = value;
afterNodeAccess(e);
return oldValue;
}
}
++modCount;
//如果里面的元素超過 threshold 的話就擴容
if (++size > threshold)
resize();
afterNodeInsertion(evict);
return null;
}
通過代碼中的注釋,相信你已經(jīng)初步了解了 put 方法,總的來說就是添加時首先是用 k 通過哈希函數(shù)計算位置,位置上如果沒有元素添加在鏈表的頭結(jié)點,如果有插入到鏈表的下一個節(jié)點,當(dāng)鏈表的長度為大于等于8時,轉(zhuǎn)為紅黑樹存儲,如果該鍵已經(jīng)有映射關(guān)系的話,用這次的值覆蓋掉之前的值,最后判斷要不要擴容。如果要擴容,會擴容為原來容量的2倍。這樣效率會高一些,也可以減少哈希沖突。
負載因子
上文中我們提到了負載因子,那么負載因子是什么呢?
負載因子也叫裝填因子,是一個0.0~1.0之間的數(shù),確定散列表填充的百分比,當(dāng)大于這個百分比時,散列表進行再散列。在map中,也就是說,當(dāng)put的元素數(shù)量超過一定值的時候,就會擴容,這個值就是負載因子*容量。
HashMap中的負載因子默認是0.75:
static final float DEFAULT_LOAD_FACTOR = 0.75f;
就是說如果map中的元素超過容量的3/4就要進行擴容。
那么為什么這里要默認為0.75呢?這了也是規(guī)定了一個相對合理的值,如果為 1 的話效率太低,滿了之后才擴容;如果為0.5的話,浪費空間。所以選了一個居中的值。
TreeMap
public class TreeMap<K,V>
extends AbstractMap<K,V>
implements NavigableMap<K,V>, Cloneable, java.io.Serializable{
}
它沒有實現(xiàn)Map接口是因為AbstractMap實現(xiàn)了Map接口,TreeMap是一個能比較元素大小的Map集合,可以對 key 值進行大小排序。其中,可以使用自然順序,也可以使用集合中自定義的比較器來進行排序。底層是紅黑樹結(jié)構(gòu)。
TreeMap中運用到的紅黑樹結(jié)構(gòu),是數(shù)據(jù)結(jié)構(gòu)的一種,相關(guān)知識太多,大家感興趣的話可以在網(wǎng)上查閱資料(博主對樹結(jié)構(gòu)的理解不是很透徹????)。
到此這篇關(guān)于Java集合框架之Set和Map詳解的文章就介紹到這了,更多相關(guān)Java集合內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
jvm雙親委派 vs 破壞雙親委派理解加載器的權(quán)責(zé)分配
這篇文章主要為大家介紹了jvm雙親委派 vs 破壞雙親委派對比來理解加載器的權(quán)責(zé)分配,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪2023-10-10
Javaweb基礎(chǔ)入門HTML之table與form
HTML的全稱為超文本標記語言,是一種標記語言。它包括一系列標簽.通過這些標簽可以將網(wǎng)絡(luò)上的文檔格式統(tǒng)一,使分散的Internet資源連接為一個邏輯整體。HTML文本是由HTML命令組成的描述性文本,HTML命令可以說明文字,圖形、動畫、聲音、表格、鏈接等2022-03-03
Postman實現(xiàn)傳List<String>集合
這篇文章主要介紹了Postman實現(xiàn)傳List<String>集合方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-08-08

