詳解Java集合類之HashSet篇

更新時間：2022年07月22日 14:52:13 作者：世界盡頭與你

這篇文章主要為大家詳細介紹一下Java集合類中HashSet的用法，文中的示例代碼講解詳細，對我們學(xué)習(xí)Java有一定幫助，感興趣的可以了解一下

1.Set接口方法

Set接口對象存放的數(shù)據(jù)是沒有重復(fù)，且數(shù)據(jù)是無序存放的（添加順序和存放順序不一致，但是這個存放的順序是固定的，不會隨機變化）

代碼示例：

import java.util.HashSet;
import java.util.Iterator;
import java.util.Set;

/**
 * Set接口方法
 */
public class SetTest {
    @SuppressWarnings({"all"})
    public static void main(String[] args) {
        Set set = new HashSet();
        // 添加
        set.add("dahe");
        set.add("wangwei");
        set.add(521);
        set.add(521);
        set.add(null);
        System.out.println(set);
        // 遍歷Set
        // 迭代器
        Iterator iterator = set.iterator();
        while (iterator.hasNext()) {
            Object obj =  iterator.next();
            System.out.println(obj);
        }
        // 增強for
        for (Object o : set) {
            System.out.println(o);
        }
    }
}

2.HashSet

HashSet的底層其實，是HashMap：維護的是一個數(shù)組 + 單向鏈表

public HashSet() {
    map = new HashMap<>();
}

HashSet不保證存放元素的順序和取出的順序一致，這取決于hash后，再確定索引的結(jié)果

代碼示例：

import java.util.HashSet;
import java.util.Set;

/**
 * HashSet
 */
public class HashSetText {
    @SuppressWarnings({"all"})
    public static void main(String[] args) {
        Set hashSet = new HashSet();
        // 添加
        hashSet.add("dahe");
        // 添加成功，返回true，失敗返回false
        System.out.println(hashSet.add("qian"));
        System.out.println(hashSet.add("qian"));
        System.out.println(hashSet);
        // 添加對象，以下是不同的對象
        hashSet.add(new DDD("aaa"));
        hashSet.add(new DDD("aaa"));
        System.out.println(hashSet);
        // 經(jīng)典面試題，以下的兩個只能添加一個
        hashSet.add(new String("hsp"));
        hashSet.add(new String("hsp"));
        System.out.println(hashSet);
    }
}

class DDD {
    private String name;

    public DDD(String name) {
        this.name = name;
    }

    @Override
    public String toString() {
        return "DDD{" +
                "name='" + name + '\'' +
                '}';
    }
}

3.HashSet的擴容機制 - 初次添加數(shù)據(jù)

針對如下的代碼對java的擴容機制進行分析：

hashSet.add("dahe");
System.out.println(hashSet.add("qian"));
System.out.println(hashSet.add("qian"));

執(zhí)行add操作：（傳入待添加的值e和PRESENT，這里的PRESENT只起到一個占位的效果）

private static final Object PRESENT = new Object();

public boolean add(E e) {
    return map.put(e, PRESENT)==null;
}

繼續(xù)步入：

public V put(K key, V value) {
    return putVal(hash(key), key, value, false, true);
}

在進入putVal方法之前，我們先來看一下這個hash的算法：

static final int hash(Object key) {
    int h;
    return (key == null) ? 0 : (h = key.hashCode()) ^ (h >>> 16);
}

如果待添加的數(shù)據(jù)為null，則返回0值，否則返回hash算法的結(jié)果（此算法可以極大的防止沖突的發(fā)生）

執(zhí)行putVal方法：這個方法很重要（且復(fù)雜）！

final V putVal(int hash, K key, V value, boolean onlyIfAbsent,
               boolean evict) {
    Node<K,V>[] tab; Node<K,V> p; int n, i;
    if ((tab = table) == null || (n = tab.length) == 0)
        n = (tab = resize()).length;
    if ((p = tab[i = (n - 1) & hash]) == null)
        tab[i] = newNode(hash, key, value, null);
    else {
        Node<K,V> e; K k;
        if (p.hash == hash &&
            ((k = p.key) == key || (key != null && key.equals(k))))
            e = p;
        else if (p instanceof TreeNode)
            e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);
        else {
            for (int binCount = 0; ; ++binCount) {
                if ((e = p.next) == null) {
                    p.next = newNode(hash, key, value, null);
                    if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
                        treeifyBin(tab, hash);
                    break;
                }
                if (e.hash == hash &&
                    ((k = e.key) == key || (key != null && key.equals(k))))
                    break;
                p = e;
            }
        }
        if (e != null) { // existing mapping for key
            V oldValue = e.value;
            if (!onlyIfAbsent || oldValue == null)
                e.value = value;
            afterNodeAccess(e);
            return oldValue;
        }
    }
    ++modCount;
    if (++size > threshold)
        resize();
    afterNodeInsertion(evict);
    return null;
}

不要慌，我們來一步一步進行分析：

先來看一下這個東西：

Node<K,V>[] tab;

這個是存放Map Node節(jié)點的數(shù)組，如果你精通數(shù)據(jù)結(jié)構(gòu)鄰接表，對這個數(shù)組應(yīng)該很熟悉，tab里面的存儲結(jié)構(gòu)是這樣的：（下圖僅作示例）

當這個節(jié)點數(shù)組為空或者大小為0的時候，會觸發(fā)這個操作：（tab先進行resize操作，隨后返回給n一個處理后數(shù)組的大?。?/p>

if ((tab = table) == null || (n = tab.length) == 0)
    n = (tab = resize()).length;

那這個resize操作到底是什么呢？我們步入來看看它的真面目：

final Node<K,V>[] resize() {
    Node<K,V>[] oldTab = table;
    int oldCap = (oldTab == null) ? 0 : oldTab.length;
    int oldThr = threshold;
    int newCap, newThr = 0;
    if (oldCap > 0) {
        if (oldCap >= MAXIMUM_CAPACITY) {
            threshold = Integer.MAX_VALUE;
            return oldTab;
        }
        else if ((newCap = oldCap << 1) < MAXIMUM_CAPACITY &&
                 oldCap >= DEFAULT_INITIAL_CAPACITY)
            newThr = oldThr << 1; // double threshold
    }
    else if (oldThr > 0) // initial capacity was placed in threshold
        newCap = oldThr;
    else {               // zero initial threshold signifies using defaults
        newCap = DEFAULT_INITIAL_CAPACITY;
        newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);
    }
    if (newThr == 0) {
        float ft = (float)newCap * loadFactor;
        newThr = (newCap < MAXIMUM_CAPACITY && ft < (float)MAXIMUM_CAPACITY ?
                  (int)ft : Integer.MAX_VALUE);
    }
    threshold = newThr;
    @SuppressWarnings({"rawtypes","unchecked"})
    Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
    table = newTab;
    if (oldTab != null) {
        for (int j = 0; j < oldCap; ++j) {
            Node<K,V> e;
            if ((e = oldTab[j]) != null) {
                oldTab[j] = null;
                if (e.next == null)
                    newTab[e.hash & (newCap - 1)] = e;
                else if (e instanceof TreeNode)
                    ((TreeNode<K,V>)e).split(this, newTab, j, oldCap);
                else { // preserve order
                    Node<K,V> loHead = null, loTail = null;
                    Node<K,V> hiHead = null, hiTail = null;
                    Node<K,V> next;
                    do {
                        next = e.next;
                        if ((e.hash & oldCap) == 0) {
                            if (loTail == null)
                                loHead = e;
                            else
                                loTail.next = e;
                            loTail = e;
                        }
                        else {
                            if (hiTail == null)
                                hiHead = e;
                            else
                                hiTail.next = e;
                            hiTail = e;
                        }
                    } while ((e = next) != null);
                    if (loTail != null) {
                        loTail.next = null;
                        newTab[j] = loHead;
                    }
                    if (hiTail != null) {
                        hiTail.next = null;
                        newTab[j + oldCap] = hiHead;
                    }
                }
            }
        }
    }
    return newTab;
}

由于初始化tab為null，經(jīng)過一番操作，會執(zhí)行如下的代碼，這里給計算了新數(shù)組的空間大?。?/p>

newCap = DEFAULT_INITIAL_CAPACITY;
newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);

DEFAULT_INITIAL_CAPACITY的定義，默認表的大小為16：

static final int DEFAULT_INITIAL_CAPACITY = 1 << 4; // aka 16

下面這里是JDK設(shè)計者的聰明所在，tab數(shù)組并非用到空之后擴容，而是內(nèi)部有一個臨界的值newThr，所用的空間達到臨界的值會觸發(fā)擴容機制（容量*2），起到一個緩沖的效果，這樣做主要是為了防止阻塞

注意：這里的空間指的是全部節(jié)點的數(shù)量，而非tab元素的個數(shù)

newThr = (int)(DEFAULT_LOAD_FACTOR * DEFAULT_INITIAL_CAPACITY);

一切準備就緒，開始擴容（這里初始化擴容的tab容量為16）：

Node<K,V>[] newTab = (Node<K,V>[])new Node[newCap];
table = newTab;

我們再回到putVal方法，看一下接下來會發(fā)生什么有趣的事情

if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);

根據(jù)key得到hash，去計算該key應(yīng)該存放到table表的那個索引位置，并把這個位置對象賦值給p，如果p為null的話，表示該索引位置還沒有存放過任何的數(shù)據(jù)，就在tab[i]位置創(chuàng)建一個Node，創(chuàng)建完新Node之后，它在tab數(shù)組中的存儲結(jié)構(gòu)就變成了這樣：

繼續(xù)向下走，修改次數(shù) + 1，并且還要判斷一次tab元素數(shù)量是否大于了臨界值，如果大于了臨界值，進行擴容操作：

++modCount;
if (++size > threshold)
    resize();

最后，返回null，代表一切操作成功！

至此，初次添加數(shù)據(jù)的操作就已經(jīng)完成了！

4.HashSet的擴容機制 - 繼續(xù)添加數(shù)據(jù)

初次添加數(shù)據(jù)的結(jié)構(gòu)其實很簡單，更加困難的是第二次添加數(shù)據(jù)的操作

我們繼續(xù)步入，再次追到putVal方法：

和初次添加不同的是，不會再進入下面的語句，而是向下執(zhí)行：

if ((tab = table) == null || (n = tab.length) == 0)
    n = (tab = resize()).length;

直接判斷計算得出的tab索引位置有沒有數(shù)據(jù)，沒有的話（實驗的值沒有）繼續(xù)新建節(jié)點：

if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);

添加完數(shù)據(jù)后，tab里面的結(jié)構(gòu)就變成了這樣：

5.HashSet的擴容機制 - 添加重復(fù)元素

此時存在兩個key是相等的，那么下面的語句必然不會為空，因為key相等，那么他們hash過后的值也會相等：

if ((p = tab[i = (n - 1) & hash]) == null)
    tab[i] = newNode(hash, key, value, null);

繼續(xù)步入，走到else里面，我們來看一下if語句里面的內(nèi)容：

if (p.hash == hash &&
    ((k = p.key) == key || (key != null && key.equals(k))))
    e = p;

如果當前索引位置對應(yīng)的鏈表的第一個元素和準備添加的key的hash值一樣

并且滿足準備：（比較地址和值）

加入的key和p指向的Node節(jié)點的key是同一個對象
不是同一個對象，但是通過equals比較過后相同

這時就不能加入，執(zhí)行：e = p;

再來看看else if語句：

判斷p是不是一顆紅黑樹，如果是的話就按照紅黑樹的方式進行比較：

else if (p instanceof TreeNode)
    e = ((TreeNode<K,V>)p).putTreeVal(this, tab, hash, key, value);

再看看else語句：

for (int binCount = 0; ; ++binCount) {
    if ((e = p.next) == null) {
        p.next = newNode(hash, key, value, null);
        if (binCount >= TREEIFY_THRESHOLD - 1) // -1 for 1st
            treeifyBin(tab, hash);
        break;
    }
    if (e.hash == hash &&
        ((k = e.key) == key || (key != null && key.equals(k))))
        break;
    p = e;
}

當前索引位置已經(jīng)是一個鏈表。會依次和該鏈表的每一個節(jié)點進行比較，有重復(fù)的直接break掉，沒有重復(fù)的進行掛載

注意：在添加新節(jié)點之后，需要進行一次鏈表長度判斷，看下當前鏈表中是否已經(jīng)有8個節(jié)點了，如果已經(jīng)存在了8個節(jié)點，會通過treeifyBin方法嘗試進化鏈表為紅黑樹

有趣的是，在進化紅黑樹的代碼中，存在下面這兩行：

if (tab == null || (n = tab.length) < MIN_TREEIFY_CAPACITY)
    resize();

這里面的MIN_TREEIFY_CAPACITY定義如下：

static final int MIN_TREEIFY_CAPACITY = 64;

也就是說，如果tab長度小于64，不會馬上進行樹化，會先進行tab擴容操作！

到此這篇關(guān)于詳解Java集合類之HashSet篇的文章就介紹到這了,更多相關(guān)Java集合類HashSet內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

軟件下載

源碼下載

軟件編程

網(wǎng)絡(luò)編程

在線工具

數(shù)據(jù)庫

CMS

常用工具

詳解Java集合類之HashSet篇

目錄

1.Set接口方法

2.HashSet

3.HashSet的擴容機制 - 初次添加數(shù)據(jù)

4.HashSet的擴容機制 - 繼續(xù)添加數(shù)據(jù)

5.HashSet的擴容機制 - 添加重復(fù)元素

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具