分析并發(fā)編程之LongAdder原理
一、前言
ConcurrentHashMap的源碼采用了一種比較獨(dú)特的方式對map中的元素?cái)?shù)量進(jìn)行統(tǒng)計(jì),自然是要好好研究一下其原理思想,同時也能更好地理解ConcurrentHashMap本身。
本文主要思路分為以下5個部分:
1.計(jì)數(shù)的使用效果
2.原理的直觀圖解
3.源碼的細(xì)節(jié)分析
4.與AtomicInteger的比較
5.思想的抽象
學(xué)習(xí)的入口自然是map的put方法
public V put(K key, V value) { return putVal(key, value, false); }
查看putVal方法
這里并不對ConcurrentHashMap本身的原理作過多討論,因此我們直接跳到計(jì)數(shù)部分
final V putVal(K key, V value, boolean onlyIfAbsent) { ... addCount(1L, binCount); return null; }
每當(dāng)成功添加一個元素之后,都會調(diào)用addCount方法進(jìn)行數(shù)量的累加1的操作,這就是我們研究的目標(biāo)
因?yàn)镃oncurrentHashMap的設(shè)計(jì)初衷就是為了解決多線程并發(fā)場景下的map操作,因此在作數(shù)值累加的時候自然也要考慮線程安全
當(dāng)然,多線程數(shù)值累加一般是學(xué)習(xí)并發(fā)編程的第一課,本身并非很復(fù)雜,可以采用AtomicInteger或者鎖等等方式來解決該問題
然而如果我們查看該方法,就會發(fā)現(xiàn),一個想來應(yīng)該比較簡單的累加方法,其邏輯看上去卻相當(dāng)復(fù)雜
這里我只貼出了累加算法的核心部分
private final void addCount(long x, int check) { CounterCell[] as; long b, s; if ((as = counterCells) != null || !U.compareAndSwapLong(this, BASECOUNT, b = baseCount, s = b + x)) { CounterCell a; long v; int m; boolean uncontended = true; if (as == null || (m = as.length - 1) < 0 || (a = as[ThreadLocalRandom.getProbe() & m]) == null || !(uncontended = U.compareAndSwapLong(a, CELLVALUE, v = a.value, v + x))) { fullAddCount(x, uncontended); return; } if (check <= 1) return; s = sumCount(); } ... }
我們就來研究一下該邏輯的實(shí)現(xiàn)思路。而這個思路其實(shí)是照搬了LongAdder類的邏輯,因此我們直接查看該算法的原始類
二、LongAdder類的使用
我們先看下LongAdder的使用效果
LongAdder adder = new LongAdder(); int num = 0; @Test public void test5() throws InterruptedException { Thread[] threads = new Thread[10]; for (int i = 0; i < 10; i++) { threads[i] = new Thread(() -> { for (int j = 0; j < 10000; j++) { adder.add(1); num += 1; } }); threads[i].start(); } for (int i = 0; i < 10; i++) { threads[i].join(); } System.out.println("adder:" + adder); System.out.println("num:" + num); }
輸出結(jié)果
adder:100000
num:40982
可以看到adder在使用效果上是可以保證累加的線程安全的
三、LongAdder原理的直觀理解
為了更好地對源碼進(jìn)行分析,我們需要先從直覺上理解它的原理,否則直接看代碼的話會一臉懵逼
LongAdder的計(jì)數(shù)主要分為2個對象
一個long類型的字段:base
一個Cell對象數(shù)組,Cell對象中就維護(hù)了一個long類型的字段value,用來計(jì)數(shù)
/** * Table of cells. When non-null, size is a power of 2. */ transient volatile Cell[] cells; /** * Base value, used mainly when there is no contention, but also as * a fallback during table initialization races. Updated via CAS. */ transient volatile long base;
當(dāng)沒有發(fā)生線程競爭的時候,累加都會發(fā)生在base字段上,這就相當(dāng)于是一個單線程累加2次,只不過base的累加是一個cas操作
當(dāng)發(fā)生線程競爭的時候,必然有一個線程對base的cas累加操作失敗,于是它先去判斷Cell是否已經(jīng)被初始化了,如果沒有則初始化一個長度為2的數(shù)組,并根據(jù)線程的hash值找到對應(yīng)的數(shù)組索引,并對該索引的Cell對象中的value值進(jìn)行累加(這個累加也是cas的操作)
如果一共有3個線程發(fā)生了競爭,那么其中第一個線程對base的cas累加成功,剩下2個線程都需要去對Cell數(shù)組中的元素進(jìn)行累加。因?yàn)閷ell中value值的累加也是一個cas操作,如果第二個線程和第三個線程的hash值對應(yīng)的數(shù)組下標(biāo)是同一個,那么同樣會發(fā)生競爭,如果第二個線程成功了,第三個線程就會去rehash自己的hash值,如果得到的新的hash值對應(yīng)的是另一個元素為null的數(shù)組下標(biāo),那么就new一個Cell對象并對value值進(jìn)行累加
如果此時有線程4同時參與競爭,那么對于線程4來說,即使rehash后還是可能在和線程3的競爭過程中cas失敗,此時如果當(dāng)前數(shù)組的容量小于系統(tǒng)可用的cpu的數(shù)量,那么它就會對數(shù)組進(jìn)行擴(kuò)容,之后再次rehash,重復(fù)嘗試對Cell數(shù)組中某個下標(biāo)對象的累加
以上就是整體直覺上的理解,然而代碼中還有很多細(xì)節(jié)的設(shè)計(jì)非常值得學(xué)習(xí),所以我們就開始進(jìn)入源碼分析的環(huán)節(jié)
四、源碼分析
入口方法是add
public void add(long x) { Cell[] as; long b, v; int m; Cell a; /** * 這里優(yōu)先判斷了cell數(shù)組是否為空,之后才判斷base字段的cas累加 * 意味著如果線程不發(fā)生競爭,cell數(shù)組一直為空,那么所有的累加操作都會累加到base上 * 而一旦發(fā)生過一次競爭導(dǎo)致cell數(shù)組不為空,那么所有的累加操作都會優(yōu)先作用于數(shù)組中的對象上 */ if ((as = cells) != null || !casBase(b = base, b + x)) { /** * 這個字段是用來標(biāo)識在對cell數(shù)組中的對象進(jìn)行累加操作時是否發(fā)生了競爭 * 如果發(fā)生了競爭,那么在longAccumulate方法中會多進(jìn)行一次rehash的自旋 * 這個在后面的方法中詳細(xì)說明,這里先有個印象 * true表示未發(fā)生競爭 */ boolean uncontended = true; /** * 如果cell數(shù)組為空或者長度為0則直接進(jìn)入主邏輯方法 */ if (as == null || (m = as.length - 1) < 0 || /** * 這里的getProbe()方法可以認(rèn)為就是獲取線程的hash值 * hash值與(數(shù)組長度-1)進(jìn)行位與操作后得到對應(yīng)的數(shù)組下標(biāo) * 判斷該元素是否為空,如果不為空那么就會嘗試?yán)奂? * 否則進(jìn)入主邏輯方法 */ (a = as[getProbe() & m]) == null || /** * 對數(shù)組下標(biāo)的元素進(jìn)行cas累加,如果成功了,那么就可以直接返回 * 否則進(jìn)入主邏輯方法 */ !(uncontended = a.cas(v = a.value, v + x))) longAccumulate(x, null, uncontended); } }
當(dāng)不發(fā)生線程競爭的時候,那累加操作就會由第一個if中的casBase負(fù)責(zé),對應(yīng)之前圖解的情況一
當(dāng)發(fā)生線程競爭之后,累加操作就會由cell數(shù)組負(fù)責(zé),對應(yīng)之前圖解的情況二(數(shù)組的初始化在longAccumulate方法中)
接著我們查看主邏輯方法,因?yàn)榉椒ū容^長,所以我會一段一段拿出來解析
longAccumulate方法
簽名中的參數(shù)
x表示需要累加的值
fn表示需要如何累加,一般傳null就行,不重要
wasUncontended表示是否在外層方法遇到了競爭失敗的情況,因?yàn)橥鈱拥呐袛噙壿嬍嵌鄠€“或”(as == null || (m = as.length - 1) < 0 || (a = as[getProbe() & m]) == null),所以如果數(shù)組為空或者相應(yīng)的下標(biāo)元素還未初始化,這個字段就會保持false
final void longAccumulate(long x, LongBinaryOperator fn, boolean wasUncontended) { ... }
首先判斷線程的hash值是否為0,如果為0則需要做一個初始化,即rehash
之后會將wasUncontended置為true,因?yàn)榧词怪笆菦_突過的,經(jīng)過rehash后就會先假設(shè)它能找到一個元素不沖突的數(shù)組下標(biāo)
int h;//線程的hash值,在后面的邏輯中會用到 if ((h = getProbe()) == 0) { ThreadLocalRandom.current(); // force initialization h = getProbe(); wasUncontended = true; }
之后是一個死循環(huán),死循環(huán)中有3個大的if分支,這3個分支的邏輯作用于數(shù)組未初始化的時候,一旦數(shù)組初始化完成,那么就都會進(jìn)入主邏輯了,因此我這里把主邏輯抽取出來放到后面單獨(dú)說,也可以避免外層分支對思路的影響
/** * 用來標(biāo)記某個線程在上一次循環(huán)中找到的數(shù)組下標(biāo)是否已經(jīng)有Cell對象了 * 如果為true,則表示數(shù)組下標(biāo)為空 * 在主邏輯的循環(huán)中會用到 */ boolean collide = false; /** * 死循環(huán),提供自旋操作 */ for (; ; ) { Cell[] as; Cell a; int n;//cell數(shù)組長度 long v;//需要被累積的值 /** * 如果cells數(shù)組不為空,且已經(jīng)被某個線程初始化成功,那么就會進(jìn)入主邏輯,這個后面詳細(xì)解釋 */ if ((as = cells) != null && (n = as.length) > 0) { ... /** * 如果數(shù)組為空,那么就需要初始化一個Cell數(shù)組 * cellsBusy用來標(biāo)記cells數(shù)組是否能被操作,作用相當(dāng)于一個鎖 * cells == as 判斷是否有其他線程在當(dāng)前線程進(jìn)入這個判斷之前已經(jīng)初始化了一個數(shù)組 * casCellsBusy 用一個cas操作給cellsBusy字段賦值為1,如果成功可以認(rèn)為拿到了操作cells數(shù)組的鎖 */ } else if (cellsBusy == 0 && cells == as && casCellsBusy()) { /** * 這里就是初始化一個數(shù)組,不解釋了 */ boolean init = false; try { if (cells == as) { Cell[] rs = new Cell[2]; rs[h & 1] = new Cell(x); cells = rs; init = true; } } finally { cellsBusy = 0; } if (init) break; /** * 如果當(dāng)前數(shù)組是空的,又沒有競爭過其他線程 * 那么就再次嘗試去給base賦值 * 如果又沒競爭過(感覺有點(diǎn)可憐),那么就自旋 * 另外提一下方法簽名中的LongBinaryOperator對象就是用在這里的,不影響邏輯 */ } else if (casBase(v = base, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) break; // Fall back on using base }
接著就看對cell數(shù)組元素進(jìn)行累加的主邏輯
/** * 如果cells數(shù)組不為空,且已經(jīng)被某個線程初始化成功,進(jìn)入主邏輯 */ if ((as = cells) != null && (n = as.length) > 0) { /** * 如果當(dāng)前線程的hash值對應(yīng)的數(shù)組元素為空 */ if ((a = as[(n - 1) & h]) == null) { /** * Cell數(shù)組并未被其他線程操作 */ if (cellsBusy == 0) { /** * 這里沒有理解作者為什么會在這里初始化單個Cell * 作者這里的注釋是Optimistically create,如果有理解的同學(xué)可以說一下 */ Cell r = new Cell(x); /** * 在此判斷cell鎖的狀態(tài),并嘗試加鎖 */ if (cellsBusy == 0 && casCellsBusy()) { boolean created = false; try { /** * 這里對數(shù)組是否為空等狀態(tài)再次進(jìn)行校驗(yàn) * 如果校驗(yàn)通過,那么就將之前new的Cell對象放到Cell數(shù)組的該下標(biāo)處 */ Cell[] rs; int m, j; if ((rs = cells) != null && (m = rs.length) > 0 && rs[j = (m - 1) & h] == null) { rs[j] = r; created = true; } } finally { cellsBusy = 0; } /** * 如果創(chuàng)建成功,就說明累加成功,直接退出循環(huán) */ if (created) break; /** * 走到這里說明在判空和拿到鎖之間正好有其他線程在該下標(biāo)處創(chuàng)建了一個Cell * 因此直接continue,不rehash,下次就不會進(jìn)入到該分支了 */ continue; } } /** * 當(dāng)執(zhí)行到這里的時候,因?yàn)槭窃?if ((a = as[(n - 1) & h]) == null) 這個判斷邏輯中 * 就說明在第一個if判斷的時候該下標(biāo)處沒有元素,所以賦值為false * collide的意義是:上一次循環(huán)中找到的數(shù)組下標(biāo)是否已經(jīng)有Cell對象了 * True if last slot nonempty */ collide = false; /** * 這個字段如果為false,說明之前已經(jīng)和其他線程發(fā)過了競爭 * 即使此時可以直接取嘗試cas操作,但是在高并發(fā)場景下 * 這2個線程之后依然可能發(fā)生競爭,而每次競爭都需要自旋的話會很浪費(fèi)cpu資源 * 因此在這里先直接增加自旋一次,在for的最后會做一次rehash * 使得線程盡快地找到自己獨(dú)占的數(shù)組下標(biāo) */ } else if (!wasUncontended) wasUncontended = true; /** * 嘗試給hash對應(yīng)的Cell累加,如果這一步成功了,那么就返回 * 如果這一步依然失敗了,說明此時整體的并發(fā)競爭非常激烈 * 那就可能需要考慮擴(kuò)容數(shù)組了 * (因?yàn)閿?shù)組初始化容量為2,如果此時有10個線程在并發(fā)運(yùn)行,那就很難避免競爭的發(fā)生了) */ else if (a.cas(v = a.value, ((fn == null) ? v + x : fn.applyAsLong(v, x)))) break; /** * 這里判斷下cpu的核數(shù),因?yàn)榧词褂?00個線程 * 能同時并行運(yùn)行的線程數(shù)等于cpu數(shù) * 因此如果數(shù)組的長度已經(jīng)大于cpu數(shù)目了,那就不應(yīng)當(dāng)再擴(kuò)容了 */ else if (n >= NCPU || cells != as) collide = false; /** * 走到這里,說明當(dāng)前循環(huán)中根據(jù)線程hash值找到的數(shù)組下標(biāo)已經(jīng)有元素了 * 如果此時collide為false,說明上一次循環(huán)中找到的下邊是沒有元素的 * 那么就自旋一次并rehash * 如果再次運(yùn)行到這里,并且collide為true,就說明明競爭非常激烈,應(yīng)當(dāng)擴(kuò)容了 */ else if (!collide) collide = true; /** * 能運(yùn)行到這里,說明需要擴(kuò)容數(shù)組了 * 判斷鎖狀態(tài)并嘗試獲取鎖 */ else if (cellsBusy == 0 && casCellsBusy()) { /** * 擴(kuò)容數(shù)組的邏輯,這個擴(kuò)容比較簡單,就不解釋了 * 擴(kuò)容大小為2倍 */ try { if (cells == as) { Cell[] rs = new Cell[n << 1]; for (int i = 0; i < n; ++i) rs[i] = as[i]; cells = rs; } } finally { cellsBusy = 0; } collide = false; /** * 這里直接continue,因?yàn)閿U(kuò)容過了,就先不rehash了 */ continue; } /** * 做一個rehash,使得線程在下一個循環(huán)中可能找到獨(dú)占的數(shù)組下標(biāo) */ h = advanceProbe(h); }
到這里L(fēng)ongAdder的源碼其實(shí)就分析結(jié)束了,其實(shí)代碼并不多,但是他的思想非常值得我們?nèi)W(xué)習(xí)。
五、與AtomicInteger的比較
光分析源碼其實(shí)還差一些感覺,我們還沒有搞懂為何作者要在已經(jīng)有AtomicInteger的情況下,再設(shè)計(jì)這么一個看上去非常復(fù)雜的類。
那么首先我們先分析下AtomicInteger保證線程安全的原理
查看最基本的getAndIncrement方法
public final int getAndIncrement() { return unsafe.getAndAddInt(this, valueOffset, 1); }
調(diào)用了Unsafe類的getAndAddInt方法,繼續(xù)往下看
public final int getAndAddInt(Object var1, long var2, int var4) { int var5; do { var5 = this.getIntVolatile(var1, var2); } while(!this.compareAndSwapInt(var1, var2, var5, var5 + var4)); return var5; }
這里我們不再深究getIntVolatile和compareAndSwapInt方法具體實(shí)現(xiàn),因?yàn)槠湟呀?jīng)是native的方法了
可以看到,AtomicInteger底層是使用了cas+自旋的方式解決原子性問題的,即如果一次賦值不成功,那么就自旋,直到賦值成功為止
那么由此可以推斷,當(dāng)出現(xiàn)大量線程并發(fā),競爭非常激烈的時候,AtomicInteger就有可能導(dǎo)致有些線程不斷地競爭失敗,不斷自旋從而影響任務(wù)的吞吐量
為了解決高并發(fā)下的自旋問題,LongAdder的作者在設(shè)計(jì)的時候就通過增加一個數(shù)組的方式,使得競爭的對象從一個值變成多個值,從而使得發(fā)生競爭的頻率降低,從而緩解了自旋的問題,當(dāng)然付出的代價就是額外的存儲空間。
最后我簡單做了個測試,比較2種計(jì)數(shù)方法的耗時
通過原理可知,只有當(dāng)線程競爭非常激烈的時候,LongAdder的優(yōu)勢才會比較明顯,因此這里我用了100個線程,每一個線程對同一個數(shù)累加1000000次,得到結(jié)果如下,差距非常巨大,達(dá)到15倍!
LongAdder耗時:104292242nanos
AtomicInteger耗時:1583294474nanos
當(dāng)然這只是一個簡單測試,包含了很多隨機(jī)性,有興趣的同學(xué)可以嘗試不同的競爭程度多次測試
六、思想的抽象
最后我們需要將作者的具體代碼和實(shí)現(xiàn)邏輯抽象一下,理清思考的過程
1)AtomicInteger遇到的問題:單個資源的競爭導(dǎo)致自旋的發(fā)生
2)解決的思路:將單個對象的競爭擴(kuò)展為多個對象的競爭(有那么一些分治的思想)
3)擴(kuò)展的可控性:多個競爭對象需要付出額外的存儲空間,因此不能無腦地?cái)U(kuò)展(極端情況是一個線程一個計(jì)數(shù)的對象,這明顯不合理)
4)問題的分層:因?yàn)槭褂妙惖臅r候的場景是不可控的,因此需要根據(jù)并發(fā)的激烈程度動態(tài)地?cái)U(kuò)展額外的存儲空間(類似于synchronized的膨脹)
5)3個分層策略:當(dāng)不發(fā)生競爭時,那么用一個值累加即可;當(dāng)發(fā)生一定程度的競爭時,創(chuàng)建一個容量為2的數(shù)組,使得競爭的資源擴(kuò)展為3個;當(dāng)競爭更加激烈時,則繼續(xù)擴(kuò)展數(shù)組(對應(yīng)圖解中的1個線程到4個線程的過程)
6)策略細(xì)節(jié):在自旋的時候增加rehash,此時雖然付出了一定的運(yùn)算時間計(jì)算hash、比較數(shù)組對象等,但是這會使得并發(fā)的線程盡快地找到專屬于自己的對象,在之后就不會再發(fā)生任何競爭(磨刀不誤砍柴工,特別注意wasUncontended字段的相關(guān)注解)
以上就是分析并發(fā)編程之LongAdder原理的詳細(xì)內(nèi)容,更多關(guān)于并發(fā)編程 LongAdder的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
Java 圖解Spring啟動時的后置處理器工作流程是怎樣的
spring的后置處理器有兩類,bean后置處理器,bf(BeanFactory)后置處理器。bean后置處理器作用于bean的生命周期,bf的后置處理器作用于bean工廠的生命周期2021-10-10Java實(shí)現(xiàn)的打地鼠小游戲完整示例【附源碼下載】
這篇文章主要介紹了Java實(shí)現(xiàn)的打地鼠小游戲,結(jié)合完整實(shí)例形式分析了Java多線程操作及鍵盤按鍵響應(yīng)實(shí)現(xiàn)的打地鼠游戲功能相關(guān)操作技巧,需要的朋友可以參考下2018-07-07解決SpringBoot application.yaml文件配置schema 無法執(zhí)行sql問題
這篇文章主要介紹了解決SpringBoot application.yaml文件配置schema 無法執(zhí)行sql問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2021-08-08IntelliJ IDEA2020.1 Mac maven sdk 全局配置
這篇文章主要介紹了IntelliJ IDEA2020.1 Mac maven sdk 全局配置,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-06-06JAVA多線程之中斷機(jī)制stop()、interrupted()、isInterrupted()
這篇文章主要介紹了JAVA多線程之中斷機(jī)制stop()、interrupted()、isInterrupted()的相關(guān)資料,需要的朋友可以參考下2016-05-05SpringBoot實(shí)現(xiàn)MapperScan添加動態(tài)配置(占位符)
這篇文章主要介紹了SpringBoot實(shí)現(xiàn)MapperScan添加動態(tài)配置(占位符),具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教。2022-01-01spring boot metrics監(jiān)控指標(biāo)使用教程
這篇文章主要為大家介紹了針對應(yīng)用監(jiān)控指標(biāo)暴露spring boot metrics監(jiān)控指標(biāo)的使用教程,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步2022-02-02