java并發(fā)包JUC同步器框架AQS框架原文翻譯
摘要
在J2SE 1.5的java.util.concurrent包(下稱j.u.c包)中,大部分的同步器(例如鎖,屏障等等)都是基于AbstractQueuedSynchronizer類(下稱AQS類),這個(gè)簡(jiǎn)單的框架而構(gòu)建的。這個(gè)框架為同步狀態(tài)的原子性管理、線程的阻塞和解除阻塞以及排隊(duì)提供了一種通用的機(jī)制。這篇論文主要描述了這個(gè)框架基本原理、設(shè)計(jì)、實(shí)現(xiàn)、用法以及性能。
1. 背景介紹
通過JCP的JSR166規(guī)范,Java的1.5版本引入了j.u.c包,這個(gè)包提供了一系列支持中等程度并發(fā)的類。這些組件是一系列的同步器(抽象數(shù)據(jù)類型(ADT))。這些同步器主要維護(hù)著以下幾個(gè)功能:內(nèi)部同步狀態(tài)的管理(例如:表示一個(gè)鎖的狀態(tài)是獲取還是釋放),同步狀態(tài)的更新和檢查操作,且至少有一個(gè)方法會(huì)導(dǎo)致調(diào)用線程在同步狀態(tài)被獲取時(shí)阻塞,以及在其他線程改變這個(gè)同步狀態(tài)時(shí)解除線程的阻塞。上述的這些的實(shí)際例子包括:互斥排它鎖的不同形式、讀寫鎖、信號(hào)量、屏障、Future、事件指示器以及傳送隊(duì)列等。
幾乎任一同步器都可以用來實(shí)現(xiàn)其他形式的同步器。例如,可以用可重入鎖實(shí)現(xiàn)信號(hào)量或者用信號(hào)量實(shí)現(xiàn)可重入鎖。但是,這樣做帶來的復(fù)雜性,開銷,不靈活使其至多只能是個(gè)二流工程。且缺乏吸引力。如果任何這樣的構(gòu)造方式不能在本質(zhì)上比其他形式更簡(jiǎn)潔,那么開發(fā)者就不應(yīng)該隨意地選擇其中的某個(gè)來構(gòu)建另一個(gè)同步器。取而代之,JSR166建立了一個(gè)小框架,AQS類。這個(gè)框架為構(gòu)造同步器提供一種通用的機(jī)制,并且被j.u.c包中大部分類使用,同時(shí)很多用戶也用它來定義自己的同步器。
在這篇論文的下面部分會(huì)討論這個(gè)框架的需求、設(shè)計(jì)與實(shí)現(xiàn)背后的主要思路、示例用法,以及性能指標(biāo)的一些測(cè)量。
2 需求
2.1 功能
同步器一般包含兩種方法,一種是acquire,另一種是release。acquire操作阻塞調(diào)用的線程,直到或除非同步狀態(tài)允許其繼續(xù)執(zhí)行。而release操作則是通過某種方式改變同步狀態(tài),使得一或多個(gè)被acquire阻塞的線程繼續(xù)執(zhí)行。
j.u.c包中并沒有對(duì)同步器的API做一個(gè)統(tǒng)一的定義。因此,有一些類定義了通用的接口(如Lock),而另外一些則定義了其專有的版本。因此在不同的類中,acquire和release操作的名字和形式會(huì)各有不同。例如:Lock.lock,Semaphore.acquire,CountDownLatch.await和FutureTask.get,在這個(gè)框架里,這些方法都是acquire操作。但是,J.U.C為支持一系列常見的使用選項(xiàng),在類間都有個(gè)一致約定。在有意義的情況下,每一個(gè)同步器都支持下面的操作:
- 阻塞和非阻塞(例如tryLock)同步。
- 可選的超時(shí)設(shè)置,讓調(diào)用者可以放棄等待
- 通過中斷實(shí)現(xiàn)的任務(wù)取消,通常是分為兩個(gè)版本,一個(gè)acquire可取消,而另一個(gè)不可以。
同步器的實(shí)現(xiàn)根據(jù)其狀態(tài)是否獨(dú)占而有所不同。獨(dú)占狀態(tài)的同步器,在同一時(shí)間只有一個(gè)線程可以通過阻塞點(diǎn),而共享狀態(tài)的同步器可以同時(shí)有多個(gè)線程在執(zhí)行。一般鎖的實(shí)現(xiàn)類往往只維護(hù)獨(dú)占狀態(tài),但是,例如計(jì)數(shù)信號(hào)量在數(shù)量許可的情況下,允許多個(gè)線程同時(shí)執(zhí)行。為了使框架能得到廣泛應(yīng)用,這兩種模式都要支持。
j.u.c包里還定義了Condition接口,用于支持監(jiān)控形式的await/signal操作,這些操作與獨(dú)占模式的Lock類有關(guān),且Condition的實(shí)現(xiàn)天生就和與其關(guān)聯(lián)的Lock類緊密相關(guān)。
2.2 性能目標(biāo)
Java內(nèi)置鎖(使用synchronized的方法或代碼塊)的性能問題一直以來都在被人們關(guān)注,并且已經(jīng)有一系列的文章描述其構(gòu)造(例如引文[1],[3])。然而,大部分的研究主要關(guān)注的是在單核處理器上大部分時(shí)候使用于單線程上下文環(huán)境中時(shí),如何盡量降低其空間(因?yàn)槿魏蔚腏ava對(duì)象都可以當(dāng)成是鎖)和時(shí)間的開銷。對(duì)于同步器來說這些都不是特別重要:程序員僅在需要的時(shí)候才會(huì)使用同步器,因此并不需要壓縮空間來避免浪費(fèi),并且同步器幾乎是專門用在多線程設(shè)計(jì)中(特別是在多核處理器上),在這種環(huán)境下,偶爾的競(jìng)爭(zhēng)是在意料之中的。因此,常規(guī)的JVM鎖優(yōu)化策略主要是針對(duì)零競(jìng)爭(zhēng)的場(chǎng)景,而其它場(chǎng)景則使用缺乏可預(yù)見性的“慢速路徑(slow paths)” ,所以常規(guī)的JVM鎖優(yōu)化策略并不適用于嚴(yán)重依賴于J.U.C包的典型多線程服務(wù)端應(yīng)用。
這里主要的性能目標(biāo)是可伸縮性,即在大部分情況下,即使,或特別在同步器有競(jìng)爭(zhēng)的情況下,穩(wěn)定地保證其效率。在理想的情況下,不管有多少線程正試圖通過同步點(diǎn),通過同步點(diǎn)的開銷都應(yīng)該是個(gè)常量。在某一線程被允許通過同步點(diǎn)但還沒有通過的情況下,使其耗費(fèi)的總時(shí)間最少,這是主要目標(biāo)之一。然而,這也必須考慮平衡各種資源,包括總CPU時(shí)間的需求,內(nèi)存負(fù)載以及線程調(diào)度的開銷。例如:獲取自旋鎖通常比阻塞鎖所需的時(shí)間更短,但是通常也會(huì)浪費(fèi)CPU時(shí)鐘周期,并且造成內(nèi)存競(jìng)爭(zhēng),所以使用的并不頻繁。
實(shí)現(xiàn)同步器的這些目標(biāo)包含了兩種不同的使用類型。大部分應(yīng)用程序是最大化其總的吞吐量,容錯(cuò)性,并且最好保證盡量減少饑餓的情況。然而,對(duì)于那些控制資源分配的程序來說,更重要是去維持多線程讀取的公平性,可以接受較差的總吞吐量。沒有任何框架可以代表用戶去決定應(yīng)該選擇哪一個(gè)方式,因此,應(yīng)該提供不同的公平策略。
無論同步器的內(nèi)部實(shí)現(xiàn)是多么的精雕細(xì)琢,它還是會(huì)在某些應(yīng)用中產(chǎn)生性能瓶頸。因此,框架必須提供相應(yīng)的監(jiān)視工具讓用戶發(fā)現(xiàn)和緩和這些瓶頸。至少需要提供一種方式來確定有多少線程被阻塞了。
3 設(shè)計(jì)與實(shí)現(xiàn)
同步器背后的基本思想非常簡(jiǎn)單。
acquire操作如下:
while (synchronization state does not allow acquire) { enqueue current thread if not already queued; possibly block current thread; } dequeue current thread if it was queued;
release操作如下:
update synchronization state; if (state may permit a blocked thread to acquire) unblock one or more queued threads;
為了實(shí)現(xiàn)上述操作,需要下面三個(gè)基本組件的相互協(xié)作:
- 同步狀態(tài)的原子性管理;
- 線程的阻塞與解除阻塞;
- 隊(duì)列的管理;
創(chuàng)建一個(gè)框架分別實(shí)現(xiàn)這三個(gè)組件是有可能的。但是,這會(huì)讓整個(gè)框架既難用又沒效率。例如:存儲(chǔ)在隊(duì)列節(jié)點(diǎn)的信息必須與解除阻塞所需要的信息一致,而暴露出的方法的簽名必須依賴于同步狀態(tài)的特性。
同步器框架的核心決策是為這三個(gè)組件選擇一個(gè)具體實(shí)現(xiàn),同時(shí)在使用方式上又有大量選項(xiàng)可用。這里有意地限制了其適用范圍,但是提供了足夠的效率,使得實(shí)際上沒有理由在合適的情況下不用這個(gè)框架而去重新建造一個(gè)。
3.1 同步狀態(tài)
AQS類使用單個(gè)int
(32位)來保存同步狀態(tài),并暴露出getState
、setState
以及compareAndSet
操作來讀取和更新這個(gè)狀態(tài)。這些方法都依賴于j.u.c.atomic包的支持,這個(gè)包提供了兼容JSR133中volatile
在讀和寫上的語義,并且通過使用本地的compare-and-swap或load-linked/store-conditional指令來實(shí)現(xiàn)compareAndSetState
,使得僅當(dāng)同步狀態(tài)擁有一個(gè)期望值的時(shí)候,才會(huì)被原子地設(shè)置成新值。
將同步狀態(tài)限制為一個(gè)32位的整形是出于實(shí)踐上的考量。雖然JSR166也提供了64位long
字段的原子性操作,但這些操作在很多平臺(tái)上還是使用內(nèi)部鎖的方式來模擬實(shí)現(xiàn)的,這會(huì)使同步器的性能可能不會(huì)很理想。當(dāng)然,將來可能會(huì)有一個(gè)類是專門使用64位的狀態(tài)的。然而現(xiàn)在就引入這么一個(gè)類到這個(gè)包里并不是一個(gè)很好的決定
(譯者注:
JDK1.6中已經(jīng)包含java.util.concurrent.locks.AbstractQueuedLongSynchronizer類
即使用 long 形式維護(hù)同步狀態(tài)的一個(gè) AbstractQueuedSynchronizer
版本)。目前來說,32位的狀態(tài)對(duì)大多數(shù)應(yīng)用程序都是足夠的。在j.u.c包中,只有一個(gè)同步器類可能需要多于32位來維持狀態(tài),那就是CyclicBarrier
類,所以,它用了鎖(該包中大多數(shù)更高層次的工具亦是如此)。
基于AQS的具體實(shí)現(xiàn)類必須根據(jù)暴露出的狀態(tài)相關(guān)的方法定義tryAcquire
和tryRelease
方法,以控制acquire和release操作。當(dāng)同步狀態(tài)滿足時(shí),tryAcquire
方法必須返回true
,而當(dāng)新的同步狀態(tài)允許后續(xù)acquire時(shí),tryRelease
方法也必須返回true
。這些方法都接受一個(gè)int
類型的參數(shù)用于傳遞想要的狀態(tài)。例如:可重入鎖中,當(dāng)某個(gè)線程從條件等待中返回,然后重新獲取鎖時(shí),為了重新建立循環(huán)計(jì)數(shù)的場(chǎng)景。很多同步器并不需要這樣一個(gè)參數(shù),因此忽略它即可。
3.2 阻塞
在JSR166之前,阻塞線程和解除線程阻塞都是基于Java內(nèi)置監(jiān)視器,沒有基于Java API可以用來創(chuàng)建同步器。唯一可以選擇的是Thread.suspend
和Thread.resume
,但是它們都有無法解決的競(jìng)態(tài)問題,所以也沒法用:當(dāng)一個(gè)非阻塞的線程在一個(gè)正準(zhǔn)備阻塞的線程調(diào)用suspend
前調(diào)用了resume
,這個(gè)resume
操作將不會(huì)有什么效果。
j.u.c包有一個(gè)LockSuport
類,這個(gè)類中包含了解決這個(gè)問題的方法。方法LockSupport.park
阻塞當(dāng)前線程除非/直到有個(gè)LockSupport.unpark
方法被調(diào)用(unpark
方法被提前調(diào)用也是可以的)。unpark
的調(diào)用是沒有被計(jì)數(shù)的,因此在一個(gè)park
調(diào)用前多次調(diào)用unpark
方法只會(huì)解除一個(gè)park
操作。另外,它們作用于每個(gè)線程而不是每個(gè)同步器。一個(gè)線程在一個(gè)新的同步器上調(diào)用park操作可能會(huì)立即返回,因?yàn)樵诖酥翱赡苡?ldquo;剩余的”unpark
操作。但是,在缺少一個(gè)unpark
操作時(shí),下一次調(diào)用park就會(huì)阻塞。雖然可以顯式地消除這個(gè)狀態(tài)(譯者注:就是多余的unpark
調(diào)用),但并不值得這樣做。在需要的時(shí)候多次調(diào)用park
會(huì)更高效。
這個(gè)簡(jiǎn)單的機(jī)制與有些用法在某種程度上是相似的,例如Solaris-9的線程庫,WIN32中的“可消費(fèi)事件”,以及Linux中的NPTL線程庫。因此最常見的運(yùn)行Java的平臺(tái)上都有相對(duì)應(yīng)的有效實(shí)現(xiàn)。(但目前Solaris和Linux上的Sun Hotspot JVM參考實(shí)現(xiàn)實(shí)際上是使用一個(gè)pthread的condvar來適應(yīng)目前的運(yùn)行時(shí)設(shè)計(jì)的)。park
方法同樣支持可選的相對(duì)或絕對(duì)的超時(shí)設(shè)置,以及與JVM的Thread.interrupt
結(jié)合 ,可通過中斷來unpark
一個(gè)線程。
3.3 隊(duì)列
整個(gè)框架的關(guān)鍵就是如何管理被阻塞的線程的隊(duì)列,該隊(duì)列是嚴(yán)格的FIFO隊(duì)列,因此,框架不支持基于優(yōu)先級(jí)的同步。
同步隊(duì)列的最佳選擇是自身沒有使用底層鎖來構(gòu)造的非阻塞數(shù)據(jù)結(jié)構(gòu),目前,業(yè)界對(duì)此很少有爭(zhēng)議。而其中主要有兩個(gè)選擇:一個(gè)是Mellor-Crummey和Scott鎖(MCS鎖)[9]的變體,另一個(gè)是Craig,Landin和Hagersten鎖(CLH鎖)[5][8][10]的變體。一直以來,CLH鎖僅被用于自旋鎖。但是,在這個(gè)框架中,CLH鎖顯然比MCS鎖更合適。因?yàn)镃LH鎖可以更容易地去實(shí)現(xiàn)“取消(cancellation)”和“超時(shí)”功能,因此我們選擇了CLH鎖作為實(shí)現(xiàn)的基礎(chǔ)。但是最終的設(shè)計(jì)已經(jīng)與原來的CLH鎖有較大的出入,因此下文將對(duì)此做出解釋。
CLH隊(duì)列實(shí)際上并不那么像隊(duì)列,因?yàn)樗娜腙?duì)和出隊(duì)操作都與它的用途(即用作鎖)緊密相關(guān)。它是一個(gè)鏈表隊(duì)列,通過兩個(gè)字段head
和tail
來存取,這兩個(gè)字段是可原子更新的,兩者在初始化時(shí)都指向了一個(gè)空節(jié)點(diǎn)。
一個(gè)新的節(jié)點(diǎn),node,通過一個(gè)原子操作入隊(duì):
do { pred = tail; } while(!tail.compareAndSet(pred, node));
每一個(gè)節(jié)點(diǎn)的“釋放”狀態(tài)都保存在其前驅(qū)節(jié)點(diǎn)中。因此,自旋鎖的“自旋”操作就如下:
while (pred.status != RELEASED); // spin
自旋后的出隊(duì)操作只需將head字段指向剛剛得到鎖的節(jié)點(diǎn):
head = node;
CLH鎖的優(yōu)點(diǎn)在于其入隊(duì)和出隊(duì)操作是快速、無鎖的,以及無障礙的(即使在競(jìng)爭(zhēng)下,某個(gè)線程總會(huì)贏得一次插入機(jī)會(huì)而能繼續(xù)執(zhí)行);且探測(cè)是否有線程正在等待也很快(只要測(cè)試一下head是否與tail相等);同時(shí),“釋放”狀態(tài)是分散的(譯者注:幾乎每個(gè)節(jié)點(diǎn)都保存了這個(gè)狀態(tài),當(dāng)前節(jié)點(diǎn)保存了其后驅(qū)節(jié)點(diǎn)的“釋放”狀態(tài),因此它們是分散的,不是集中于一塊的。),避免了一些不必要的內(nèi)存競(jìng)爭(zhēng)。
在原始版本的CLH鎖中,節(jié)點(diǎn)間甚至都沒有互相鏈接。自旋鎖中,pred
變量可以是一個(gè)局部變量。然而,Scott和Scherer證明了通過在節(jié)點(diǎn)中顯式地維護(hù)前驅(qū)節(jié)點(diǎn),CLH鎖就可以處理“超時(shí)”和各種形式的“取消”:如果一個(gè)節(jié)點(diǎn)的前驅(qū)節(jié)點(diǎn)取消了,這個(gè)節(jié)點(diǎn)就可以滑動(dòng)去使用前面一個(gè)節(jié)點(diǎn)的狀態(tài)字段。
為了將CLH隊(duì)列用于阻塞式同步器,需要做些額外的修改以提供一種高效的方式定位某個(gè)節(jié)點(diǎn)的后繼節(jié)點(diǎn)。在自旋鎖中,一個(gè)節(jié)點(diǎn)只需要改變其狀態(tài),下一次自旋中其后繼節(jié)點(diǎn)就能注意到這個(gè)改變,所以節(jié)點(diǎn)間的鏈接并不是必須的。但在阻塞式同步器中,一個(gè)節(jié)點(diǎn)需要顯式地喚醒(unpark
)其后繼節(jié)點(diǎn)。
AQS隊(duì)列的節(jié)點(diǎn)包含一個(gè)next
鏈接到它的后繼節(jié)點(diǎn)。但是,由于沒有針對(duì)雙向鏈表節(jié)點(diǎn)的類似compareAndSet
的原子性無鎖插入指令,因此這個(gè)next
鏈接的設(shè)置并非作為原子性插入操作的一部分,而僅是在節(jié)點(diǎn)被插入后簡(jiǎn)單地賦值:
pred.next = node;
next
鏈接僅是一種優(yōu)化。如果通過某個(gè)節(jié)點(diǎn)的next
字段發(fā)現(xiàn)其后繼結(jié)點(diǎn)不存在(或看似被取消了),總是可以使用pred
字段從尾部開始向前遍歷來檢查是否真的有后續(xù)節(jié)點(diǎn)。
第二個(gè)對(duì)CLH隊(duì)列主要的修改是將每個(gè)節(jié)點(diǎn)都有的狀態(tài)字段用于控制阻塞而非自旋。在同步器框架中,僅在線程調(diào)用具體子類中的tryAcquire
方法返回true
時(shí),隊(duì)列中的線程才能從acquire
操作中返回;而單個(gè)“released”位是不夠的。但仍然需要做些控制以確保當(dāng)一個(gè)活動(dòng)的線程位于隊(duì)列頭部時(shí),僅允許其調(diào)用tryAcquire
;這時(shí)的acquire
可能會(huì)失敗,然后(重新)阻塞。這種情況不需要讀取狀態(tài)標(biāo)識(shí),因?yàn)榭梢酝ㄟ^檢查當(dāng)前節(jié)點(diǎn)的前驅(qū)是否為head
來確定權(quán)限。與自旋鎖不同,讀取head
以保證復(fù)制時(shí)不會(huì)有太多的內(nèi)存競(jìng)爭(zhēng)( there is not enough memory contention reading head to warrant replication.)。然而,“取消”狀態(tài)必須存在于狀態(tài)字段中。
隊(duì)列節(jié)點(diǎn)的狀態(tài)字段也用于避免沒有必要的park
和unpark
調(diào)用。雖然這些方法跟阻塞原語一樣快,但在跨越Java和JVM runtime以及操作系統(tǒng)邊界時(shí)仍有可避免的開銷。在調(diào)用park
前,線程設(shè)置一個(gè)“喚醒(signal me)”位,然后再一次檢查同步和節(jié)點(diǎn)狀態(tài)。一個(gè)釋放的線程會(huì)清空其自身狀態(tài)。這樣線程就不必頻繁地嘗試阻塞,特別是在鎖相關(guān)的類中,這樣會(huì)浪費(fèi)時(shí)間等待下一個(gè)符合條件的線程去申請(qǐng)鎖,從而加劇其它競(jìng)爭(zhēng)的影響。除非后繼節(jié)點(diǎn)設(shè)置了“喚醒”位(譯者注:源碼中為-1),否則這也可避免正在release的線程去判斷其后繼節(jié)點(diǎn)。這反過來也消除了這些情形:除非“喚醒”與“取消”同時(shí)發(fā)生,否則必須遍歷多個(gè)節(jié)點(diǎn)來處理一個(gè)似乎為null的next
字段。
同步框架中使用的CLH鎖的變體與其他語言中的相比,主要區(qū)別可能是同步框架中使用的CLH鎖需要依賴?yán)厥展芾砉?jié)點(diǎn)的內(nèi)存,這就避免了一些復(fù)雜性和開銷。但是,即使依賴GC也仍然需要在確定鏈接字段不再需要時(shí)將其置為null。這往往可以與出隊(duì)操作一起完成。否則,無用的節(jié)點(diǎn)仍然可觸及,它們就沒法被回收。
其它一些更深入的微調(diào),包括CLH隊(duì)列首次遇到競(jìng)爭(zhēng)時(shí)才需要的初始空節(jié)點(diǎn)的延遲初始化等,都可以在J2SE1.5的版本的源代碼文檔中找到相應(yīng)的描述。
拋開這些細(xì)節(jié),基本的acquire
操作的最終實(shí)現(xiàn)的一般形式如下(互斥,非中斷,無超時(shí)):
if(!tryAcquire(arg)) { node = create and enqueue new node; pred = node's effective predecessor; while (pred is not head node || !tryAcquire(arg)) { if (pred's signal bit is set) pard() else compareAndSet pred's signal bit to true; pred = node's effective predecessor; } head = node; }
release
操作:
if(tryRelease(arg) && head node's signal bit is set) { compareAndSet head's bit to false; unpark head's successor, if one exist }
acquire
操作的主循環(huán)次數(shù)依賴于具體實(shí)現(xiàn)類中tryAcquire
的實(shí)現(xiàn)方式。另一方面,在沒有“取消”操作的情況下,每一個(gè)組件的acquire
和release
都是一個(gè)O(1)的操作,忽略park
中發(fā)生的所有操作系統(tǒng)線程調(diào)度。
支持“取消”操作主要是要在acquire
循環(huán)里的park
返回時(shí)檢查中斷或超時(shí)。由超時(shí)或中斷而被取消等待的線程會(huì)設(shè)置其節(jié)點(diǎn)狀態(tài),然后unpark
其后繼節(jié)點(diǎn)。在有“取消”的情況下,判斷其前驅(qū)節(jié)點(diǎn)和后繼節(jié)點(diǎn)以及重置狀態(tài)可能需要O(n)的遍歷(n是隊(duì)列的長(zhǎng)度)。由于“取消”操作,該線程再也不會(huì)被阻塞,節(jié)點(diǎn)的鏈接和狀態(tài)字段可以被快速重建。
3.4 條件隊(duì)列
AQS框架提供了一個(gè)ConditionObject
類,給維護(hù)獨(dú)占同步的類以及實(shí)現(xiàn)Lock
接口的類使用。一個(gè)鎖對(duì)象可以關(guān)聯(lián)任意數(shù)目的條件對(duì)象,可以提供典型的管程風(fēng)格的await
、signal
和signalAll
操作,包括帶有超時(shí)的,以及一些檢測(cè)、監(jiān)控的方法。
通過修正一些設(shè)計(jì)決策,ConditionObject
類有效地將條件(conditions)與其它同步操作結(jié)合到了一起。該類只支持Java風(fēng)格的管程訪問規(guī)則,這些規(guī)則中,僅當(dāng)當(dāng)前線程持有鎖且要操作的條件(condition)屬于該鎖時(shí),條件操作才是合法的(一些替代操作的討論參考[4])。這樣,一個(gè)ConditionObject
關(guān)聯(lián)到一個(gè)ReentrantLock
上就表現(xiàn)的跟內(nèi)置的管程(通過Object.wait
等)一樣了。兩者的不同僅僅在于方法的名稱、額外的功能以及用戶可以為每個(gè)鎖聲明多個(gè)條件。
ConditionObject
使用了與同步器一樣的內(nèi)部隊(duì)列節(jié)點(diǎn)。但是,是在一個(gè)單獨(dú)的條件隊(duì)列中維護(hù)這些節(jié)點(diǎn)的。signal
操作是通過將節(jié)點(diǎn)從條件隊(duì)列轉(zhuǎn)移到鎖隊(duì)列中來實(shí)現(xiàn)的,而沒有必要在需要喚醒的線程重新獲取到鎖之前將其喚醒。
基本的await
操作如下:
create and add new node to conditon queue; release lock; block until node is on lock queue; re-acquire lock;
signal
操作如下:
transfer the first node from condition queue to lock queue;
因?yàn)橹挥性诔钟墟i的時(shí)候才能執(zhí)行這些操作,因此他們可以使用順序鏈表隊(duì)列操作來維護(hù)條件隊(duì)列(在節(jié)點(diǎn)中用一個(gè)nextWaiter
字段)。轉(zhuǎn)移操作僅僅把第一個(gè)節(jié)點(diǎn)從條件隊(duì)列中的鏈接解除,然后通過CLH插入操作將其插入到鎖隊(duì)列上。
實(shí)現(xiàn)這些操作主要復(fù)雜在,因超時(shí)或Thread.interrupt
導(dǎo)致取消了條件等待時(shí),該如何處理。“取消”和“喚醒”幾乎同時(shí)發(fā)生就會(huì)有競(jìng)態(tài)問題,最終的結(jié)果遵照內(nèi)置管程相關(guān)的規(guī)范。JSR133修訂以后,就要求如果中斷發(fā)生在signal
操作之前,await方法必須在重新獲取到鎖后,拋出InterruptedException
。但是,如果中斷發(fā)生在signal
后,await
必須返回且不拋異常,同時(shí)設(shè)置線程的中斷狀態(tài)。
為了維護(hù)適當(dāng)?shù)捻樞颍?duì)列節(jié)點(diǎn)狀態(tài)變量中的一個(gè)位記錄了該節(jié)點(diǎn)是否已經(jīng)(或正在)被轉(zhuǎn)移。“喚醒”和“取消”相關(guān)的代碼都會(huì)嘗試用compareAndSet
修改這個(gè)狀態(tài)。如果某次signal
操作修改失敗,就會(huì)轉(zhuǎn)移隊(duì)列中的下一個(gè)節(jié)點(diǎn)(如果存在的話)。如果某次“取消”操作修改失敗,就必須中止此次轉(zhuǎn)移,然后等待重新獲得鎖。后面的情況采用了一個(gè)潛在的無限的自旋等待。在節(jié)點(diǎn)成功的被插到鎖隊(duì)列之前,被“取消”的等待不能重新獲得鎖,所以必須自旋等待CLH隊(duì)列插入(即compareAndSet
操作)被“喚醒”線程成功執(zhí)行。這里極少需要自旋,且自旋里使用Thread.yield
來提示應(yīng)該調(diào)度某一其它線程,理想情況下就是執(zhí)行signal的那個(gè)線程。雖然有可能在這里為“取消”實(shí)現(xiàn)一個(gè)幫助策略以幫助插入節(jié)點(diǎn),但這種情況實(shí)在太少,找不到合適的理由來增加這些開銷。在其它所有的情況下,這個(gè)基本的機(jī)制都不需要自旋或yield
,因此在單處理器上保持著合理的性能。
4 用法
AQS類將上述的功能結(jié)合到一起,并且作為一種基于“模版方法模式”[6]的基類提供給同步器。子類只需定義狀態(tài)的檢查與更新相關(guān)的方法,這些方法控制著acquire和 release操作。然而,將AQS的子類作為同步器ADT并不適合,因?yàn)檫@個(gè)類必須提供方法在內(nèi)部控制acquire和release的規(guī)則,這些都不應(yīng)該被用戶所看到。所有java.util.concurrent包中的同步器類都聲明了一個(gè)私有的繼承了AbstractQueuedSynchronizer
的內(nèi)部類,并且把所有同步方法都委托給這個(gè)內(nèi)部類。這樣各個(gè)同步器類的公開方法就可以使用適合自己的名稱。
下面是一個(gè)最簡(jiǎn)單的Mutex
類的實(shí)現(xiàn),它使用同步狀態(tài)0表示解鎖,1表示鎖定。這個(gè)類并不需要同步方法中的參數(shù),因此這里在調(diào)用的時(shí)候使用0作為實(shí)參,方法實(shí)現(xiàn)里將其忽略。
class Mutex { class Sync extends AbstractQueuedSynchronizer { public boolean tryAcquire(int ignore) { return compareAndSetState(0, 1); } public boolean tryRelease(int ignore) { setState(0); return true; } } private final Sync sync = new Sync(); public void lock() { sync.acquire(0); } public void unlock() { sync.release(0); } }
這個(gè)例子的一個(gè)更完整的版本,以及其它用法指南,可以在J2SE的文檔中找到。還可以有一些變體。如,tryAcquire可以使用一種“test-and-test-and-set”策略,即在改變狀態(tài)值前先對(duì)狀態(tài)進(jìn)行校驗(yàn)。
令人詫異的是,像互斥鎖這樣性能敏感的東西也打算通過委托和虛方法結(jié)合的方式來定義。然而,這正是現(xiàn)代動(dòng)態(tài)編譯器一直在重點(diǎn)研究的面向?qū)ο笤O(shè)計(jì)結(jié)構(gòu)。編譯器擅長(zhǎng)將這方面的開銷優(yōu)化掉,起碼會(huì)優(yōu)化頻繁調(diào)用同步器的那些代碼。
AbstractQueuedSynchronizer
類也提供了一些方法用來協(xié)助策略控制。例如,基礎(chǔ)的acquire方法有可超時(shí)和可中斷的版本。雖然到目前為止,我們的討論都集中在像鎖這樣的獨(dú)占模式的同步器上,但AbstractQueuedSynchronizer
類也包含另一組方法(如acquireShared
),它們的不同點(diǎn)在于tryAcquireShared
和tryReleaseShared
方法能夠告知框架(通過它們的返回值)尚能接受更多的請(qǐng)求,最終框架會(huì)通過級(jí)聯(lián)的signal(cascading signals)喚醒多個(gè)線程。
雖然將同步器序列化(持久化存儲(chǔ)或傳輸)一般來說沒有太大意義,但這些類經(jīng)常會(huì)被用于構(gòu)造其它類,例如線程安全的集合,而這些集合通常是可序列化的。AbstractQueuedSynchronizer
和ConditionObject
類都提供了方法用于序列化同步狀態(tài),但不會(huì)序列化潛在的被阻塞的線程,也不會(huì)序列化其它內(nèi)部暫時(shí)性的簿記(bookkeeping)變量。即使如此,在反序列化時(shí),大部分同步器類也只僅將同步狀態(tài)重置為初始值,這與內(nèi)置鎖的隱式策略一致 —— 總是反序列化到一個(gè)解鎖狀態(tài)。這相當(dāng)于一個(gè)空操作,但仍必須顯式地支持以便final
字段能夠反序列化。
4.1 公平調(diào)度的控制
盡管同步器是基于FIFO隊(duì)列的,但它們并不一定就得是公平的??梢宰⒁獾剑诨A(chǔ)的acquire算法(3.3節(jié))中,tryAcquire
是在入隊(duì)前被執(zhí)行的。因此一個(gè)新的acquire線程能夠“竊取”本該屬于隊(duì)列頭部第一個(gè)線程通過同步器的機(jī)會(huì)。
可闖入的FIFO策略通常會(huì)提供比其它技術(shù)更高的總吞吐率。當(dāng)一個(gè)有競(jìng)爭(zhēng)的鎖已經(jīng)空閑,而下一個(gè)準(zhǔn)備獲取鎖的線程又正在解除阻塞的過程中,這時(shí)就沒有線程可以獲取到這個(gè)鎖,如果使用闖入策略,則可減少這之間的時(shí)間間隔。與此同時(shí),這種策略還可避免過分的,無效率的競(jìng)爭(zhēng),這種競(jìng)爭(zhēng)是由于只允許一個(gè)(第一個(gè))排隊(duì)的線程被喚醒然后嘗試acquire操作導(dǎo)致的。在只要求短時(shí)間持有同步器的場(chǎng)景中,創(chuàng)建同步器的開發(fā)者可以通過定義tryAcquire
在控制權(quán)返回之前重復(fù)調(diào)用自己若干次,來進(jìn)一步凸顯闖入的效果。
可闖入的FIFO同步器只有概率性的公平屬性。鎖隊(duì)列頭部一個(gè)解除了阻塞的線程擁有一次無偏向的機(jī)會(huì)(譯者注:即不會(huì)偏向隊(duì)頭的線程也不會(huì)偏向闖入的線程)來贏得與闖入的線程之間的競(jìng)爭(zhēng),如果競(jìng)爭(zhēng)失敗,要么重新阻塞要么進(jìn)行重試。然而,如果闖入的線程到達(dá)的速度比隊(duì)頭的線程解除阻塞快,那么在隊(duì)列中的第一個(gè)線程將很難贏得競(jìng)爭(zhēng),以至于幾乎總要重新阻塞,并且它的后繼節(jié)點(diǎn)也會(huì)一直保持阻塞。對(duì)于短暫持有的同步器來說,在隊(duì)列中第一個(gè)線程被解除阻塞期間,多處理器上很可能發(fā)生過多次闖入(譯者注:即闖入的線程的acquire
操作)和release
了。正如下文所提到的,最終結(jié)果就是保持一或多個(gè)線程的高進(jìn)展速度的同時(shí),仍至少在一定概率上避免了饑餓的發(fā)生。
當(dāng)有更高的公平性需求時(shí),實(shí)現(xiàn)起來也很簡(jiǎn)單。如果需要嚴(yán)格的公平性,程序員可以把tryAcquire方法定義為,若當(dāng)前線程不是隊(duì)列的頭節(jié)點(diǎn)(可通過getFirstQueuedThread
方法檢查,這是框架提供的為數(shù)不多的幾個(gè)檢測(cè)方法之一),則立即失敗(返回false)。
一個(gè)更快,但非嚴(yán)格公平的變體可以這樣做,若隊(duì)列為空(判斷的瞬間),仍然允許tryAcquire
執(zhí)行成功。在這種情況下,多個(gè)線程同時(shí)遇到一個(gè)空隊(duì)列時(shí)可能會(huì)去競(jìng)爭(zhēng)以使自己第一個(gè)獲得鎖,這樣,通常至少有一個(gè)線程是無需入隊(duì)列的。java.util.concurrent
包中所有支持公平模式的同步器都采用了這種策略。
盡管公平性設(shè)置在實(shí)踐中很有用,但是它們并沒有保障,因?yàn)镴ava Language Specification沒有提供這樣的調(diào)度保證。例如:即使是嚴(yán)格公平的同步器,如果一組線程永遠(yuǎn)不需要阻塞來達(dá)到互相等待,那么JVM可能會(huì)決定純粹以順序方式運(yùn)行它們。在實(shí)際中,單處理器上,在搶占式上下文切換之前,這樣的線程有可能是各自運(yùn)行了一段時(shí)間。如果這樣一個(gè)線程正持有某個(gè)互斥鎖,它將很快會(huì)被切換回來,僅是為了釋放其持有的鎖,然后會(huì)繼續(xù)阻塞,因?yàn)樗烙辛硗庖粋€(gè)線程需要這把鎖,這更增加了同步器可用但沒有線程能來獲取之間的間隔。同步器公平性設(shè)置在多處理器上的影響可能會(huì)更大,因?yàn)樵谶@種環(huán)境下會(huì)產(chǎn)生更多的交錯(cuò),因此一個(gè)線程就會(huì)有更多的機(jī)會(huì)發(fā)現(xiàn)鎖被另一個(gè)線程請(qǐng)求。
在高競(jìng)爭(zhēng)下,當(dāng)保護(hù)的是短暫持有鎖的代碼體時(shí),盡管性能可能會(huì)較差,但公平鎖仍然能有效地工作。例如,當(dāng)公平性鎖保護(hù)的是相對(duì)長(zhǎng)的代碼體和/或有著相對(duì)長(zhǎng)的鎖間(inter-lock)間隔,在這種情況下,闖入只能帶來很小的性能優(yōu)勢(shì),但卻可能會(huì)大大增加無限等待的風(fēng)險(xiǎn)。同步器框架將這些工程決策留給用戶來確定。
4.2 同步器
下面是java.util.concurrent
包中同步器定義方式的概述:
ReentrantLock
類使用AQS同步狀態(tài)來保存鎖(重復(fù))持有的次數(shù)。當(dāng)鎖被一個(gè)線程獲取時(shí),ReentrantLock
也會(huì)記錄下當(dāng)前獲得鎖的線程標(biāo)識(shí),以便檢查是否是重復(fù)獲取,以及當(dāng)錯(cuò)誤的線程(譯者注:如果線程不是鎖的持有者,在此線程中執(zhí)行該鎖的unlock
操作就是非法的)試圖進(jìn)行解鎖操作時(shí)檢測(cè)是否存在非法狀態(tài)異常。ReentrantLock
也使用了AQS提供的ConditionObject,還向外暴露了其它監(jiān)控和監(jiān)測(cè)相關(guān)的方法。ReentrantLock
通過在內(nèi)部聲明兩個(gè)不同的AbstractQueuedSynchronizer
實(shí)現(xiàn)類(提供公平模式的那個(gè)禁用了闖入策略)來實(shí)現(xiàn)可選的公平模式,在創(chuàng)建ReentrantLock實(shí)例的時(shí)候根據(jù)設(shè)置(譯者注:即ReentrantLock
構(gòu)造方法中的fair
參數(shù))使用相應(yīng)的AbstractQueuedSynchronizer
實(shí)現(xiàn)類。
ReentrantReadWriteLock
類使用AQS同步狀態(tài)中的16位來保存寫鎖持有的次數(shù),剩下的16位用來保存讀鎖的持有次數(shù)。WriteLock
的構(gòu)建方式同ReentrantLock
。ReadLock
則通過使用acquireShared
方法來支持同時(shí)允許多個(gè)讀線程。
Semaphore
類(計(jì)數(shù)信號(hào)量)使用AQS同步狀態(tài)來保存信號(hào)量的當(dāng)前計(jì)數(shù)。它里面定義的acquireShared方法會(huì)減少計(jì)數(shù),或當(dāng)計(jì)數(shù)為非正值時(shí)阻塞線程;tryRelease
方法會(huì)增加計(jì)數(shù),可能在計(jì)數(shù)為正值時(shí)還要解除線程的阻塞。
CountDownLatch
類使用AQS同步狀態(tài)來表示計(jì)數(shù)。當(dāng)該計(jì)數(shù)為0時(shí),所有的acquire操作(譯者注:acquire操作是從aqs的角度說的,對(duì)應(yīng)到CountDownLatch
中就是await
方法)才能通過。
FutureTask
類使用AQS同步狀態(tài)來表示某個(gè)異步計(jì)算任務(wù)的運(yùn)行狀態(tài)(初始化、運(yùn)行中、被取消和完成)。設(shè)置(譯者注:FutureTask
的set
方法)或取消(譯者注:FutureTask
的cancel
方法)一個(gè)FutureTask
時(shí)會(huì)調(diào)用AQS的release
操作,等待計(jì)算結(jié)果的線程的阻塞解除是通過AQS的acquire
操作實(shí)現(xiàn)的。
SynchronousQueues
類(一種CSP(Communicating Sequential Processes)形式的傳遞)使用了內(nèi)部的等待節(jié)點(diǎn),這些節(jié)點(diǎn)可以用于協(xié)調(diào)生產(chǎn)者和消費(fèi)者。同時(shí),它使用AQS同步狀態(tài)來控制當(dāng)某個(gè)消費(fèi)者消費(fèi)當(dāng)前一項(xiàng)時(shí),允許一個(gè)生產(chǎn)者繼續(xù)生產(chǎn),反之亦然。
java.util.concurrent
包的使用者當(dāng)然也可以為自定義的應(yīng)用定義自己的同步器。例如,那些曾考慮到過的,但沒有采納進(jìn)這個(gè)包的同步器包括提供WIN32事件各種風(fēng)格的語義類,二元信號(hào)量,集中管理的鎖以及基于樹的屏障。
5 性能
雖然AQS框架除了支持互斥鎖外,還支持其它形式的同步方式,但鎖的性能是最容易測(cè)量和比較的。即使如此,也還存在許多不同的測(cè)量方式。這里的實(shí)驗(yàn)主要是設(shè)計(jì)來展示鎖的開銷和吞吐量。
在每個(gè)測(cè)試中,所有線程都重復(fù)的更新一個(gè)偽隨機(jī)數(shù),該隨機(jī)數(shù)由nextRandom(int seed)
方法計(jì)算:
int t = (seed % 127773) * 16807 - (seed / 127773) * 2836; return (t > 0) ? t : t + 0x7fffffff;
在每次迭代中,線程以概率S在一個(gè)互斥鎖下更新共享的生成器,否則(譯者注:概率為1-S)更新其自己局部的生成器,此時(shí)是不需要鎖的。如此,鎖占用區(qū)域的耗時(shí)是短暫的,這就使線程持有鎖期間被搶占時(shí)的外界干擾降到了最小。這個(gè)函數(shù)的隨機(jī)性主要是為了兩個(gè)目的:確定是否需要使用鎖(這個(gè)生成器足以應(yīng)付這里的需求),以及使循環(huán)中的代碼不可能被輕易地優(yōu)化掉。
這里比較了四種鎖:內(nèi)置鎖,用的是synchronized
塊;互斥鎖,用的是像第四節(jié)例子中的那樣簡(jiǎn)單的Mutex類;可重入鎖,用的是ReentrantLock
;以及公平鎖,用的是ReentrantLock
的公平模式。所有測(cè)試都運(yùn)行在J2SE1.5 JDK build46(大致與beta2相同)的server模式下。在收集測(cè)試數(shù)據(jù)前,測(cè)試程序先運(yùn)行20次非競(jìng)爭(zhēng)的測(cè)試,以排除JVM“預(yù)熱”(譯者注:更多關(guān)于“預(yù)熱”的內(nèi)容,參見:Java 理論與實(shí)踐: 動(dòng)態(tài)編譯與性能測(cè)量)過程的影響。除了公平模式下的測(cè)試只跑了一百萬次迭代,其它每個(gè)線程中的測(cè)試都運(yùn)行了一千萬次迭代。
該測(cè)試運(yùn)行在四個(gè)X86機(jī)器和四個(gè)UltraSparc機(jī)器上。所有X86機(jī)器都運(yùn)行的是RedHat基于NPTL 2.4內(nèi)核和庫的Linux系統(tǒng)。所有的UltraSparc機(jī)器都運(yùn)行的是Solaris-9。測(cè)試時(shí)所有系統(tǒng)的負(fù)載都很輕。根據(jù)該測(cè)試的特征,并不要求系統(tǒng)完全空閑(譯者注:即測(cè)試時(shí)操作系統(tǒng)上有其它較輕的負(fù)載也不會(huì)影響本次測(cè)試的結(jié)果。)。“4P”這個(gè)名字反映出雙核超線程的Xeon更像是4路機(jī)器,而不是2路機(jī)器。這里沒有將測(cè)試數(shù)據(jù)規(guī)范化。如下所示,同步的相對(duì)開銷與處理器的數(shù)量、類型、速度之間不具備簡(jiǎn)單的關(guān)系。
表1 測(cè)試的平臺(tái)
名字 | 處理器數(shù)量 | 類型 | 速度(Mhz) |
---|---|---|---|
1P | 1 | Pentium3 | 900 |
2P | 2 | Pentium3 | 1400 |
2A | 2 | Athlon | 2000 |
4P | 2HT | Pentium4/Xeon | 2400 |
1U | 1 | UltraSparc2 | 650 |
4U | 4 | UltraSparc2 | 450 |
8U | 8 | UltraSparc3 | 750 |
24U | 24 | UltraSparc3 | 750 |
5.1 開銷
無競(jìng)爭(zhēng)情況下的開銷是通過僅運(yùn)行一個(gè)線程,將概率S為1時(shí)的每次迭代時(shí)間減去概率S為0(訪問共享內(nèi)存的概率為0)時(shí)的每次迭代時(shí)間得到的(譯者注:這里的“概率S”即前文提到的“概率S”,概率為0時(shí)是沒有鎖操作的,概率為1時(shí)是每次都有鎖操作,因此將概率為1時(shí)的耗時(shí)減去概率為0時(shí)的耗時(shí)就是整個(gè)鎖操作的開銷。)。表2以納秒為單位顯示了非競(jìng)爭(zhēng)場(chǎng)景下每次鎖操作的開銷。Mutex類最接近于框架的基本耗時(shí),可重入鎖的額外開銷是記錄當(dāng)前所有者線程和錯(cuò)誤檢查的耗時(shí),對(duì)于公平鎖來說還包含開始時(shí)檢查隊(duì)列是否為空的耗時(shí)。
表格2也展示與內(nèi)置鎖的“快速路徑(fast path)”對(duì)比,tryAcquire
的耗時(shí)。這里的差異主要反映出了各鎖和機(jī)器中使用的不同的原子指令以及內(nèi)存屏障的耗時(shí)。在多處理器上,這些指令常常是完全優(yōu)于所有其它指令的。內(nèi)置鎖和同步器類之間的主要差別,顯然是由于Hotspot鎖在鎖定和解鎖時(shí)都使用了一次compareAndSet
,而同步器的acquire
操作使用了一次compareAndSet
,但release
操作用的是一次volatile
寫(即,多處理器上的一次內(nèi)存屏障以及所有處理器上的重排序限制)。每個(gè)鎖的絕對(duì)的和相對(duì)耗時(shí)因機(jī)器的不同而不同。
表2 無競(jìng)爭(zhēng)時(shí)的單鎖開銷(單位:納秒)
機(jī)器 | 內(nèi)置 | 互斥 | 可重入 | 公平可重入 |
---|---|---|---|---|
1P | 18 | 9 | 31 | 37 |
2P | 58 | 71 | 77 | 81 |
2A | 13 | 21 | 31 | 30 |
4P | 116 | 95 | 109 | 117 |
1U | 90 | 40 | 58 | 67 |
4U | 122 | 82 | 100 | 115 |
8U | 160 | 83 | 103 | 123 |
24U | 161 | 84 | 108 | 119 |
從另一個(gè)極端看,表3展示了概率S為1,運(yùn)行256個(gè)并發(fā)線程時(shí)產(chǎn)生了大規(guī)模的鎖競(jìng)爭(zhēng)下每個(gè)鎖的開銷。在完全飽和的情況下,可闖入的FIFO鎖比內(nèi)置鎖的開銷少了一個(gè)數(shù)量級(jí)(也就是更大的吞吐量),比公平鎖更是少了兩個(gè)數(shù)量級(jí)。這表現(xiàn)出即使有著極大的競(jìng)爭(zhēng),在維持線程進(jìn)展方面可闖入FIFO策略的效率。
表3也說明了即使在內(nèi)部開銷比較低的情況下,公平鎖的性能也完全是由上下文切換的時(shí)間所決定的。列出的時(shí)間大致上都與各平臺(tái)上線程阻塞和解除線程阻塞的時(shí)間相稱。
此外,后面增加的一個(gè)實(shí)驗(yàn)(僅使用機(jī)器4P)表明,對(duì)于這里用到的短暫持有的鎖,公平參數(shù)的設(shè)置在總差異中的影響很小。這里將線程終止時(shí)間間的差異記錄成一個(gè)粗粒度的離散量數(shù)。在4P的機(jī)器上,公平鎖的時(shí)間度量的標(biāo)準(zhǔn)差平均為0.7%,可重入鎖平均為6.0%。作為對(duì)比,為模擬一個(gè)長(zhǎng)時(shí)間持有鎖的場(chǎng)景,測(cè)試中使每個(gè)線程在持有鎖的情況下計(jì)算了16K次隨機(jī)數(shù)。這時(shí),總運(yùn)行時(shí)間幾乎是相同的(公平鎖:9.79s,可重入鎖:9.72s)。公平模式下的差異依然很小,標(biāo)準(zhǔn)差平均為0.1%,而可重入鎖上升到了平均29.5%。
表格3 飽和時(shí)的單鎖開銷(單位:納秒)
機(jī)器 | 內(nèi)置 | 互斥 | 可重入 | 公平可重入 |
---|---|---|---|---|
1P | 521 | 46 | 67 | 8327 |
2P | 930 | 108 | 132 | 14967 |
2A | 748 | 79 | 84 | 33910 |
4P | 1146 | 188 | 247 | 15328 |
1U | 879 | 153 | 177 | 41394 |
4U | 2590 | 347 | 368 | 30004 |
8U | 1274 | 157 | 174 | 31084 |
24U | 1983 | 160 | 182 | 32291 |
5.2 吞吐量
大部分同步器都是用于無競(jìng)爭(zhēng)和極大競(jìng)爭(zhēng)之間的。這可以用實(shí)驗(yàn)在兩個(gè)方面進(jìn)行檢查,通過修改固定個(gè)線程的競(jìng)爭(zhēng)概率,和/或通過往擁有固定競(jìng)爭(zhēng)概率的線程集合里增加更多的線程。為了說明這些影響,測(cè)試運(yùn)行在不同的競(jìng)爭(zhēng)概率和不同的線程數(shù)目下,都用的是可重入鎖。附圖使用了一個(gè)slowdown度量標(biāo)準(zhǔn)。
這里,t是總運(yùn)行時(shí)間,b是一個(gè)線程在沒有競(jìng)爭(zhēng)或同步下的基線時(shí)間,n是線程數(shù),p是處理器數(shù),S是共享訪問的比例(譯者注:即前面的競(jìng)爭(zhēng)概率S)。計(jì)算結(jié)果是實(shí)際執(zhí)行時(shí)間與理想執(zhí)行時(shí)間(通常是無法得到的)的比率,理想執(zhí)行時(shí)間是通過使用Amdahl’s法則計(jì)算出來的。理想時(shí)間模擬了一次沒有同步開銷,沒有因鎖爭(zhēng)用而導(dǎo)致線程阻塞的執(zhí)行過程。即使這樣,在很低的競(jìng)爭(zhēng)下,相比理想時(shí)間,有一些測(cè)試結(jié)果卻表現(xiàn)出了很小的速度增長(zhǎng),大概是由于基線和測(cè)試之間的優(yōu)化、流水線等方面有著輕微的差別。
圖中用以2為底的對(duì)數(shù)為比例進(jìn)行了縮放。例如,值為1表示實(shí)際時(shí)間是理想時(shí)間的兩倍,4表示慢16倍。使用對(duì)數(shù)就不需要依賴一個(gè)隨意的基線時(shí)間(這里指的是計(jì)算隨機(jī)數(shù)的時(shí)間),因此,基于不同底數(shù)計(jì)算的結(jié)果表現(xiàn)出的趨勢(shì)應(yīng)該是類似的。這些測(cè)試使用的競(jìng)爭(zhēng)概率從1/128(標(biāo)識(shí)為“0.008”)到1,以2的冪為步長(zhǎng),線程的數(shù)量從1到1024,以2的冪的一半為步長(zhǎng)。
在單處理器(1P和1U)上,性能隨著競(jìng)爭(zhēng)的上升而下降,但不會(huì)隨著線程數(shù)的增加而下降。多處理器在遭遇競(jìng)爭(zhēng)時(shí),性能下降的更快。根據(jù)多處理器相關(guān)的圖表顯示,開始出現(xiàn)的峰值處雖然只有幾個(gè)線程的競(jìng)爭(zhēng),但相對(duì)性能通常卻最差。這反映出了一個(gè)性能的過渡區(qū)域,在這里闖入的線程和被喚醒的線程都準(zhǔn)備獲取鎖,這會(huì)讓它們頻繁的迫使對(duì)方阻塞。在大部分時(shí)候,過渡區(qū)域后面會(huì)緊接著一個(gè)平滑區(qū)域,因?yàn)榇藭r(shí)幾乎沒有空閑的鎖,所以會(huì)與單處理器上順序執(zhí)行的模式差不多;在多處理器機(jī)器上會(huì)較早進(jìn)入平滑區(qū)域。例如,請(qǐng)注意,在滿競(jìng)爭(zhēng)(標(biāo)識(shí)為“1.000”)下這些值表示,在處理器越少的機(jī)器上,會(huì)有更糟糕的相對(duì)速度下降。
根據(jù)這些結(jié)果,可以針對(duì)阻塞(park/unpark)做進(jìn)一步調(diào)優(yōu)以減少上下文切換和相關(guān)的開銷,這會(huì)給本框架帶來小但顯著的提升。此外,在多處理器上為短時(shí)間持有的但高競(jìng)爭(zhēng)的鎖采用某種形式的適應(yīng)性自旋,可以避免這里看到的一些波動(dòng),這對(duì)同步器類大有裨益。雖然在跨不同上下文時(shí)適應(yīng)性自旋很難很好的工作,但可以使用本框架為遇到這類使用配置的特定應(yīng)用構(gòu)建一個(gè)自定義形式的鎖。
6 總結(jié)
本文撰寫之時(shí),java.util.concurrent
包中的同步器框架還太新所以還不能在實(shí)踐中使用。因此在J2SE 1.5最終版本發(fā)布之前都很難看到其大范圍的使用,并且,它的設(shè)計(jì),API實(shí)現(xiàn)以及性能肯定還有無法預(yù)料的后果。但是,此時(shí),這個(gè)框架明顯能勝任其基本的目標(biāo),即為創(chuàng)建新的同步器提供一個(gè)高效的基礎(chǔ)。
7 致謝
Thanks to Dave Dice for countless ideas and advice during the development of this framework, to Mark Moir and Michael Scott for urging consideration of CLH queues, to David Holmes for critiquing early versions of the code and API, to Victor Luchangco and Bill Scherer for reviewing previous incarnations of the source code, and to the other members of the JSR166 Expert Group (Joe Bowbeer, Josh Bloch, Brian Goetz, David Holmes, and Tim Peierls) as well as Bill Pugh, for helping with design and specifications and commenting on drafts of this paper. Portions of this work were made possible by a DARPA PCES grant, NSF grant EIA-0080206 (for access to the 24way Sparc) and a Sun Collaborative Research Grant.
參考文獻(xiàn)
- [1] Agesen, O., D. Detlefs, A. Garthwaite, R. Knippel, Y. S.Ramakrishna, and D. White. An Efficient Meta-lock for Implementing Ubiquitous Synchronization. ACM OOPSLA Proceedings, 1999.
- [2] Andrews, G. Concurrent Programming. Wiley, 1991.
- [3] Bacon, D. Thin Locks: Featherweight Synchronization for Java. ACM PLDI Proceedings, 1998.
- [4] Buhr, P. M. Fortier, and M. Coffin. Monitor Classification,ACM Computing Surveys, March 1995.
- [5] Craig, T. S. Building FIFO and priority-queueing spin locks from atomic swap. Technical Report TR 93-02-02,Department of Computer Science, University of Washington, Feb. 1993.
- [6] Gamma, E., R. Helm, R. Johnson, and J. Vlissides. Design Patterns, Addison Wesley, 1996.
- [7] Holmes, D. Synchronisation Rings, PhD Thesis, Macquarie University, 1999.
- [8] Magnussen, P., A. Landin, and E. Hagersten. Queue locks on cache coherent multiprocessors. 8th Intl. Parallel Processing Symposium, Cancun, Mexico, Apr. 1994.
- [9] Mellor-Crummey, J.M., and M. L. Scott. Algorithms for Scalable Synchronization on Shared-Memory Multiprocessors. ACM Trans. on Computer Systems,February 1991
- [10] M. L. Scott and W N. Scherer III. Scalable Queue-Based Spin Locks with Timeout. 8th ACM Symp. on Principles and Practice of Parallel Programming, Snowbird, UT, June 2001.
- [11] Sun Microsystems. Multithreading in the Solaris Operating Environment. White paper available at http://wwws.sun.com/software/solaris/whitepapers.html 2002.
- [12] Zhang, H., S. Liang, and L. Bak. Monitor Conversion in a Multithreaded Computer System. United States Patent 6,691,304. 2004.
原文《The java.util.concurrent Synchronizer Framework》
作者:Doug Lea
以上就是java并發(fā)包JUC同步器框架AQS框架原文翻譯的詳細(xì)內(nèi)容,更多關(guān)于AQS框架原文翻譯的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
詳解SpringMVC的類型轉(zhuǎn)換及驗(yàn)證方法
在本篇文章里面我們給大家詳細(xì)分析了SpringMVC的類型轉(zhuǎn)換及驗(yàn)證方法的相關(guān)知識(shí),對(duì)此有需要的朋友們學(xué)習(xí)下吧。2018-10-10SpringBoot解析指定Yaml配置文件的實(shí)現(xiàn)過程
這篇文章主要介紹了SpringBoot解析指定Yaml配置文件,本文給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-03-03如何自定義Jackson序列化?@JsonSerialize
這篇文章主要介紹了如何自定義Jackson序列化?@JsonSerialize,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-12-12Java實(shí)現(xiàn)郵箱發(fā)送功能實(shí)例(阿里云郵箱推送)
這篇文章主要給大家介紹了關(guān)于Java實(shí)現(xiàn)郵箱發(fā)送功能的相關(guān)資料,利用阿里云郵箱推送,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09詳解spring cloud config實(shí)現(xiàn)datasource的熱部署
這篇文章主要介紹了詳解spring cloud config實(shí)現(xiàn)datasource的熱部署,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2018-01-01java代碼實(shí)現(xiàn)銀行管理系統(tǒng)
這篇文章主要為大家詳細(xì)介紹了java代碼實(shí)現(xiàn)銀行管理系統(tǒng),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-12-12