Java源碼解析CopyOnWriteArrayList的講解
本文基于jdk1.8進行分析。
ArrayList和HashMap是我們經(jīng)常使用的集合,它們不是線程安全的。我們一般都知道HashMap的線程安全版本為ConcurrentHashMap,那么ArrayList有沒有類似的線程安全的版本呢?還真有,它就是CopyOnWriteArrayList。
CopyOnWrite這個短語,還有一個專門的稱謂COW. COW不僅僅是java實現(xiàn)集合框架時專用的機制,它在計算機中被廣泛使用。
首先看一下什么是CopyOnWriteArrayList,它的類前面的javadoc注釋很長,我們只截取最前面的一小段。如下。它的介紹中說到,CopyOnWriteArrayList是ArrayList的一個線程安全的變種,在CopyOnWriteArrayList中,所有改變操作(add,set等)都是通過給array做一個新的拷貝來實現(xiàn)的。通常來看,這花費的代價太大了,但是,當讀取list的線程數(shù)量遠遠多于寫list的線程數(shù)量時,這種方法依然比別的實現(xiàn)方式更高效。
/**
* A thread-safe variant of {@link java.util.ArrayList} in which all mutative
* operations ({@code add}, {@code set}, and so on) are implemented by
* making a fresh copy of the underlying array.
* <p>This is ordinarily too costly, but may be <em>more</em> efficient
* than alternatives when traversal operations vastly outnumber
* mutations, and is useful when you cannot or don't want to
* synchronize traversals, yet need to preclude interference among
* concurrent threads. The "snapshot" style iterator method uses a
* reference to the state of the array at the point that the iterator
* was created. This array never changes during the lifetime of the
* iterator, so interference is impossible and the iterator is
* guaranteed not to throw {@code ConcurrentModificationException}.
* The iterator will not reflect additions, removals, or changes to
* the list since the iterator was created. Element-changing
* operations on iterators themselves ({@code remove}, {@code set}, and
* {@code add}) are not supported. These methods throw
* {@code UnsupportedOperationException}.
**/
下面看一下成員變量。只有2個,一個是基本數(shù)據(jù)結(jié)構(gòu)array,用于保存數(shù)據(jù),一個是可重入鎖,它用于寫操作的同步。
/** The lock protecting all mutators **/ final transient ReentrantLock lock = new ReentrantLock(); /** The array, accessed only via getArray/setArray. **/ private transient volatile Object[] array;
下面看一下主要方法。get方法如下。get方法沒有什么特殊之處,不加鎖,直接讀取即可。
/**
* {@inheritDoc}
* @throws IndexOutOfBoundsException {@inheritDoc}
**/
public E get(int index) {
return get(getArray(), index);
}
/**
* Gets the array. Non-private so as to also be accessible
* from CopyOnWriteArraySet class.
**/
final Object[] getArray() {
return array;
}
@SuppressWarnings("unchecked")
private E get(Object[] a, int index) {
return (E) a[index];
}
下面看一下add。add方法先加鎖,然后,把原array拷貝到一個新的數(shù)組中,并把待添加的元素加入到新數(shù)組,最后,再把新數(shù)組賦值給原數(shù)組。這里可以看到,add操作并不是直接在原數(shù)組上操作,而是把整個數(shù)據(jù)進行了拷貝,才操作的,最后把新數(shù)組賦值回去。
/**
* Appends the specified element to the end of this list.
* @param e element to be appended to this list
* @return {@code true} (as specified by {@link Collection#add})
**/
public boolean add(E e) {
final ReentrantLock lock = this.lock;
lock.lock();
try {
Object[] elements = getArray();
int len = elements.length;
Object[] newElements = Arrays.copyOf(elements, len + 1);
newElements[len] = e;
setArray(newElements);
return true;
} finally {
lock.unlock();
}
}
/**
* Sets the array.
**/
final void setArray(Object[] a) {
array = a;
}
這里,思考一個問題。線程1正在遍歷list,此時,線程2對線程進行了寫入,那么,線程1可以遍歷到線程2寫入的數(shù)據(jù)嗎?
首先明確一點,這個場景不會拋出任何異常,程序會安靜的執(zhí)行完成。是否能到讀到線程2寫入的數(shù)據(jù),取決于遍歷方式和線程2的寫入時機及位置。
首先看遍歷方式,我們2中方式遍歷list,foreach和get(i)的方式。foreach的底層實現(xiàn)是迭代器,所以迭代器就不單獨作為一種遍歷方式了。首先看一下通過for循環(huán)get(i)的方式。這種遍歷方式下,能否讀取到線程2寫入的數(shù)據(jù),取決了線程2的寫入時機和位置。如果線程1已經(jīng)遍歷到第5個元素了,那么如果線程2在第5個后面進行寫入,那么線程1就可以讀取到線程2的寫入。
public class MyClass {
static List<String> list = new CopyOnWriteArrayList<>();
public static void main(String[] args){
list.add("a");
list.add("b");
list.add("c");
list.add("d");
list.add("e");
list.add("f");
list.add("g");
list.add("h");
//啟動線程1,遍歷數(shù)據(jù)
new Thread(()->{
try{
for(int i = 0; i < list.size();i ++){
System.out.println(list.get(i));
Thread.sleep(1000);
}
}catch (Exception e){
e.printStackTrace();
}
}).start();
try{
//主線程作為線程2,等待2s
Thread.sleep(2000);
}catch (Exception e){
e.printStackTrace();
}
//主線程作為線程2,在位置4寫入數(shù)據(jù),即,在遍歷位置之后寫入數(shù)據(jù)
list.add(4,"n");
}
}
上述程序的運行結(jié)果如下,是可以遍歷到n的。
a
b
c
d
n
e
f
g
h
如果線程2在第5個位置前面寫入,那么線程1就讀取不到線程2的寫入。同時,還會帶來一個副作用,就是某個元素會被讀取2次。代碼如下:
public class MyClass {
static List<String> list = new CopyOnWriteArrayList<>();
public static void main(String[] args){
list.add("a");
list.add("b");
list.add("c");
list.add("d");
list.add("e");
list.add("f");
list.add("g");
list.add("h");
//啟動線程1,遍歷數(shù)據(jù)
new Thread(()->{
try{
for(int i = 0; i < list.size();i ++){
System.out.println(list.get(i));
Thread.sleep(1000);
}
}catch (Exception e){
e.printStackTrace();
}
}).start();
try{
//主線程作為線程2,等待2s
Thread.sleep(2000);
}catch (Exception e){
e.printStackTrace();
}
//主線程作為線程2,在位置1寫入數(shù)據(jù),即,在遍歷位置之后寫入數(shù)據(jù)
list.add(1,"n");
}
}
上述代碼的運行結(jié)果如下,其中,b被遍歷了2次。
a
b
b
c
d
e
f
g
h
那么,采用foreach方式遍歷呢?答案是無論線程2寫入時機如何,線程2都無法讀取到線程2的寫入。原因在于CopyOnWriteArrayList在創(chuàng)建迭代器時,取了當前時刻數(shù)組的快照。并且,add操作只會影響原數(shù)組,影響不到迭代器中的快照。
public Iterator<E> iterator() {
return new COWIterator<E>(getArray(), 0);
}
private COWIterator(Object[] elements, int initialCursor) {
cursor = initialCursor;
snapshot = elements;
}
了解清楚了遍歷方式和寫入時機對是否能夠讀取到寫入的影響,我們在使用CopyOnWriteArrayList時就可以根據(jù)實際業(yè)務(wù)場景的需求,選擇合適的實現(xiàn)方式了。
總結(jié)
以上就是這篇文章的全部內(nèi)容了,希望本文的內(nèi)容對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,謝謝大家對腳本之家的支持。如果你想了解更多相關(guān)內(nèi)容請查看下面相關(guān)鏈接
相關(guān)文章
Java實現(xiàn)解析dcm醫(yī)學(xué)影像文件并提取文件信息的方法示例
這篇文章主要介紹了Java實現(xiàn)解析dcm醫(yī)學(xué)影像文件并提取文件信息的方法,結(jié)合實例形式分析了java基于第三方庫文件針對dcm醫(yī)學(xué)影像文件的解析操作相關(guān)實現(xiàn)技巧,需要的朋友可以參考下2018-04-04
SpringBoot2+Netty+WebSocket(netty實現(xiàn)websocket支持URL參數(shù))問題記錄
Netty?是一個利用?Java?的高級網(wǎng)絡(luò)的能力,隱藏其背后的復(fù)雜性而提供一個易于使用的?API?的客戶端/服務(wù)器框架,這篇文章主要介紹了SpringBoot2+Netty+WebSocket(netty實現(xiàn)websocket,支持URL參數(shù)),需要的朋友可以參考下2023-12-12

