解決JDK8的ParallelStream遍歷無序的問題

更新時間：2021年07月28日 10:44:22 作者：hzoboy

這篇文章主要介紹了解決JDK8的ParallelStream遍歷無序的問題，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教

JDK8的ParallelStream遍歷無序

ParallelStream其實就是一個并行執(zhí)行的流

它通過默認(rèn)的ForkJoinPool，可能提高你的多線程任務(wù)的速度.

Stream具有平行處理能力，處理的過程會分而治之，也就是將一個大任務(wù)切分成多個小任務(wù)，這表示每個任務(wù)都是一個操作，因此像以下的程式片段：

List    
       list = Arrays.asList(1, 2, 3, 4, 5);
list.parallelStream().forEach(out::println);

你得到的展示順序不一定會是1、2、3、4、5，而可能是任意的順序，就forEach()這個操作來講，如果平行處理時，希望最后順序是按照原來Stream的數(shù)據(jù)順序，那可以調(diào)用forEachOrdered()。

List    
       list = Arrays.asList(1, 2, 3, 4, 5);
list.parallelStream().forEachOrdered(out::println);

parallelStream進(jìn)行遍歷的坑,以及如何進(jìn)行避免異步操作中出現(xiàn)的問題

Java8 已經(jīng)很久了，現(xiàn)在都已經(jīng)Java12版本了.

我所在的上家公司，在寫代碼時候推薦使用lambad來進(jìn)行操作遍歷集合

也就是像下面一樣

List<Integer> list = new ArrayList<>();
for (int j = 0; j < 1000; j++) {
list.add(j);
}
list.stream().forEach(value -> {
System.out.println(value);
});

這種效率其實和傳統(tǒng)上的使用foreach以及for循環(huán)遍歷效果差不多，因為點開forEach方法會發(fā)現(xiàn)內(nèi)部其實使用的是下面的方法進(jìn)行對集合遍歷的

內(nèi)部其實使用的還是for進(jìn)行遍歷，所以兩者相比較其實沒有什么效率的差異的，當(dāng)然這也會由于每個公司編程習(xí)慣不一樣，有的人更喜歡傳統(tǒng)上的for進(jìn)行遍歷

因為上面的遍歷方式不會對效率有什么提升, 所以由此還有一種方式就是

parallelStream()

List<Integer> list = new ArrayList<>();
for (int j = 0; j < 1000; j++) {
list.add(j);
}
list.parallelStream().forEach(value -> {
System.out.println(value);
});

上面的方法其實就是異步的，

這種遍歷方式因為是異步遍歷，會產(chǎn)生一種情況，就是遍歷的順序是無序的，當(dāng)然也有相應(yīng)的好處就是，遍歷速度會快，當(dāng)對生成結(jié)果不考慮排序問題而且數(shù)據(jù)量比較大的時候可以使用.

但是，有利自然有弊，因為異步的所以需要考慮線程的問題，就是生成的結(jié)果真的是你想要的么?

以下面的例子來運(yùn)行一段代碼：

public static void main(String[] args) {
List<Integer> list = new ArrayList<>();
for (int j = 0; j < 1000; j++) {
list.add(j);
}
System.out.println("最開始生成的集合長度:"+list.size());
//parallelStream遍歷數(shù)據(jù)的時候會產(chǎn)生丟失的問題
for (int i = 0; i < 10 ; i++) {
  
List<Integer> parseList = new ArrayList<>();
list.parallelStream().forEach(integer -> {
parseList.add(integer);
});
System.out.println("每次遍歷的集合長度:"+ parseList.size());
}
}

我首先創(chuàng)建了一個1000長度的集合，之后對這個集合使用多次遍歷，然而呢，會發(fā)現(xiàn)，最后遍歷的集合少數(shù)據(jù)，并且會在多次重復(fù)遍歷的時候數(shù)組越界..

因為這種情況，之前工作使用parallelStream出現(xiàn)過2次問題，我一直以為是使用parallelStream本身不夠很安全導(dǎo)致的.實際上今天整理這篇博文突然才發(fā)現(xiàn)這個問題，就是遍歷的結(jié)果轉(zhuǎn)為的list是線程安全的么?

其實當(dāng)正常進(jìn)行遍歷的時候，可以對遍歷出的結(jié)果核對，實際上每次遍歷出的結(jié)果，仍然是與原來生成的結(jié)果一致的.

所以這邊只能將鍋甩在接收這些數(shù)據(jù)的list上面了

這個時候就需要對list進(jìn)行包裝

List<Integer> synchronizedList = Collections.synchronizedList(parseList);

這會在看下修改后的代碼以及結(jié)果

public static void main(String[] args) {
List<Integer> list = new ArrayList<>();
for (int j = 0; j < 1000; j++) {
list.add(j);
}
System.out.println("最開始生成的集合長度:"+list.size());
//parallelStream遍歷數(shù)據(jù)的時候會產(chǎn)生丟失的問題
for (int i = 0; i < 10 ; i++) {
  
List<Integer> parseList = new ArrayList<>();
List<Integer> synchronizedList = Collections.synchronizedList(parseList);
list.parallelStream().forEach(integer -> {
synchronizedList.add(integer);
});
System.out.println("每次遍歷的集合長度:"+ synchronizedList.size());
}
}