java理論基礎(chǔ)Stream管道流狀態(tài)與并行操作
一、回顧Stream管道流操作
通過前面章節(jié)的學習,我們應(yīng)該明白了Stream管道流的基本操作。我們來回顧一下:
- 源操作:可以將數(shù)組、集合類、行文本文件轉(zhuǎn)換成管道流Stream進行數(shù)據(jù)處理
- 中間操作:對Stream流中的數(shù)據(jù)進行處理,比如:過濾、數(shù)據(jù)轉(zhuǎn)換等等
- 終端操作:作用就是將Stream管道流轉(zhuǎn)換為其他的數(shù)據(jù)類型。這部分我們還沒有講,我們后面章節(jié)再介紹。
看下面的腦圖,可以有更清晰的理解:
二、中間操作:有狀態(tài)與無狀態(tài)
其實在程序員編程中,經(jīng)常會接觸到“有狀態(tài)”,“無狀態(tài)”,絕大部分的人都比較蒙。而且在不同的場景下,“狀態(tài)”這個詞的含義似乎有所不同。但是“萬變不離其宗”,理解“狀態(tài)”這個詞在編程領(lǐng)域的含義,筆者教給大家?guī)讉€關(guān)鍵點:
- 狀態(tài)通常代表公用數(shù)據(jù),有狀態(tài)就是有“公用數(shù)據(jù)”
- 因為有公用的數(shù)據(jù),狀態(tài)通常需要額外的存儲。
- 狀態(tài)通常被多人、多用戶、多線程、多次操作,這就涉及到狀態(tài)的管理及變更操作。
是不是更蒙了?舉個例子,你就明白了
web開發(fā)session就是一種狀態(tài),訪問者的多次請求關(guān)聯(lián)同一個session,這個session需要存儲到內(nèi)存或者redis。多次請求使用同一個公用的session,這個session就是狀態(tài)數(shù)據(jù)。
vue的vuex的store就是一種狀態(tài),首先它是多組件公用的,其次是不同的組件都可以修改它,最后它需要獨立于組件單獨存儲。所以store就是一種狀態(tài)。
回到我們的Stream管道流
filter與map操作,不需要管道流的前面后面元素相關(guān),所以不需要額外的記錄元素之間的關(guān)系。輸入一個元素,獲得一個結(jié)果。
sorted是排序操作、distinct是去重操作。像這種操作都是和別的元素相關(guān)的操作,我自己無法完成整體操作。就像班級點名就是無狀態(tài)的,喊到你你就答到就可以了。如果是班級同學按大小個排序,那就不是你自己的事了,你得和周圍的同學比一下身高并記住,你記住的這個身高比較結(jié)果就是一種“狀態(tài)”。所以這種操作就是有狀態(tài)操作。
三、Limit與Skip管道數(shù)據(jù)截取
List<String> limitN = Stream.of("Monkey", "Lion", "Giraffe", "Lemur") .limit(2) .collect(Collectors.toList()); List<String> skipN = Stream.of("Monkey", "Lion", "Giraffe", "Lemur") .skip(2) .collect(Collectors.toList());
limt方法傳入一個整數(shù)n,用于截取管道中的前n個元素。經(jīng)過管道處理之后的數(shù)據(jù)是:[Monkey, Lion]。skip方法與limit方法的使用相反,用于跳過前n個元素,截取從n到末尾的元素。經(jīng)過管道處理之后的數(shù)據(jù)是: [Giraffe, Lemur]
四、Distinct元素去重
我們還可以使用distinct方法對管道中的元素去重,涉及到去重就一定涉及到元素之間的比較,distinct方法時調(diào)用Object的equals方法進行對象的比較的,如果你有自己的比較規(guī)則,可以重寫equals方法。
List<String> uniqueAnimals = Stream.of("Monkey", "Lion", "Giraffe", "Lemur", "Lion") .distinct() .collect(Collectors.toList());
上面代碼去重之后的結(jié)果是: ["Monkey", "Lion", "Giraffe", "Lemur"]
五、Sorted排序
默認的情況下,sorted是按照字母的自然順序進行排序。如下代碼的排序結(jié)果是:[Giraffe, Lemur, Lion, Monkey],字數(shù)按順序G在L前面,L在M前面。第一位無法區(qū)分順序,就比較第二位字母。
List<String> alphabeticOrder = Stream.of("Monkey", "Lion", "Giraffe", "Lemur") .sorted() .collect(Collectors.toList());
排序我們后面還會給大家詳細的講一講,所以這里暫時只做一個了解。
六、串行、并行與順序
通常情況下,有狀態(tài)和無狀態(tài)操作不需要我們?nèi)リP(guān)心。除非?:你使用了并行操作。
還是用班級按身高排隊為例:班級有一個人負責排序,這個排序結(jié)果最后就會是正確的。那如果有2個、3個人負責按大小個排隊呢?最后可能就亂套了。一個人只能保證自己排序的人的順序,他無法保證其他人的排隊順序。
- 串行的好處是可以保證順序,但是通常情況下處理速度慢一些
- 并行的好處是對于元素的處理速度快一些(通常情況下),但是順序無法保證。這可能會導致進行一些有狀態(tài)操作的時候,最后得到的不是你想要的結(jié)果。
Stream.of("Monkey", "Lion", "Giraffe", "Lemur", "Lion") .parallel() .forEach(System.out::println);
parallel()函數(shù)表示對管道中的元素進行并行處理,而不是串行處理。但是這樣就有可能導致管道流中后面的元素先處理,前面的元素后處理,也就是元素的順序無法保證。
如果數(shù)據(jù)量比較小的情況下,不太能觀察到,數(shù)據(jù)量大的話,就能觀察到數(shù)據(jù)順序是無法保證的。
Monkey
Lion
Lemur
Giraffe
Lion
通常情況下,parallel()能夠很好的利用CPU的多核處理器,達到更好的執(zhí)行效率和性能,建議使用。但是有些特殊的情況下,parallel并不適合:深入了解請看這篇文章: https://blog.oio.de/2016/01/22/parallel-stream-processing-in-java-8-performance-of-sequential-vs-parallel-stream-processing/
該文章中幾個觀點,說明并行操作的適用場景:
數(shù)據(jù)源易拆分:從處理性能的角度,parallel()更適合處理ArrayList,而不是LinkedList。因為ArrayList從數(shù)據(jù)結(jié)構(gòu)上講是基于數(shù)組的,可以根據(jù)索引很容易的拆分為多個。
適用于無狀態(tài)操作:每個元素的計算都不得依賴或影響任何其他元素的計算,的運算場景?;A(chǔ)數(shù)據(jù)源無變化:從文本文件里面邊讀邊處理的場景,不適合parallel()并行處理。parallel()一開始就容量固定的集合,這樣能夠平均的拆分、同步處理。
以上就是java理論基礎(chǔ)Stream管道流狀態(tài)與并行操作的詳細內(nèi)容,更多關(guān)于java Stream管道流狀態(tài)與并行操作的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
mybatis if test 不為空字符串或null的解決
這篇文章主要介紹了mybatis if test 不為空字符串或null的解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-11-11java數(shù)據(jù)結(jié)構(gòu)實現(xiàn)機器人行走
這篇文章主要為大家詳細介紹了java數(shù)據(jù)結(jié)構(gòu)實現(xiàn)機器人行走,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-01-01MyBatis-Plus標簽@TableField之fill自動填充方式
這篇文章主要介紹了MyBatis-Plus標簽@TableField之fill自動填充方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-06-06MyBatis注解開發(fā)-@Insert和@InsertProvider的使用
這篇文章主要介紹了MyBatis注解開發(fā)-@Insert和@InsertProvider的使用,具有很好的參考價值,希望對大家有所幫助。2022-07-07