用Java8 stream處理數(shù)據(jù)
1、stream處理數(shù)據(jù)介紹
如果沒(méi)有集合Collection你如何處理數(shù)據(jù)?幾乎所有的Java應(yīng)用程序都要使用Collection處理數(shù)據(jù)。他們是十分重要的編程工作:例如,您可能想要?jiǎng)?chuàng)建銀行交易的集合Collection,這個(gè)集合代表客戶的狀態(tài)。然后,你可能要處理整個(gè)集合來(lái)找出的顧客花了多少錢(qián)。盡管集合如此重要,但是在Java中處理集合的技術(shù)還遠(yuǎn)遠(yuǎn)不夠完善。
首先,對(duì)集合的典型處理模式是類(lèi)似SQL操作,比如"finding"(例如,找到具有最高價(jià)的交易)或"grouping" (例如,將相關(guān)的雜物所有交易合并組) 。大多數(shù)數(shù)據(jù)庫(kù)讓您這樣的聲明方式指定的操作。例如,下面的SQL查詢可以讓您找到交易ID最高值: "SELECT id, MAX(value) from transactions" 。
正如你所看到的,我們并不需要實(shí)現(xiàn)如何具體計(jì)算最大值(例如,使用循環(huán)和一個(gè)變量來(lái)跟蹤的最高值) 。我們只能表達(dá)我們所期望的要求(獲得最大值)。只要我們顯式發(fā)出這樣的查詢,數(shù)據(jù)庫(kù)就會(huì)為我們?nèi)ヌ幚???墒菫槭裁次覀儾荒茉诩?code>Collection中實(shí)現(xiàn)類(lèi)似的東西?多少次,你會(huì)發(fā)現(xiàn)自己使用循環(huán)一遍又一遍的反復(fù)遍歷集合?(如:for Object o: myLists{ ..})
其次,如何才能有效地處理真正的大數(shù)據(jù)集合?在理想的情況下,你想利用多核架構(gòu)加快處理,。然而,編寫(xiě)并行代碼很難而且容易出錯(cuò)。
Java 8 API的設(shè)計(jì)者重新提出了一個(gè)新的抽象稱(chēng)為流Stream,可以讓你以一種聲明的方式處理數(shù)據(jù)。此外,數(shù)據(jù)流可以充分利用多核架構(gòu)而無(wú)需編寫(xiě)多線程的一行代碼。這聽(tīng)起來(lái)不錯(cuò),不是嗎?
首先,我們看看在Java 7中,如何發(fā)現(xiàn)typegrocery 的所有交易,然后返回以交易值降序排序好的交易ID集合?
List<Transaction> groceryTransactions = new Arraylist<>();
for(Transaction t: transactions){
if(t.getType() == Transaction.GROCERY){
groceryTransactions.add(t);
}
}
Collections.sort(groceryTransactions, new Comparator(){
public int compare(Transaction t1, Transaction t2){
return t2.getValue().compareTo(t1.getValue());
}
});
List<Integer> transactionIds = new ArrayList<>();
for(Transaction t: groceryTransactions){
transactionsIds.add(t.getId());
}
而在Java 8使用Stream:
List<Integer> transactionsIds =
transactions.stream()
.filter(t -> t.getType() == Transaction.GROCERY)
.sorted(comparing(Transaction::getValue).reversed())
.map(Transaction::getId)
.collect(toList());
我們首先從交易數(shù)據(jù)列表中獲得一個(gè)stream對(duì)象,這是通過(guò)使用List的stream()方法實(shí)現(xiàn)的,下一步幾個(gè)操作 (filter, sorted, map, collect)是以鏈?zhǔn)脚帕谐梢粋€(gè)管道,形成對(duì)數(shù)據(jù)的查詢操作。

那么這段代碼如何并行操作呢?那么只要更換transactions.stream()為transaction.parallelStream()即可,請(qǐng)注意lambda表達(dá)式(t-> t.getCategory() == Transaction.GROCERY)和方法引用(Transaction::getId)將在下一章詳細(xì)講解。
2、Stream起步
首先,定義一下Stream,Stream是一個(gè)來(lái)自支持聚合操作源的元素的序列。
如下特點(diǎn):
- 1. 所謂元素的序列,一個(gè)
Stream向外提供了一個(gè)這樣的接口:特定元素類(lèi)型的值的序列,但是Stream并不實(shí)際持有也就是存儲(chǔ)這些元素,它們是在有需求時(shí)才會(huì)被計(jì)算。 - 2. 源:以提供
Stream進(jìn)行計(jì)算消費(fèi)的源,這些源有Collection集合Array數(shù)組或I/O資源等。 - 3.聚合操作:
Stream支持類(lèi)似SQL操作和函數(shù)式編程的大部分操作,比如:filter, map, reduce, find, match, sorted。
此外,Stream操作不同于Collection操作有兩個(gè)根本的地方:
- 1.管道Pipelining: 許多流
Stream操作返回流Stream自身,這就允許對(duì)其操作可以像鏈條一樣排列,變成一個(gè)管道,這其中也會(huì)激活比如懶加載和short-circuiting操作。 - 2.內(nèi)部迭代:相比于集合
Collection是顯式迭代(需要我們編碼完成迭代),Stream操作是在其內(nèi)部完成迭代操作。
下面我們看看前面Stream代碼的內(nèi)部工作流程:

我們首先從交易transactions這個(gè)列表中獲得Stream對(duì)象,數(shù)據(jù)源就是交易列表,其中提供了一系列元素集合,這些元素都是供Stream操作的,下一步,我們使用了一系列對(duì)這個(gè)Stream的聚合操作,包括過(guò)濾filter (用我們指定的謂詞條件predicate過(guò)濾元素,也就是代碼t -> t.getType() == Transaction.GROCERY), 排序(用指定的比較器comparator對(duì)元素進(jìn)行排序), 以及 map (為了釋放獲取信息). 所有這些操作除了最后的collect操作,都是返回一個(gè)Stream對(duì)象,這樣就能被前后鏈接在一起變成一個(gè)長(zhǎng)的管道,可以看成是基于源數(shù)據(jù)集合的一個(gè)查詢操作。如同SQL基于數(shù)據(jù)表的有條件查詢語(yǔ)句一樣。
最后到collect被調(diào)用操作, collect操作開(kāi)始處理這個(gè)管道以返回一個(gè)結(jié)果,不再是一個(gè)結(jié)果流了,這里一個(gè)結(jié)果是List一個(gè)對(duì)象,我們看到collect接受一個(gè)recipe輸入函數(shù)然后累計(jì)Stream中元素到一個(gè)匯總結(jié)果,這里輸入函數(shù)是toList(),它是一個(gè)將將Stream轉(zhuǎn)換為L(zhǎng)ist對(duì)象。
3、Stream與Collection比較
Stream和Collection集合有什么區(qū)別?Collection是關(guān)于靜止的數(shù)據(jù)結(jié)構(gòu),而Stream是有關(guān)動(dòng)詞算法和計(jì)算的。前者是主要面向內(nèi)存,存儲(chǔ)在內(nèi)存中,后者主要是面向CPU,通過(guò)CPU實(shí)現(xiàn)計(jì)算的。
舉例將一個(gè)影片存儲(chǔ)在DVD盤(pán)上,這是一個(gè)集合,因?yàn)樗麄€(gè)電影的字節(jié)數(shù)據(jù)結(jié)構(gòu),而這個(gè)影片被放在互聯(lián)網(wǎng)上,我們通過(guò)視頻軟件去觀看它時(shí),它實(shí)際是被流化了,它變成了一個(gè)字節(jié)流,流是與時(shí)間有關(guān)的概念,而數(shù)據(jù)結(jié)構(gòu)是與時(shí)間無(wú)關(guān),不會(huì)隨著時(shí)間變化變化,流正好相反,隨著時(shí)間不斷地動(dòng)態(tài)變化,如同水流一樣潺潺不斷。
所以,集合與流的主要區(qū)別是是否需要被計(jì)算,集合是一個(gè)內(nèi)存數(shù)據(jù)結(jié)構(gòu),集合中每個(gè)元素在加入到集合之前已經(jīng)被計(jì)算了,相反,流是在即時(shí)要求即時(shí)計(jì)算。
使用集合需要開(kāi)發(fā)者主動(dòng)去遍歷,使用一個(gè)遍歷循環(huán),這稱(chēng)為外部遍歷。
而使用一個(gè)流庫(kù)使用內(nèi)部遍歷,它自己為你遍歷元素,然后將結(jié)果保存在某處,你只要提供一個(gè)函數(shù),它就會(huì)用這個(gè)函數(shù)對(duì)元素處理完成。內(nèi)外遍歷的區(qū)別如下代碼:
List<String> transactionIds = new ArrayList<>();
for(Transaction t: transactions){
transactionIds.add(t.getId()); //外部遍歷
}
List<Integer> transactionIds =
transactions.stream()
.map(Transaction::getId) //內(nèi)部遍歷
.collect(toList());
到此這篇關(guān)于用Java8 stream處理數(shù)據(jù)的文章就介紹到這了,更多相關(guān) stream處理數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
java中的類(lèi)型自動(dòng)轉(zhuǎn)換機(jī)制解析
這篇文章主要介紹了java中的類(lèi)型自動(dòng)轉(zhuǎn)換機(jī)制,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-03-03
Javaweb監(jiān)聽(tīng)器實(shí)例之統(tǒng)計(jì)在線人數(shù)
這篇文章主要為大家詳細(xì)介紹了Javaweb監(jiān)聽(tīng)器實(shí)例之統(tǒng)計(jì)在線人數(shù),文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-11-11
如何在springboot項(xiàng)目中自定義404頁(yè)面
今天點(diǎn)擊菜單的時(shí)候不小心點(diǎn)開(kāi)了一個(gè)不存在的頁(yè)面,然后看到瀏覽器給的一個(gè)默認(rèn)的404頁(yè)面,這篇文章主要介紹了如何在springboot項(xiàng)目中自定義404頁(yè)面,需要的朋友可以參考下2024-05-05
SpringBoot如何使用自定義注解實(shí)現(xiàn)接口限流
這篇文章主要介紹了SpringBoot如何使用自定義注解實(shí)現(xiàn)接口限流,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-06-06
Springboot配置Swagger2登錄密碼的實(shí)現(xiàn)
本文主要介紹了Springboot配置Swagger2登錄密碼的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-03-03
解決SpringBoot自定義攔截器和跨域配置沖突的問(wèn)題
這篇文章主要介紹了解決SpringBoot自定義攔截器和跨域配置沖突的問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2021-08-08

