Java 8 Stream 的終極技巧——Collectors 功能與操作方法詳解
本文實(shí)例講述了Java 8 Stream 的終極技巧——Collectors 功能與操作方法。分享給大家供大家參考,具體如下:
1. 前言
昨天在 Collection移除元素操作 相關(guān)的文章中提到了 Collectors
。相信很多同學(xué)對(duì)這個(gè)比較感興趣,那我們今天就來(lái)研究一下 Collectors
。
2. Collectors 的作用
Collectors
是 Java 8 加入的操作類(lèi),位于 java.util.stream
包下。它會(huì)根據(jù)不同的策略將元素收集歸納起來(lái),比如最簡(jiǎn)單常用的是將元素裝入Map
、Set
、List
等可變?nèi)萜髦?。特別對(duì)于 Java 8 Stream Api 來(lái)說(shuō)非常有用。它提供了collect()
方法來(lái)對(duì) Stream
流進(jìn)行終結(jié)操作派生出基于各種策略的結(jié)果集。我們就借助于 Stream
來(lái)熟悉一下 Collectors
吧。我們依然用昨天的例子:
List<String> servers = new ArrayList<>(); servers.add("Felordcn"); servers.add("Tomcat"); servers.add("Jetty"); servers.add("Undertow"); servers.add("Resin");
3. Java 8 中 Collectors 的方法
Collectors
提供了一系列的靜態(tài)方法供我們使用,通常情況我們靜態(tài)導(dǎo)入即可使用。接下來(lái)我們來(lái)看看都提供了哪些方法吧。
3.1 類(lèi)型歸納
這是一個(gè)系列,作用是將元素分別歸納進(jìn)可變?nèi)萜?List
、Map
、Set
、Collection
或者ConcurrentMap
。
Collectors.toList(); Collectors.toMap(); Collectors.toSet(); Collectors.toCollection(); Collectors.toConcurrentMap();
我們可以根據(jù)以上提供的 API 使用 Stream
的 collect
方法中的轉(zhuǎn)換為熟悉的集合容器。非常簡(jiǎn)單這里不再演示。
3.2 joining
將元素以某種規(guī)則連接起來(lái)。該方法有三種重載 joining(CharSequence delimiter)
和 joining(CharSequence delimiter,CharSequence prefix,CharSequence suffix)
// 輸出 FelordcnTomcatJettyUndertowResin servers.stream().collect(Collectors.joining()); // 輸出 Felordcn,Tomcat,Jetty,Undertow,Resin servers.stream().collect(Collectors.joining("," )); // 輸出 [Felordcn,Tomcat,Jetty,Undertow,Resin] servers.stream().collect(Collectors.joining(",", "[", "]"));
用的比較多的是讀取 HttpServletRequest
中的 body :
HttpServletRequest.getReader().lines().collect(Collectors.joining());
3.3 collectingAndThen
該方法先執(zhí)行了一個(gè)歸納操作,然后再對(duì)歸納的結(jié)果進(jìn)行 Function
函數(shù)處理輸出一個(gè)新的結(jié)果。
// 比如我們將servers joining 然后轉(zhuǎn)成大寫(xiě),結(jié)果為: FELORDCN,TOMCAT,JETTY,UNDERTOW,RESIN servers.stream.collect(Collectors.collectingAndThen(Collectors.joining(","), String::toUpperCase));
3.4 groupingBy
按照條件對(duì)元素進(jìn)行分組,和 SQL 中的 group by
用法有異曲同工之妙,通常也建議使用 Java 進(jìn)行分組處理以減輕數(shù)據(jù)庫(kù)壓力。groupingBy
也有三個(gè)重載方法
我們將 servers
按照長(zhǎng)度進(jìn)行分組:
// 按照字符串長(zhǎng)度進(jìn)行分組 符合條件的元素將組成一個(gè) List 映射到以條件長(zhǎng)度為key 的 Map<Integer, List<String>> 中 servers.stream.collect(Collectors.groupingBy(String::length))
如果我不想 Map
的 value
為 List
怎么辦? 上面的實(shí)現(xiàn)實(shí)際上調(diào)用了下面的方式:
//Map<Integer, Set<String>> servers.stream.collect(Collectors.groupingBy(String::length, Collectors.toSet()))
我要考慮同步安全問(wèn)題怎么辦? 當(dāng)然使用線程安全的同步容器啊,那前兩種都用不成了吧! 別急! 我們來(lái)推斷一下,其實(shí)第二種等同于下面的寫(xiě)法:
Supplier<Map<Integer,Set<String>>> mapSupplier = HashMap::new; Map<Integer,Set<String>> collect = servers.stream.collect(Collectors.groupingBy(String::length, mapSupplier, Collectors.toSet()));
這就非常好辦了,我們提供一個(gè)同步 Map
不就行了,于是問(wèn)題解決了:
Supplier<Map<Integer, Set<String>>> mapSupplier = () -> Collections.synchronizedMap(new HashMap<>()); Map<Integer, Set<String>> collect = servers.stream.collect(Collectors.groupingBy(String::length, mapSupplier, Collectors.toSet()));
其實(shí)同步安全問(wèn)題 Collectors
的另一個(gè)方法 groupingByConcurrent
給我們提供了解決方案。用法和 groupingBy
差不多。
3.5 partitioningBy
partitioningBy
我們?cè)诒疚拈_(kāi)頭的提到的文章中已經(jīng)見(jiàn)識(shí)過(guò)了,可以看作 groupingBy
的一個(gè)特例,基于斷言(Predicate
)策略分組。這里不再舉例說(shuō)明。
3.6 counting
該方法歸納元素的的數(shù)量,非常簡(jiǎn)單,不再舉例說(shuō)明。
3.7 maxBy/minBy
這兩個(gè)方法分別提供了查找大小元素的操作,它們基于比較器接口 Comparator
來(lái)比較 ,返回的是一個(gè) Optional
對(duì)象。 我們來(lái)獲取 servers
中最小長(zhǎng)度的元素:
// Jetty Optional<String> min = servers.stream.collect(Collectors.minBy(Comparator.comparingInt(String::length)));
這里其實(shí) Resin
長(zhǎng)度也是最小,這里遵循了 "先入為主" 的原則 。當(dāng)然 Stream.min()
可以很方便的獲取最小長(zhǎng)度的元素。maxBy
同樣的道理。
3.8 summingInt/Double/Long
用來(lái)做累加計(jì)算。計(jì)算元素某個(gè)屬性的總和,類(lèi)似 Mysql 的 sum
函數(shù),比如計(jì)算各個(gè)項(xiàng)目的盈利總和、計(jì)算本月的全部工資總和等等。我們這里就計(jì)算一下 servers
中字符串的長(zhǎng)度之和 (為了舉例不考慮其它寫(xiě)法)。
// 總長(zhǎng)度 32 servers.stream.collect(Collectors.summingInt(s -> s.length()));
3.9 summarizingInt/Double/Long
如果我們對(duì) 3.6章節(jié)-3.8章節(jié) 的操作結(jié)果都要怎么辦?難不成我們搞5個(gè) Stream
流嗎? 所以就有了 summarizingInt
、summarizingDouble
、summarizingLong
三個(gè)方法。
這三個(gè)方法通過(guò)對(duì)元素某個(gè)屬性的提取,會(huì)返回對(duì)元素該屬性的統(tǒng)計(jì)數(shù)據(jù)對(duì)象,分別對(duì)應(yīng) IntSummaryStatistics
、DoubleSummaryStatistics
、LongSummaryStatistics
。我們對(duì) servers
中元素的長(zhǎng)度進(jìn)行統(tǒng)計(jì):
DoubleSummaryStatistics doubleSummaryStatistics = servers.stream.collect(Collectors.summarizingDouble(String::length)); // {count=5, sum=32.000000, min=5.000000, average=6.400000, max=8.000000} System.out.println("doubleSummaryStatistics.toString() = " + doubleSummaryStatistics.toString());
結(jié)果 DoubleSummaryStatistics
中包含了 總數(shù),總和,最小值,最大值,平均值 五個(gè)指標(biāo)。
3.10 mapping
該方法是先對(duì)元素使用 Function
進(jìn)行再加工操作,然后用另一個(gè)Collector
歸納。比如我們先去掉 servers
中元素的首字母,然后將它們裝入 List
。
// [elordcn, omcat, etty, ndertow, esin] servers.stream.collect(Collectors.mapping(s -> s.substring(1), Collectors.toList()));
有點(diǎn)類(lèi)似 Stream
先進(jìn)行了 map
操作再進(jìn)行 collect
:
servers.stream.map(s -> s.substring(1)).collect(Collectors.toList());
3.11 reducing
這個(gè)方法非常有用!但是如果要了解這個(gè)就必須了解其參數(shù) BinaryOperator<T>
。 這是一個(gè)函數(shù)式接口,是給兩個(gè)相同類(lèi)型的量,返回一個(gè)跟這兩個(gè)量相同類(lèi)型的一個(gè)結(jié)果,偽表達(dá)式為 (T,T) -> T
。默認(rèn)給了兩個(gè)實(shí)現(xiàn) maxBy
和 minBy
,根據(jù)比較器來(lái)比較大小并分別返回最大值或者最小值。當(dāng)然你可以靈活定制。然后 reducing
就很好理解了,元素兩兩之間進(jìn)行比較根據(jù)策略淘汰一個(gè),隨著輪次的進(jìn)行元素個(gè)數(shù)就是 reduce
的。那這個(gè)有什么用處呢? Java 官方給了一個(gè)例子:統(tǒng)計(jì)每個(gè)城市個(gè)子最高的人。
Comparator<Person> byHeight = Comparator.comparing(Person::getHeight); Map<String, Optional<Person>> tallestByCity = people.stream() .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(BinaryOperator.maxBy(byHeight))));
結(jié)合最開(kāi)始給的例子你可以使用 reducing
找出最長(zhǎng)的字符串試試。
上面這一層是根據(jù) Height
屬性找最高的 Person
,而且如果這個(gè)屬性沒(méi)有初始化值或者沒(méi)有數(shù)據(jù),很有可能拿不到結(jié)果所以給出的是 Optional<Person>
。 如果我們給出了 identity
作一個(gè)基準(zhǔn)值,那么我們首先會(huì)跟這個(gè)基準(zhǔn)值進(jìn)行 BinaryOperator
操作。
比如我們給出高于 2 米 的人作為 identity
。 我們就可以統(tǒng)計(jì)每個(gè)城市不低于 2 米 而且最高的那個(gè)人,當(dāng)然如果該城市沒(méi)有人高于 2 米則返回基準(zhǔn)值identity
:
Comparator<Person> byHeight = Comparator.comparing(Person::getHeight); Person identity= new Person(); identity.setHeight(2.); identity.setName("identity"); Map<String, Person> collect = persons.stream() .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(identity, BinaryOperator.maxBy(byHeight))));
這時(shí)候就確定一定會(huì)返回一個(gè) Person
了,最起碼會(huì)是基準(zhǔn)值identity
不再是 Optional
。
還有些情況,我們想在 reducing
的時(shí)候把 Person
的身高先四舍五入一下。這就需要我們做一個(gè)映射處理。定義一個(gè) Function<? super T, ? extends U> mapper
來(lái)干這個(gè)活。那么上面的邏輯就可以變更為:
Comparator<Person> byHeight = Comparator.comparing(Person::getHeight); Person identity = new Person(); identity.setHeight(2.); identity.setName("identity"); // 定義映射 處理 四舍五入 Function<Person, Person> mapper = ps -> { Double height = ps.getHeight(); BigDecimal decimal = new BigDecimal(height); Double d = decimal.setScale(1, BigDecimal.ROUND_HALF_UP).doubleValue(); ps.setHeight(d); return ps; }; Map<String, Person> collect = persons.stream() .collect(Collectors.groupingBy(Person::getCity, Collectors.reducing(identity, mapper, BinaryOperator.maxBy(byHeight))));
4. 總結(jié)
今天我們對(duì) Java 8 中的 Collectors
進(jìn)行了詳細(xì)的講解。如果你熟悉了 Collectors
操作 Stream 會(huì)更加得心應(yīng)手。當(dāng)然在 Java 8 之后的 Java 9 和 Java 12 中 Collectors
都有新增的功能, 后面有時(shí)間我們會(huì)繼續(xù)進(jìn)行講解。敬請(qǐng)關(guān)注!
更多關(guān)于java算法相關(guān)內(nèi)容感興趣的讀者可查看本站專題:《Java文件與目錄操作技巧匯總》、《Java數(shù)據(jù)結(jié)構(gòu)與算法教程》、《Java操作DOM節(jié)點(diǎn)技巧總結(jié)》和《Java緩存操作技巧匯總》
希望本文所述對(duì)大家java程序設(shè)計(jì)有所幫助。
相關(guān)文章
使用GSON庫(kù)轉(zhuǎn)換Java對(duì)象為JSON對(duì)象的進(jìn)階實(shí)例詳解
這篇文章主要介紹了使用GSON庫(kù)轉(zhuǎn)換Java對(duì)象為JSON對(duì)象的進(jìn)階實(shí)例詳解,包括注冊(cè)TypeAdapter及處理Enum類(lèi)型等實(shí)際運(yùn)用中可能遇到的一些復(fù)雜問(wèn)題,需要的朋友可以參考下2016-06-06SpringBoot多模塊打包部署Docker的項(xiàng)目實(shí)戰(zhàn)
本文通過(guò)介紹最常見(jiàn)的Maven管理的Spring Boot項(xiàng)目多模塊打包部署Docker來(lái)介紹一下項(xiàng)目部署過(guò)程中操作流程和幾個(gè)需要注意的點(diǎn),具有一定的參加價(jià)值,感興趣的可以了解一下2023-08-08SpringBoot使用jsr303校驗(yàn)的實(shí)現(xiàn)
這篇文章主要介紹了SpringBoot使用jsr303校驗(yàn)的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2020-10-10Python機(jī)器學(xué)習(xí)三大件之二pandas
這篇文章主要介紹了Python機(jī)器學(xué)習(xí)三大件之二pandas,文中有非常詳細(xì)的代碼示例,對(duì)正在學(xué)習(xí)Python的小伙伴們有很好地幫助,需要的朋友可以參考下2021-05-05Java8新特性之StampedLock_動(dòng)力節(jié)點(diǎn)Java學(xué)院整理
本文從synchronized、Lock到Java8新增的StampedLock進(jìn)行對(duì)比分析,對(duì)Java8新特性之StampedLock相關(guān)知識(shí)感興趣的朋友一起看看吧2017-06-06詳解Java的MyBatis框架中的緩存與緩存的使用改進(jìn)
很多人在使用MyBatis的緩存后經(jīng)常會(huì)遇到MySQL分頁(yè)查詢的顯示問(wèn)題,針對(duì)于此,這里我們就來(lái)詳解Java的MyBatis框架中的緩存與緩存的使用改進(jìn),首先來(lái)回顧一下MyBatis的緩存機(jī)制與執(zhí)行:2016-06-06