使用Java獲取List交集數(shù)據(jù)的實(shí)現(xiàn)方案小結(jié)
需求背景
今天遇到一個(gè)小需求,當(dāng)用戶上傳了一個(gè)關(guān)于用戶數(shù)據(jù)的列表,我們需要將其與數(shù)據(jù)庫中已有的用戶數(shù)據(jù)進(jìn)行比較。假設(shè)數(shù)據(jù)庫中的用戶數(shù)據(jù)存儲(chǔ)在集合A中,而用戶上傳的數(shù)據(jù)存儲(chǔ)在集合B中。我們需要確定集合B中有多少數(shù)據(jù)在集合A中,以及有多少數(shù)據(jù)不在集合A中,并記錄這些信息到日志中。那么,我們應(yīng)該如何處理這個(gè)需求呢?
解決方案
一、如何查找兩個(gè)集合的重復(fù)數(shù)據(jù)?
如果兩個(gè)集合中存放的都是String
類型數(shù)據(jù),那這個(gè)操作就會(huì)簡單很多,這里先初始化一下兩個(gè)集合的數(shù)據(jù)作為參考,接著給大家一些參考的方法
List<String> listA = Arrays.asList("Apple", "Banana", "Cherry", "Date"); List<String> listB = Arrays.asList("Banana", "Date", "Fig", "Grape");
1、使用retainAll()
retainAll()
方法會(huì)修改原始的集合A,使其只包含同時(shí)存在于集合A和集合B中的元素。
// 直接在集合A上使用retainAll()方法,它會(huì)保留只存在于集合A和集合B中的元素 listA.retainAll(listB); System.out.println("Elements in both lists: " + listA);
2、使用stream()和filter()
// 使用stream()方法和filter()方法找到兩個(gè)集合的交集 List<String> intersection = listA.stream() .filter(listB::contains) .collect(Collectors.toList()); System.out.println("Elements in both lists: " + intersection);
3、使用stream()和anyMatch()
// 使用anyMatch()檢查集合A中的每個(gè)元素是否在集合B中 List<String> intersection = listA.stream() .filter(element -> listB.anyMatch(b -> b.equals(element))) .collect(Collectors.toList()); System.out.println("Elements in both lists: " + intersection);
上面的代碼使用 listB.anyMatch(b -> b.equals(element))
。對(duì)于 listA
中的每個(gè)元素,它創(chuàng)建一個(gè)新的流來遍歷 listB
的所有元素,直到找到相等的元素或遍歷完所有元素。每次調(diào)用 anyMatch
都會(huì)遍歷 listB
,這同樣是一個(gè) O(n) 操作;但它在內(nèi)部使用了流,這會(huì)增加額外的開銷。
4、使用Collection的intersection()
如果你想要獲取兩個(gè)集合的交集,可以使用Collection
接口提供的intersection()
方法:
Set<String> intersectionSet = new HashSet<>(listA); intersectionSet.retainAll(listB); List<String> intersection = new ArrayList<>(intersectionSet); System.out.println("Elements in both lists: " + intersection);
5、查詢集合B中不與集合A重合的數(shù)據(jù)
這時(shí)候如果要查詢包含集合B中不與集合A重合的數(shù)據(jù),我們只要簡單修改一下上面的方法即可,我們還是使用Java 8的Stream API來創(chuàng)建一個(gè)新的集合,這個(gè)集合包含集合B中獨(dú)有的元素。
// 使用Stream API找出集合B中不包含在集合A中的元素 List<String> uniqueInB = listB.stream() .filter(element -> !listA.contains(element)) .collect(Collectors.toList()); // 打印集合B中不和集合A重合的數(shù)據(jù) System.out.println("Elements in list B only: " + uniqueInB);
在數(shù)據(jù)量不大的情況下,使用Stream API的方法通常是足夠高效的,并且代碼簡潔易讀。如果數(shù)據(jù)量非常大,您可能需要考慮其他方法,例如將集合轉(zhuǎn)換為HashSet以提高查找效率,或者使用并行流(parallel streams)來利用多核處理器。
二、假設(shè)集合A的數(shù)據(jù)更多,該如何優(yōu)化?
如果集合A的數(shù)據(jù)比集合B中的數(shù)據(jù)更多,為了提高效率,我們可以做一些調(diào)整。這里有兩個(gè)優(yōu)化點(diǎn):
- 我們使用了
listB::contains
來檢查一個(gè)元素是否在集合B中。如果集合A更大,那么使用listA::contains
可能會(huì)更高效,因?yàn)楸闅v較小的集合將減少必要的contains
檢查次數(shù)。 .contains
方法的性能取決于被搜索的集合的類型。對(duì)于ArrayList
,contains
方法的時(shí)間復(fù)雜度是 O(n),它會(huì)遍歷整個(gè)列表來查找元素,而對(duì)于HashSet
,時(shí)間復(fù)雜度是 O(1),因?yàn)樗褂霉1磉M(jìn)行查找。我們這時(shí)候就可以將集合A轉(zhuǎn)換為一個(gè)HashSet
。
完整的示例代碼:
import java.util.ArrayList; import java.util.HashSet; import java.util.List; import java.util.Set; import java.util.stream.Collectors; // 假設(shè)集合A和集合B已經(jīng)初始化 List<String> listA = Arrays.asList("Apple", "Banana", "Cherry", "Date", "Fig", "Grape"); List<String> listB = Arrays.asList("Banana", "Date", "Fig"); // 將集合A轉(zhuǎn)換為HashSet,以提高查找效率 Set<String> setA = new HashSet<>(listA); // 生成集合C,保存集合A和集合B的重合數(shù)據(jù) List<String> listC = listB.stream() .filter(setA::contains) // 使用HashSet來檢查交集,提高效率 .collect(Collectors.toList()); // 收集結(jié)果到一個(gè)新的列表 // 生成集合D,保存集合B中沒有和集合A重合的數(shù)據(jù) List<String> listD = listB.stream() .filter(element -> !setA.contains(element)) // 使用HashSet來檢查差異,提高效率 .collect(Collectors.toList()); // 收集結(jié)果到一個(gè)新的列表 // 打印結(jié)果 System.out.println("List C (common elements): " + listC); System.out.println("List D (unique to list B): " + listD);
補(bǔ)充說明:
如果集合A和集合B都是使用
List
實(shí)現(xiàn),那么兩種方法的時(shí)間復(fù)雜度在本質(zhì)上是相同的。每次調(diào)用contains
方法時(shí),都會(huì)在另一個(gè)列表上進(jìn)行線性搜索,這意味著每次調(diào)用的時(shí)間復(fù)雜度都是O(n)。對(duì)集合A中的每個(gè)元素調(diào)用
listB::contains
,如果集合A有n個(gè)元素,集合B有m個(gè)元素,那么總的時(shí)間復(fù)雜度就是O(n*m)
。對(duì)集合B中的每個(gè)元素調(diào)用
listA::contains
,同樣地,如果集合A有n個(gè)元素,集合B有m個(gè)元素,那么總的時(shí)間復(fù)雜度也是O(n*m)
。如果集合A遠(yuǎn)大于集合B,遍歷較小的集合B通常在實(shí)際應(yīng)用中效率更高,即使時(shí)間復(fù)雜度在理論上是相等的。這是因?yàn)檩^小的集合遍歷次數(shù)更少,從而減少了實(shí)際執(zhí)行的總步驟數(shù)。不過,這種效率的差異只能在實(shí)際運(yùn)行時(shí)才能體現(xiàn)。
三、如果集合中存放的是對(duì)象,該如何操作?
通常情況下,我們不會(huì)在集合中存放字符串,都是放一些對(duì)象數(shù)據(jù),這時(shí)候該如何獲取呢?在這里我們定義一個(gè)Person
作為示例,假設(shè)Person
對(duì)象在name
和age
屬性都相同時(shí)被認(rèn)為是相等的。
在Java中使用contains
方法來檢查一個(gè)集合是否包含某個(gè)對(duì)象時(shí),就需要重寫對(duì)象的equals
和hashCode
方法。這是因?yàn)?code>contains方法的實(shí)現(xiàn)依賴于equals
方法來比較對(duì)象,而hashCode
方法則用于快速查找和確定對(duì)象在散列數(shù)據(jù)結(jié)構(gòu)(如HashSet
或HashMap
)中的位置。
equals
和hashCode
方法之間有一個(gè)重要的一致性約定:
- 如果兩個(gè)對(duì)象根據(jù)
equals
方法是相等的,那么它們的hashCode
方法也必須返回相同的值。 - 如果兩個(gè)對(duì)象的
hashCode
值不同,那么它們一定不相等(根據(jù)equals
方法)。
這個(gè)約定對(duì)于HashSet
、HashMap
等集合的正確運(yùn)作至關(guān)重要。如果你只重寫了equals
方法而沒有重寫hashCode
方法,可能會(huì)導(dǎo)致集合的行為不符合預(yù)期,例如,即使兩個(gè)對(duì)象相等,HashSet
也可能認(rèn)為它們是不同的對(duì)象并存儲(chǔ)兩個(gè)副本。
示例代碼
public class Person { private String name; private int age; // 構(gòu)造函數(shù)、getter和setter省略 @Override public boolean equals(Object o) { if (this == o) return true; // 如果是同一個(gè)對(duì)象,直接返回true if (o == null || getClass() != o.getClass()) return false; // 如果對(duì)象為空或者類類型不一致,返回false Person person = (Person) o; // 向下轉(zhuǎn)型 // 比較name和age屬性 return Objects.equals(name, person.name) && age == person.age; } @Override public int hashCode() { // 使用31作為質(zhì)數(shù),可以減少哈希沖突 int result = 17; result = 31 * result + Objects.hashCode(name); // 根據(jù)name計(jì)算哈希碼 result = 31 * result + Integer.hashCode(age); // 根據(jù)age計(jì)算哈希碼 return result; } }
在這個(gè)實(shí)現(xiàn)中,equals
方法首先檢查是否是同一個(gè)對(duì)象,然后檢查對(duì)象是否為空或者是否是不同的類型。如果這些檢查都通過了,它會(huì)通過Objects.equals
方法比較name
屬性,并直接比較age
屬性的值。
hashCode
方法使用了一個(gè)固定的質(zhì)數(shù)(在這里是17)作為初始哈希碼。然后,它使用31作為乘數(shù)(31是一個(gè)質(zhì)數(shù),通常用于計(jì)算哈希碼,因?yàn)樗兄诒苊夤_突)。hashCode
方法分別對(duì)name
和age
屬性調(diào)用Objects.hashCode
和Integer.hashCode
方法來計(jì)算它們的哈希碼,并將它們組合起來。
以上就是使用Java獲取List交集數(shù)據(jù)的實(shí)現(xiàn)方案小結(jié)的詳細(xì)內(nèi)容,更多關(guān)于Java獲取List交集數(shù)據(jù)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
IDEA導(dǎo)出jar打包成exe應(yīng)用程序的小結(jié)
這篇文章主要介紹了IDEA導(dǎo)出jar打包成exe應(yīng)用程序,需要的朋友可以參考下2020-08-08Java使用POI實(shí)現(xiàn)導(dǎo)出Excel的方法詳解
在項(xiàng)目開發(fā)中往往需要使用到Excel的導(dǎo)入和導(dǎo)出,導(dǎo)入就是從Excel中導(dǎo)入到DB中,而導(dǎo)出就是從DB中查詢數(shù)據(jù)然后使用POI寫到Excel上。本文將利用POI實(shí)現(xiàn)導(dǎo)出Excel,需要的可以參考一下2022-10-10SpringBoot實(shí)現(xiàn)熱部署的三種方式
本文主要介紹了SpringBoot實(shí)現(xiàn)熱部署的三種方式,主要包括配置pom.xml文件,使用插件的執(zhí)行命令mvn spring-boot:run啟動(dòng)項(xiàng),使用springloader本地啟動(dòng)修改jvm參數(shù),使用devtools工具包,感興趣的可以了解一下2023-12-12chatgpt java環(huán)境調(diào)用源碼實(shí)現(xiàn)demo
這篇文章主要介紹了chatgpt java環(huán)境調(diào)用源碼實(shí)現(xiàn)demo,本文結(jié)合實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2023-02-02SpringAnimation 實(shí)現(xiàn)菜單從頂部彈出從底部消失動(dòng)畫效果
最近做項(xiàng)目遇到這樣一個(gè)需求,要求實(shí)現(xiàn)一種菜單,菜單從頂部彈入,然后從底部消失,頂部彈入時(shí),有一個(gè)上下抖動(dòng)的過程,底部消失時(shí),先向上滑動(dòng),然后再向下滑動(dòng)消失。下面給大家?guī)砹藢?shí)現(xiàn)代碼,感興趣的朋友一起看看吧2018-05-05mybatis中查詢結(jié)果為空時(shí)不同返回類型對(duì)應(yīng)返回值問題
這篇文章主要介紹了mybatis中查詢結(jié)果為空時(shí)不同返回類型對(duì)應(yīng)返回值問題,本文分幾種方法給大家介紹的非常詳細(xì),需要的朋友可以參考下2019-10-10