如何用Java實現(xiàn)排列組合算法
需求
我們的數(shù)據(jù)表有多個維度,任意多個維度組合后進行 group by 可能會產(chǎn)生一些”奇妙”的反應,由于不確定怎么組合,就需要將所有的組合都列出來進行嘗試。
抽象一下就是從一個集合中取出任意元素,形成唯一的組合。如[a,b,c]可組合為[a]、[b]、[c]、[ab]、[bc]、[ac]、[abc]。
要求如下:
- 組合內(nèi)的元素數(shù)大于 0 小于等于 數(shù)組大?。?/li>
- 組合內(nèi)不能有重復元素,如 [aab] 是不符合要求的組合;
- 組合內(nèi)元素的位置隨意,即 [ab] 和 [ba] 視為同一種組合;
看到這里,就應該想到高中所學習的排列組合了,同樣是從集合中取出元素形成一個另一個集合,如果集合內(nèi)元素位置隨意,就是組合,從 b 個元素中取 a 個元素的組合有種。而如果要求元素順序不同也視為不同集合的話,就是排列,從 m 個元素取 n 個元素的排列有種。
我遇到的這個需求就是典型的組合,用公式來表示就是從元素個數(shù)為 n 的集合中列出種組合。
從排列到組合-窮舉
對于這種需求,首先想到的當然是窮舉。由于排列的要求較少,實現(xiàn)更簡單一些,如果我先找出所有排列,再剔除由于位置不同而重復的元素,即可實現(xiàn)需求。假設需要從 [A B C D E] 五個元素中取出所有組合,那么我們先找出所有元素的全排列,然后再將類似 [A B] 和 [B A] 兩種集合去重即可。
我們又知道,那么我們先考慮一種情況,假設是,從 5 個元素中選出三個進行全排列。
被選取的三個元素,每一個都可以是 ABCDE 之一,然后再排除掉形成的集合中有重復元素的,就是 5 選 3 的全排列了。
代碼是這樣:
private static Set<Set<String>> exhaustion() { List<String> m = Arrays.asList("a", "b", "c", "d", "e"); Set<Set<String>> result = new HashSet<>(); int count = 3; for (int a = 1; a < m.size(); a++) { for (int b = 0; b < m.size(); b++) { for (int c = 0; c < m.size(); c++) { Set<String> tempCollection = new HashSet<>(); tempCollection.add(m.get(a)); tempCollection.add(m.get(b)); tempCollection.add(m.get(c)); // 如果三個元素中有重復的會被 Set 排重,導致 Set 的大小不為 3 if (tempCollection.size() == count) { result.add(tempCollection); } } } } return result; }
對于結果組合的排重,我借用了 Java 中 HashSet 的兩個特性:
- 元素唯一性,選取三個元素放到 Set 內(nèi),重復的會被過濾掉,那么就可以通過集合的大小來判斷是否有重復元素了,
- 元素無序性,Set[A B] 和 Set[B A] 都會被表示成 Set[A B]。
- 另外又由于元素唯一性,被同時表示為 Set[A B] 的多個集合只會保留一個,這樣就可以幫助將全排列轉為組合。
可以注意得到,上面程序中 count 參數(shù)是寫死的,如果需要取出 4 個元素的話就需要四層循環(huán)嵌套了,如果取的元素個取是可變的話,普通的編碼方式就不適合了。
注: 可變層數(shù)的循環(huán)可以用遞歸來實現(xiàn)。
從排列到組合-分治
窮舉畢竟太過暴力,我們來通過分治思想來重新考慮一下這個問題:
分治思想
分治的思想總的來說就是”大事化小,小事化了”,它將復雜的問題往簡單劃分,直到劃分為可直接解決的問題,再從這個直接可以解決的問題向上聚合,最后解決問題。
從 M 個元素中取出 N 個元素整個問題很復雜,用分治思想就可以理解為:
- 首先,如果我們已經(jīng)從 M 中元素取出了一個元素,那么集合中還剩下 M-1 個,需要取的元素就剩下 N-1 個。
- 還不好解決的話,我們假設又從 M-1 中取出了一個元素,集合中還剩下 M-2 個,需要取的元素只剩下 N-2 個。
- 直到我們可能取了有 M-N+1 次,需要取的元素只剩下一個了,再從剩余集合中取,就是一個簡單問題了,很簡單,取法有 M-N+1 種。
- 如果我們解決了這個問題,已經(jīng)取完最后一次了產(chǎn)生了 M-N+1 種臨時集合,再考慮從 M-N+2 個元素中取一個元素呢,又有 M-N+2 種可能。
- 將這些可能聚合到一塊,直到取到了 N 個元素,這個問題也就解決了。
還是從 5 個元素中取 3 個元素的示例:
- 從 5 個元素中取 3 個元素是一個復雜問題,為了簡化它,我們認為已經(jīng)取出了一個元素,還要再從剩余的 4 個元素中取出 2 個,求解公式為:。
- 從 4 個元素中取出 2 個依舊不易解決,那我們再假設又取出了一個元素,接下來的問題是如何從 3 個元素中取一個,公式為。
- 從 3 個元素中取 1 個已經(jīng)是個簡單問題了,有三種可能,再向上追溯,與四取一、五取一的可能性做乘,從而解決這個問題。
代碼實現(xiàn)
用代碼實現(xiàn)如下:
public class Combination { public static void main(String[] args) { List<String> m = Arrays.asList("a", "b", "c", "d", "e"); int n = 5; Set<Set<String>> combinationAll = new HashSet<>(); // 先將問題分解成 五取一、五取二... 等的全排列 for (int c = 1; c <= n; c++) { combinationAll.addAll(combination(m, new ArrayList<>(), c)); } System.out.println(combinationAll); } private static Set<Set<String>> combination(List<String> remainEle, List<String> tempCollection, int fetchCount) { if (fetchCount == 1) { Set<Set<String>> eligibleCollections = new HashSet<>(); // 在只差一個元素的情況下,遍歷剩余元素為每個臨時集合生成多個滿足條件的集合 for (String ele : remainEle) { Set<String> collection = new HashSet<>(tempCollection); collection.add(ele); eligibleCollections.add(collection); } return eligibleCollections; } fetchCount--; Set<Set<String>> result = new HashSet<>(); // 差多個元素時,從剩余元素中取出一個,產(chǎn)生多個臨時集合,還需要取 count-- 個元素。 for (int i = 0; i < remainEle.size(); i++) { List<String> collection = new ArrayList<>(tempCollection); List<String> tempRemain = new ArrayList<>(remainEle); collection.add(tempRemain.remove(i)); result.addAll(combination(tempRemain, collection, fetchCount)); } return result; } }
其實現(xiàn)就是遞歸,關于遞歸和分治,有興趣可以看一下隱藏篇:遞歸和分治。
直擊本質-位運算
從元素的全排列找全組合,比窮舉略好,但還不是最好的方法,畢竟它”繞了一次道”。
很多算法都能通過位運算巧秒地解決,其優(yōu)勢主要有兩點:一者位運算在計算機中執(zhí)行效率超高,再者由于位運算語義簡單,算法大多直指本質。
組合算法也能通過位運算實現(xiàn)。
思想
再次考慮全組合的需求,從 M 個元素中取任意個元素形成組合,組合內(nèi)元素不能重復、元素位置無關。
之前的方法都是從結果組合是否滿足要求來考慮問題,考慮組合是否有重復元素、是否已有同樣的組合等條件。如果換種思路,從待選元素上來考慮呢?
對于每個元素來說,它的狀態(tài)就簡單得多了,要么被放進組合,要么不放進組合。每個元素都有這么兩種狀態(tài)。如果從 5 個元素中任意取 N 個元素形成組合的話,用二進制位來表示每個元素是否被放到組合里,就是:
A B C D E
0 0 0 0 1 [E] = 1
A B C D E
0 0 0 1 0 [D] = 2
A B C D E
0 0 0 1 1 [DE] = 3
...
看到這里,應該就非常清楚了吧,每種組合都可以拆解為 N 個二進制位的表達形式,而每個二進制組合同時代表著一個十進制數(shù)字,所以每個十進制數(shù)字都就能代表著一種組合。
十進制數(shù)字的數(shù)目我們很簡單就能算出來,從00000...到11111...一共有種,排除掉全都不被放進組合這種可能,結果有種。
代碼實現(xiàn)
下面是 Java 代碼的實現(xiàn):
public class Combination { public static void main(String[] args) { String[] m = {"A", "B", "C", "D", "E"}; Set<Set<String>> combinationAll = combination(m); System.out.println(combinationAll); } private static Set<Set<String>> combination(String[] m) { Set<Set<String>> result = new HashSet<>(); for (int i = 1; i < Math.pow(2, m.length) - 1; i++) { Set<String> eligibleCollections = new HashSet<>(); // 依次將數(shù)字 i 與 2^n 按位與,判斷第 n 位是否為 1 for (int j = 0; j < m.length; j++) { if ((i & (int) Math.pow(2, j)) == Math.pow(2, j)) { eligibleCollections.add(m[j]); } } result.add(eligibleCollections); } return result; } }
小結
排列和組合算法在實際應用中很常見,而且他們的實現(xiàn)方法也非常具有參考意義??偟膩碚f:排列用遞歸、組合用位運算。
以上就是如何用Java實現(xiàn)排列組合算法的詳細內(nèi)容,更多關于用Java實現(xiàn)排列組合算法的資料請關注腳本之家其它相關文章!
相關文章
Spring?Boot如何配置yml配置文件定義集合、數(shù)組和Map
這篇文章主要介紹了Spring?Boot?優(yōu)雅配置yml配置文件定義集合、數(shù)組和Map,包括Spring?Boot?yml配置文件定義基本數(shù)據(jù)類型和引用數(shù)據(jù)類型的方式,需要的朋友可以參考下2023-10-10Spring?Boot?MQTT?Too?many?publishes?in?progress錯誤的解決方
本文介紹Spring?Boot?MQTT?Too?many?publishes?in?progress錯誤的解決方案,文章圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,感興趣的小伙伴可以參考一下2022-07-07Spring Boot實現(xiàn)功能的統(tǒng)一詳解
這篇文章主要介紹了Spring Boot統(tǒng)一功能的處理,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2022-06-06Java guava monitor監(jiān)視器線程的使用詳解
工作中的場景中是否存在類似這樣的場景,需要提交的線程在某個觸發(fā)條件下執(zhí)行。本文主要就是使用guava中的monitor來優(yōu)雅的實現(xiàn)帶監(jiān)視器的線程2021-11-11SpringBoot中@ConfigurationProperties注解的使用與源碼詳解
這篇文章主要介紹了SpringBoot中@ConfigurationProperties注解的使用與源碼詳解,@ConfigurationProperties注解用于自動配置綁定,可以將application.properties配置中的值注入到bean對象上,需要的朋友可以參考下2023-11-11