圖文詳解JAVA實現(xiàn)哈夫曼樹
前言
我想學(xué)過數(shù)據(jù)結(jié)構(gòu)的小伙伴一定都認(rèn)識哈夫曼,這位大神發(fā)明了大名鼎鼎的“最優(yōu)二叉樹”,為了紀(jì)念他呢,我們稱之為“哈夫曼樹”。哈夫曼樹可以用于哈夫曼編碼,編碼的話學(xué)問可就大了,比如用于壓縮,用于密碼學(xué)等。今天一起來看看哈夫曼樹到底是什么東東。
概念
當(dāng)然,套路之一,首先我們要了解一些基本概念。
1、路徑長度:從樹中的一個結(jié)點到另一個結(jié)點之間的分支構(gòu)成這兩個結(jié)點的路徑,路徑上的分支數(shù)目稱為路徑長度。
2、樹的路徑長度:從樹根到每一個結(jié)點的路徑長度之和,我們所說的完全二叉樹就是這種路徑長度最短的二叉樹。
3、樹的帶權(quán)路徑長度:如果在樹的每一個葉子結(jié)點上賦上一個權(quán)值,那么樹的帶權(quán)路徑長度就等于根結(jié)點到所有葉子結(jié)點的路徑長度與葉子結(jié)點權(quán)值乘積的總和。
那么我們怎么判斷一棵樹是否為最優(yōu)二叉樹呢,先看看下面幾棵樹:
他們的帶權(quán)長度分別為:
WPL1:7*2+5*2+2*2+4*2=36
WPL2:7*3+5*3+2*1+4*2=46
WPL3:7*1+5*2+2*3+4*3=35
很明顯,第三棵樹的帶權(quán)路徑最短(不信的小伙伴可以試一試,要是能找到更短的,估計能拿圖靈獎了),這就是我們所說的“最優(yōu)二叉樹(哈夫曼樹)”,它的構(gòu)建方法很簡單,依次選取權(quán)值最小的結(jié)點放在樹的底部,將最小的兩個連接構(gòu)成一個新結(jié)點,需要注意的是構(gòu)成的新結(jié)點的權(quán)值應(yīng)該等于這兩個結(jié)點的權(quán)值之和,然后要把這個新結(jié)點放回我們需要構(gòu)成樹的結(jié)點中繼續(xù)進(jìn)行排序,這樣構(gòu)成的哈夫曼樹,所有的存儲有信息的結(jié)點都在葉子結(jié)點上。
概念講完,可能有點小伙伴還是“不明覺厲”。
下面舉個例子構(gòu)建一下就清楚了。
有一個字符串:aaaaaaaaaabbbbbaaaaaccccccccddddddfff
第一步,我們先統(tǒng)計各個字符出現(xiàn)的次數(shù),稱之為該字符的權(quán)值。a 15 ,b 5, c 8, d 6, f 3。
第二步,找去這里面權(quán)值最小的兩個字符,b5和f3,構(gòu)建節(jié)點。
然后將f3和b5去掉,現(xiàn)在是a15,c8,d6,fb8。
第三步,重復(fù)第二步,直到構(gòu)建出只剩一個節(jié)點。
現(xiàn)在是dfb14,a15,c8。
最后,
ok,這樣我們的哈夫曼樹就構(gòu)造完成了。
構(gòu)建的步驟
按照上面的邏輯,總結(jié)起來,就是一下幾個步驟:
1.統(tǒng)計字符串中字符以及字符的出現(xiàn)次數(shù);
2.根據(jù)第一步的結(jié)構(gòu),創(chuàng)建節(jié)點;
3.對節(jié)點權(quán)值升序排序;
4.取出權(quán)值最小的兩個節(jié)點,生成一個新的父節(jié)點;
5.刪除權(quán)值最小的兩個節(jié)點,將父節(jié)點存放到列表中;
6.重復(fù)第四五步,直到剩下一個節(jié)點;
7.將最后的一個節(jié)點賦給根節(jié)點。
java代碼
原理說完了,接下來是代碼實現(xiàn)了。
首先需要有個節(jié)點類來存放數(shù)據(jù)。
package huffman; /** * 節(jié)點類 * @author yuxiu * */ public class Node { public String code;// 節(jié)點的哈夫曼編碼 public int codeSize;// 節(jié)點哈夫曼編碼的長度 public String data;// 節(jié)點的數(shù)據(jù) public int count;// 節(jié)點的權(quán)值 public Node lChild; public Node rChild; public Node() { } public Node(String data, int count) { this.data = data; this.count = count; } public Node(int count, Node lChild, Node rChild) { this.count = count; this.lChild = lChild; this.rChild = rChild; } public Node(String data, int count, Node lChild, Node rChild) { this.data = data; this.count = count; this.lChild = lChild; this.rChild = rChild; } }
然后就是實現(xiàn)的過程了。
package huffman; import java.io.*; import java.util.*; public class Huffman { private String str;// 最初用于壓縮的字符串 private String newStr = "";// 哈夫曼編碼連接成的字符串 private Node root;// 哈夫曼二叉樹的根節(jié)點 private boolean flag;// 最新的字符是否已經(jīng)存在的標(biāo)簽 private ArrayList<String> charList;// 存儲不同字符的隊列 相同字符存在同一位置 private ArrayList<Node> NodeList;// 存儲節(jié)點的隊列 15 16 /** * 構(gòu)建哈夫曼樹 * * @param str */ public void creatHfmTree(String str) { this.str = str; charList = new ArrayList<String>(); NodeList = new ArrayList<Node>(); // 1.統(tǒng)計字符串中字符以及字符的出現(xiàn)次數(shù) // 基本思想是將一段無序的字符串如ababccdebed放到charList里,分別為aa,bbb,cc,dd,ee // 并且列表中字符串的長度就是對應(yīng)的權(quán)值 for (int i = 0; i < str.length(); i++) { char ch = str.charAt(i); // 從給定的字符串中取出字符 flag = true; for (int j = 0; j < charList.size(); j++) { if (charList.get(j).charAt(0) == ch) {// 如果找到了同一字符 String s = charList.get(j) + ch; charList.set(j, s); flag = false; break; } } if (flag) { charList.add(charList.size(), ch + ""); } } // 2.根據(jù)第一步的結(jié)構(gòu),創(chuàng)建節(jié)點 for (int i = 0; i < charList.size(); i++) { String data = charList.get(i).charAt(0) + ""; // 獲取charList中每段字符串的首個字符 int count = charList.get(i).length(); // 列表中字符串的長度就是對應(yīng)的權(quán)值 Node node = new Node(data, count); // 創(chuàng)建節(jié)點對象 NodeList.add(i, node); // 加入到節(jié)點隊列 } // 3.對節(jié)點權(quán)值升序排序 Sort(NodeList); while (NodeList.size() > 1) {// 當(dāng)節(jié)點數(shù)目大于一時 // 4.取出權(quán)值最小的兩個節(jié)點,生成一個新的父節(jié)點 // 5.刪除權(quán)值最小的兩個節(jié)點,將父節(jié)點存放到列表中 Node left = NodeList.remove(0); Node right = NodeList.remove(0); int parentWeight = left.count + right.count;// 父節(jié)點權(quán)值等于子節(jié)點權(quán)值之和 Node parent = new Node(parentWeight, left, right); NodeList.add(0, parent); // 將父節(jié)點置于首位 } // 6.重復(fù)第四五步,就是那個while循環(huán) // 7.將最后的一個節(jié)點賦給根節(jié)點 root = NodeList.get(0); } /** * 升序排序 * * @param nodelist */ public void Sort(ArrayList<Node> nodelist) { for (int i = 0; i < nodelist.size() - 1; i++) { for (int j = i + 1; j < nodelist.size(); j++) { Node temp; if (nodelist.get(i).count > nodelist.get(j).count) { temp = nodelist.get(i); nodelist.set(i, nodelist.get(j)); nodelist.set(j, temp); } } } } /** * 遍歷 * * @param node * 節(jié)點 */ public void output(Node node) { if (node.lChild != null) { output(node.lChild); } System.out.print(node.count + " "); // 中序遍歷 if (node.rChild != null) { output(node.rChild); } } public void output() { output(root); } /** * 主方法 * * @param args */ public static void main(String[] args) { Huffman huff = new Huffman();//創(chuàng)建哈弗曼對象 huff.creatHfmTree("sdfassvvdfgsfdfsdfs");//構(gòu)造樹 }
總結(jié)
以上就是基于JAVA實現(xiàn)哈夫曼樹的全部內(nèi)容,希望這篇文章對大家學(xué)習(xí)使用JAVA能有所幫助。如果有疑問可以留言討論。
相關(guān)文章
Mybatis模糊查詢之三種定義參數(shù)方法和聚合查詢、主鍵回填實現(xiàn)方法
這篇文章主要介紹了Mybatis模糊查詢之三種定義參數(shù)方法和聚合查詢、主鍵回填實現(xiàn)方法,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2023-03-03springboot跨域如何設(shè)置SameSite的實現(xiàn)
這篇文章主要介紹了springboot跨域如何設(shè)置SameSite的實現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-05-05Mybatis-Plus實現(xiàn)用戶ID自增出現(xiàn)的問題解決
項目基于 SpringBoot + MybatisPlus 3.5.2 使用數(shù)據(jù)庫自增ID時, 出現(xiàn)重復(fù)鍵的問題,本文就來介紹一下解決方法,感興趣的可以了解一下2023-09-09