圖文詳解JAVA實現(xiàn)哈夫曼樹

更新時間：2016年08月18日 09:41:45 投稿：daisy

所謂哈夫曼樹就是要求最小加權(quán)路徑長度，這是什么意思呢？簡而言之，就是要所有的節(jié)點對應的路徑長度（高度-1）乘以該節(jié)點的權(quán)值，然后保證這些結(jié)果之和最小。下面這篇文章就給大家詳細介紹

前言

我想學過數(shù)據(jù)結(jié)構(gòu)的小伙伴一定都認識哈夫曼，這位大神發(fā)明了大名鼎鼎的“最優(yōu)二叉樹”，為了紀念他呢，我們稱之為“哈夫曼樹”。哈夫曼樹可以用于哈夫曼編碼，編碼的話學問可就大了，比如用于壓縮，用于密碼學等。今天一起來看看哈夫曼樹到底是什么東東。

概念

當然，套路之一，首先我們要了解一些基本概念。

1、路徑長度：從樹中的一個結(jié)點到另一個結(jié)點之間的分支構(gòu)成這兩個結(jié)點的路徑，路徑上的分支數(shù)目稱為路徑長度。

2、樹的路徑長度：從樹根到每一個結(jié)點的路徑長度之和，我們所說的完全二叉樹就是這種路徑長度最短的二叉樹。

3、樹的帶權(quán)路徑長度：如果在樹的每一個葉子結(jié)點上賦上一個權(quán)值，那么樹的帶權(quán)路徑長度就等于根結(jié)點到所有葉子結(jié)點的路徑長度與葉子結(jié)點權(quán)值乘積的總和。

那么我們怎么判斷一棵樹是否為最優(yōu)二叉樹呢，先看看下面幾棵樹：

他們的帶權(quán)長度分別為：

WPL1：7*2+5*2+2*2+4*2=36

WPL2：7*3+5*3+2*1+4*2=46

WPL3：7*1+5*2+2*3+4*3=35

很明顯，第三棵樹的帶權(quán)路徑最短（不信的小伙伴可以試一試，要是能找到更短的，估計能拿圖靈獎了），這就是我們所說的“最優(yōu)二叉樹（哈夫曼樹）”，它的構(gòu)建方法很簡單，依次選取權(quán)值最小的結(jié)點放在樹的底部，將最小的兩個連接構(gòu)成一個新結(jié)點，需要注意的是構(gòu)成的新結(jié)點的權(quán)值應該等于這兩個結(jié)點的權(quán)值之和，然后要把這個新結(jié)點放回我們需要構(gòu)成樹的結(jié)點中繼續(xù)進行排序，這樣構(gòu)成的哈夫曼樹，所有的存儲有信息的結(jié)點都在葉子結(jié)點上。

概念講完，可能有點小伙伴還是“不明覺厲”。

下面舉個例子構(gòu)建一下就清楚了。

有一個字符串：aaaaaaaaaabbbbbaaaaaccccccccddddddfff

第一步，我們先統(tǒng)計各個字符出現(xiàn)的次數(shù)，稱之為該字符的權(quán)值。a 15 ,b 5, c 8, d 6, f 3。

第二步，找去這里面權(quán)值最小的兩個字符，b5和f3，構(gòu)建節(jié)點。

然后將f3和b5去掉，現(xiàn)在是a15,c8,d6,fb8。

第三步，重復第二步，直到構(gòu)建出只剩一個節(jié)點。

現(xiàn)在是dfb14,a15,c8。

最后，

ok,這樣我們的哈夫曼樹就構(gòu)造完成了。

構(gòu)建的步驟

按照上面的邏輯，總結(jié)起來，就是一下幾個步驟：

1.統(tǒng)計字符串中字符以及字符的出現(xiàn)次數(shù)；

2.根據(jù)第一步的結(jié)構(gòu)，創(chuàng)建節(jié)點；

3.對節(jié)點權(quán)值升序排序；

4.取出權(quán)值最小的兩個節(jié)點，生成一個新的父節(jié)點；

5.刪除權(quán)值最小的兩個節(jié)點，將父節(jié)點存放到列表中；

6.重復第四五步，直到剩下一個節(jié)點；

7.將最后的一個節(jié)點賦給根節(jié)點。

java代碼

原理說完了，接下來是代碼實現(xiàn)了。

首先需要有個節(jié)點類來存放數(shù)據(jù)。

package huffman;
/**
 * 節(jié)點類
 * @author yuxiu
 *
 */
public class Node {
 public String code;// 節(jié)點的哈夫曼編碼
 public int codeSize;// 節(jié)點哈夫曼編碼的長度
 public String data;// 節(jié)點的數(shù)據(jù)
 public int count;// 節(jié)點的權(quán)值
 public Node lChild;
 public Node rChild;

 public Node() {
 }

 public Node(String data, int count) {
  this.data = data;
  this.count = count;
 }

 public Node(int count, Node lChild, Node rChild) {
  this.count = count;
  this.lChild = lChild;
  this.rChild = rChild;
 }

 public Node(String data, int count, Node lChild, Node rChild) {
  this.data = data;
  this.count = count;
  this.lChild = lChild;
  this.rChild = rChild;
 }
}

然后就是實現(xiàn)的過程了。

package huffman;

import java.io.*;
import java.util.*;

public class Huffman {
 private String str;// 最初用于壓縮的字符串
 private String newStr = "";// 哈夫曼編碼連接成的字符串 
 private Node root;// 哈夫曼二叉樹的根節(jié)點
 private boolean flag;// 最新的字符是否已經(jīng)存在的標簽
 private ArrayList<String> charList;// 存儲不同字符的隊列 相同字符存在同一位置
 private ArrayList<Node> NodeList;// 存儲節(jié)點的隊列
 
  15  16  /**
  * 構(gòu)建哈夫曼樹
  * 
  * @param str
  */
 public void creatHfmTree(String str) {
  this.str = str;
  charList = new ArrayList<String>();
  NodeList = new ArrayList<Node>();
  // 1.統(tǒng)計字符串中字符以及字符的出現(xiàn)次數(shù)
  // 基本思想是將一段無序的字符串如ababccdebed放到charList里，分別為aa,bbb,cc,dd,ee
  // 并且列表中字符串的長度就是對應的權(quán)值
  for (int i = 0; i < str.length(); i++) {
   char ch = str.charAt(i); // 從給定的字符串中取出字符
   flag = true;
   for (int j = 0; j < charList.size(); j++) {
    if (charList.get(j).charAt(0) == ch) {// 如果找到了同一字符
     String s = charList.get(j) + ch;
     charList.set(j, s);
     flag = false;
     break;
    }
   }
   if (flag) {
    charList.add(charList.size(), ch + "");
   }
  }
  // 2.根據(jù)第一步的結(jié)構(gòu)，創(chuàng)建節(jié)點
  for (int i = 0; i < charList.size(); i++) {
   String data = charList.get(i).charAt(0) + ""; // 獲取charList中每段字符串的首個字符
   int count = charList.get(i).length(); // 列表中字符串的長度就是對應的權(quán)值
   Node node = new Node(data, count); // 創(chuàng)建節(jié)點對象
   NodeList.add(i, node); // 加入到節(jié)點隊列
  }

  // 3.對節(jié)點權(quán)值升序排序
  Sort(NodeList);
  while (NodeList.size() > 1) {// 當節(jié)點數(shù)目大于一時
   // 4.取出權(quán)值最小的兩個節(jié)點，生成一個新的父節(jié)點
   // 5.刪除權(quán)值最小的兩個節(jié)點，將父節(jié)點存放到列表中
   Node left = NodeList.remove(0);
   Node right = NodeList.remove(0);
   int parentWeight = left.count + right.count;// 父節(jié)點權(quán)值等于子節(jié)點權(quán)值之和
   Node parent = new Node(parentWeight, left, right);
   NodeList.add(0, parent); // 將父節(jié)點置于首位

  }
  // 6.重復第四五步，就是那個while循環(huán)
  // 7.將最后的一個節(jié)點賦給根節(jié)點
  root = NodeList.get(0);
 }
 /**
  * 升序排序
  * 
  * @param nodelist
  */
 public void Sort(ArrayList<Node> nodelist) {
  for (int i = 0; i < nodelist.size() - 1; i++) {
   for (int j = i + 1; j < nodelist.size(); j++) {
    Node temp;
    if (nodelist.get(i).count > nodelist.get(j).count) {
     temp = nodelist.get(i);
     nodelist.set(i, nodelist.get(j));
     nodelist.set(j, temp);
    }

   }
  }

 }

 /**
  * 遍歷
  * 
  * @param node
  *   節(jié)點
  */
 public void output(Node node) {
  if (node.lChild != null) {
   output(node.lChild);
  }
  System.out.print(node.count + " "); // 中序遍歷
  if (node.rChild != null) {
   output(node.rChild);
  }
 }

 public void output() {
  output(root);
 }
/**
  * 主方法
  * 
  * @param args
  */
 public static void main(String[] args) {
  Huffman huff = new Huffman();//創(chuàng)建哈弗曼對象
  huff.creatHfmTree("sdfassvvdfgsfdfsdfs");//構(gòu)造樹
 }

總結(jié)

以上就是基于JAVA實現(xiàn)哈夫曼樹的全部內(nèi)容，希望這篇文章對大家學習使用JAVA能有所幫助。如果有疑問可以留言討論。

您可能感興趣的文章: