欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

C++詳解哈夫曼樹的概念與實現(xiàn)步驟

 更新時間:2022年04月24日 16:37:41   作者:BugMaker-shen  
給定N個權值作為N個葉子結點,構造一棵二叉樹,若該樹的帶權路徑長度達到最小,稱這樣的二叉樹為最優(yōu)二叉樹,也稱為哈夫曼樹(Huffman?Tree)。哈夫曼樹是帶權路徑長度最短的樹,權值較大的結點離根較近

一、基本概念

結點的權: 有某種現(xiàn)實含義的數(shù)值

結點的帶權路徑長度: 從結點的根到該結點的路徑長度與該結點權值的乘積

樹的帶權路徑長度: 樹上所有葉結點的帶權路徑長度之和

哈夫曼樹: 在含有 n n n個帶權葉結點的二叉樹中, w p l wpl wpl 最小 的二叉樹稱為哈夫曼樹,也稱最優(yōu)二叉樹(給定葉子結點,哈夫曼樹不唯一)。

二、構造哈夫曼樹

比較簡單,此處不贅述步驟

三、哈夫曼樹的基本性質

  • 每個初始結點最終都是葉結點,且權值越小的結點到根結點的路徑長度越大
  • 具有 n n n個根結點的哈夫曼樹的結點總數(shù)為 2 n − 1
  • 哈夫曼樹中不存在度為1的結點
  • 哈夫曼樹不唯一,但 w p l必然相同且最優(yōu)

四、哈夫曼編碼

目的:為給定的字符集合構建二進制編碼,使得編碼的期望長度達到最短

在考試中,小渣利用哈夫曼編碼老渣發(fā)電報傳遞100道選擇題的答案,小渣傳遞了10個A、8個B、80個C、2個D,老渣利用哈夫曼編碼的方式解碼。

小渣構造的哈夫曼樹如下:

可以發(fā)現(xiàn),A、B、C、D的編碼分別為10、111、0、110。

這樣小渣只要根據(jù)1~100題的答案順序發(fā)送01序列,老渣收到后進行解碼就能正確收到答案了。而且哈夫曼編碼的方式不會有歧義,因為哈夫曼編碼是一種前綴編碼。

前綴編碼: 沒有一個編碼是另一個編碼的前綴,因為數(shù)據(jù)節(jié)點都是葉子節(jié)點。如果出現(xiàn)一個字符的編碼是另一個字符編碼的前綴,那這個字符一定處于內部節(jié)點,這是不可能的

由哈夫曼樹得到的哈夫曼編碼: 字符集中的每個字符都是以葉子結點出現(xiàn)在哈夫曼樹中,各個字符出現(xiàn)的頻率為結點的權值。

給字符串進行編碼的時候,由于出現(xiàn)頻率越高(權值大)的字符距離根節(jié)點越進,編碼越短;只有出現(xiàn)頻率越低(權值?。┑淖址嚯x根節(jié)點較遠,編碼長。沒關系,由于頻率高的字符編碼都短,所以哈夫曼編碼可以得到最短的編碼序列

五、哈夫曼解碼

哈夫曼編碼不同于ASCII和Unicode這些字符編碼,這些字符集中的碼長都采用的是長度相同的編碼方案,而哈夫曼編碼使用的是變長編碼,而且哈夫曼編碼滿足立刻可解碼性(就是說任一字符的編碼都不會是另一個更長字符編碼的前綴),只要當某個字符的編碼中所有位被全部接收時,可以立即進行解碼而無須等待后面接收的位來決定是否存在另一個合法的更長的編碼

第一張表不滿足立刻可解碼性,第二張表滿足

我們接收100的時候,需要考慮是立刻解碼成D還是等待接收下一位,如果下一位是0就可以解碼成B,這就說明表中的編碼不具有立刻可解碼性

第二張表就具有立刻可解碼性,因為任一字符的編碼都不是另一個更長字符編碼的前綴。只要收到的序列對應了某個字符的編碼,直接解碼成對應字符即可,無需等待后面的數(shù)據(jù)

我們的代碼實現(xiàn)是用字符串構建哈夫曼樹,只能針對由該字符串包含的字符組成的字符串進行編解碼。代碼里使用字符串存儲的編碼,實際上應該用bit進行存儲

#include <iostream>
#include <string>
#include <vector>
#include <functional>
#include <unordered_map>
#include <queue>
using namespace std;
using uint = unsigned int;
class HuffmanTree {
public:
    // 這里的lambda表達式用來初始化function函數(shù)對象
    // priority_queue的構造函數(shù)指出,如果傳入一個參數(shù),那這個參數(shù)用來初始化比較器對象
    // 如果傳入兩個參數(shù),第一個是比較器對象,第二個是底層容器
    HuffmanTree()
        :min_heap_([](Node* n1, Node* n2)->bool {return n1->weight_ > n2->weight_; })
        , root_(nullptr)
    {}
    ~HuffmanTree() {
        init();
        cout << "已釋放所有內存!" << endl;
    }
    // 根據(jù)字符串創(chuàng)建哈夫曼樹
    void create(const string& str) {
        if (root_ != nullptr) {
            cout << "哈夫曼樹初始化..." << endl;
            init();
            cout << "初始化完成!" << endl;
        }
        // 統(tǒng)計頻率(權重)
        unordered_map<char, uint> w_map;
        for (char c : str) {
            w_map[c]++;
        }
        // 遍歷w_map,把所有的字符對應的權重放入小根堆,按照權重排序
        for (pair<const char, uint>& p : w_map) {
            min_heap_.push(new Node(p.first, p.second));
        }
        // 根據(jù)優(yōu)先級隊列,從小根堆中取出節(jié)點,構建哈夫曼樹
        while (min_heap_.size() > 1) {
            Node* n1 = min_heap_.top();
            min_heap_.pop();
            Node* n2 = min_heap_.top();
            min_heap_.pop();
            Node* node = new Node('\0', n1->weight_ + n2->weight_);  // 內部節(jié)點存\0
            node->left_ = n1;
            node->right_ = n2;
            min_heap_.push(node);
        }
        root_ = min_heap_.top();
        min_heap_.pop();
        // 創(chuàng)建完哈夫曼樹,直接對傳入的海量字符進行編碼并存儲到code_map_
        create_huffman_code(str);
    }
    string get_code(const string& str) {
        // 利用哈夫曼樹對str編碼并返回
        string code;
        for (char c : str) {
            code += code_map_[c];
        }
        return code;
    }
    void show_huffman_code() const {
        // 打印哈夫曼編碼
        for (const auto& pair : code_map_) {
            cout << pair.first << " : " << pair.second << endl;
        }
    }
    string decode(const string& encode_str) {
        Node* cur = root_;
        string decode_str;
        for (char c : encode_str) {
            if (c == '0') {
                cur = cur->left_;
            }
            else {
                cur = cur->right_;
            }
            if (cur->left_ == nullptr && cur->right_ == nullptr) {
                // 到達葉子節(jié)點
                decode_str.push_back(cur->data_);
                cur = root_;
            }
        }
        return decode_str;
    }
    uint get_wpl() {
        if (root_ == nullptr) {
            return 0;
        }
        if (root_->left_ == nullptr && root_->right_ == nullptr) {
            // 對于葉子節(jié)點,直接返回自己的weight * depth
            return root_->weight_ * 1;
        }
        else {
            // 對于內部節(jié)點,直接返回從子節(jié)點拿到的weight之和
            return get_w(root_->left_, 2) + get_w(root_->right_, 2);
        }
    }
private:
    struct Node {
        Node(char data, uint weight)
            :data_(data)
            , weight_(weight)
            , left_(nullptr)
            , right_(nullptr)
        {}
        char data_;
        uint weight_;
        Node* left_;
        Node* right_;
    };
private:
    // 防止當前對象重新構建哈夫曼樹,釋放所有的節(jié)點,然后初始化私有成員
    void init() {
        // 釋放哈夫曼樹的節(jié)點
        if (root_ != nullptr) {
            queue<Node*> q;
            q.push(root_);
            while (!q.empty()) {
                Node* node = q.front();
                q.pop();
                if (node->left_ != nullptr) {
                    q.push(node->left_);
                }
                if (node->right_ != nullptr) {
                    q.push(node->right_);
                }
                delete node;
            }
            MinHeap empty([](Node* n1, Node* n2)->bool {return n1->weight_ > n2->weight_; });
            swap(empty, min_heap_);
            code_map_.clear();
        }
    }
    void create_huffman_code(const string& str) {
        string code;
        create_huffman_code(root_, code);
    }
    void create_huffman_code(Node* node, string code) {
        if (node->left_ == nullptr && node->right_ == nullptr) {
            code_map_[node->data_] = code;
            return;
        }
        create_huffman_code(node->left_, code + "0");
        create_huffman_code(node->right_, code + "1");
    }
    uint get_w(Node* node, int depth) {
        if (node == nullptr) {
            return 0;
        }
        if (node->left_ == nullptr && node->right_ == nullptr) {
            // 對于葉子節(jié)點,直接返回自己的weight * depth
            return node->weight_ * depth;
        }
        else {
            // 對于內部節(jié)點,直接返回從子節(jié)點拿到的weight之和
            return get_w(node->left_, depth + 1) + get_w(node->right_, depth + 1);
        }
    }
private:    
    Node* root_;
    unordered_map<char, string> code_map_;  // 存儲字符對應的哈夫曼編碼
    using MinHeap = priority_queue<Node*, vector<Node*>, function<bool(Node*, Node*)>>;
    MinHeap min_heap_; // 構建哈夫曼樹的時候使用小根堆
};
int main() {
    string str = "Aa";
    HuffmanTree htree;
    htree.create(str);
    htree.show_huffman_code();
    cout << htree.get_wpl() << endl;
    str = "ABC";
    htree.create(str);
    htree.show_huffman_code();
    cout << htree.get_wpl() << endl;;
    string encode = htree.get_code(str);
    cout << "encode:" << encode << endl;
    cout << "decode:" << htree.decode(encode) << endl;
    return 0;
}

六、文件的壓縮和解壓縮

我們利用哈夫曼編碼壓縮文件的時候,如果文件是100M,我們可以壓縮成20M,如果文件時1K,我們可能壓縮成2K,當文件較小的時候,我們得到的壓縮文件反而更大了,這是為什么?

文件的壓縮過程如下:

  • 按字節(jié)讀取原文件的所有內容,并統(tǒng)計字節(jié)數(shù)據(jù)的權值,構建哈夫曼樹
  • 通過哈夫曼樹,得到文件的哈夫曼編碼
  • 把文件的內容按字節(jié)進行編碼,將編碼內容按bit存儲成壓縮文件,還要存儲文件字節(jié)數(shù)據(jù)以及權值

解碼的過程如下:

  • 讀取原始文件的字節(jié)數(shù)據(jù)以及權值,構建哈夫曼樹
  • 讀取壓縮文件的01碼,利用哈夫曼樹對01進行解碼,將解碼數(shù)據(jù)存儲成新的文件,就解碼出了原始文件

由于壓縮文件不僅存儲01碼,還需要存儲文件字節(jié)數(shù)據(jù)以及權值用來重建哈夫曼樹(就是代碼中的w_map)。當原始文件較小時,文件字節(jié)數(shù)據(jù)以及權值可能大于原始文件的大小,故小文件壓縮后可能變大

到此這篇關于C++詳解哈夫曼樹的概念與實現(xiàn)步驟的文章就介紹到這了,更多相關C++哈夫曼樹內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • C++ Virtual關鍵字的具體使用

    C++ Virtual關鍵字的具體使用

    這篇文章主要介紹了C++ Virtual關鍵字的具體使用,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-11-11
  • php正則表達式的基本語法總結

    php正則表達式的基本語法總結

    以下是對php正則表達式的基本語法進行了詳細的總結介紹,需要的朋友可以過來參考下
    2013-10-10
  • c++調用windows鍵盤代碼詳情

    c++調用windows鍵盤代碼詳情

    c++調用windows鍵盤有好幾種方式,本文就根據(jù)列舉的例子對c++調用windows鍵盤詳細介紹并附上代碼說明,需要的朋友可以參考下面文章的具體內容
    2021-09-09
  • C語言清除scanf()緩存的案例講解

    C語言清除scanf()緩存的案例講解

    今天小編就為大家分享一篇關于C語言清除scanf()緩存的案例講解,小編覺得內容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-03-03
  • C語言putenv()函數(shù)和getenv()函數(shù)的使用詳解

    C語言putenv()函數(shù)和getenv()函數(shù)的使用詳解

    這篇文章主要介紹了C語言putenv()函數(shù)和getenv()函數(shù)的使用詳解,用來進行環(huán)境變量的相關操作,需要的朋友可以參考下
    2015-09-09
  • C++?STL反向迭代器的實現(xiàn)

    C++?STL反向迭代器的實現(xiàn)

    本文主要介紹了C++?STL反向迭代器的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2022-07-07
  • C++實現(xiàn)RSA加密解密算法是示例代碼

    C++實現(xiàn)RSA加密解密算法是示例代碼

    非對稱加密方式可以使通信雙方無需事先交換密鑰就可以建立安全通信,因此被廣泛應用于身份認證、數(shù)字簽名、等信息交換領域。其中最具有代表性的非對稱加密方式就是RSA公鑰密碼體制。本文將用C++實現(xiàn)RSA加密解密算法,需要的可以參考一下
    2022-09-09
  • 深入剖析C語言中qsort函數(shù)的實現(xiàn)原理

    深入剖析C語言中qsort函數(shù)的實現(xiàn)原理

    這篇文章主要介紹了C語言中qsort函數(shù)的實現(xiàn)原理,本文將從回調函數(shù),qsort函數(shù)的應用,qsort函數(shù)的實現(xiàn)原理三個方面進行講解,并通過代碼示例講解的非常詳細,需要的朋友可以參考下
    2024-03-03
  • Qt項目打包的實現(xiàn)步驟

    Qt項目打包的實現(xiàn)步驟

    本文主要介紹了Qt項目打包的實現(xiàn)步驟,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2022-05-05
  • FFmpeg中avfilter模塊的介紹與使用

    FFmpeg中avfilter模塊的介紹與使用

    FFmpeg中的libavfilter模塊(或庫)用于filter(過濾器),?filter可以有多個輸入和多個輸出,下面就跟隨小編一起簡單學習一下它的巨日使用吧
    2023-08-08

最新評論