快捷導(dǎo)航

堆排序原理及算法代碼詳解

更新時(shí)間：2021年08月11日 14:46:49 作者：抽離的心

這篇文章主要介紹了堆排序算法的講解及Java版實(shí)現(xiàn),堆排序基于堆這種數(shù)據(jù)結(jié)構(gòu),在本文中對(duì)堆的概念也有補(bǔ)充介紹,需要的朋友可以參考下

一、堆排序算法原理和動(dòng)態(tài)圖解

將待排序的序列構(gòu)造成一個(gè)大頂堆。此時(shí)，整個(gè)序列的最大值就是堆頂?shù)母?jié)點(diǎn)。將它移走(其實(shí)就是將其與堆數(shù)組的末尾元素交換，此時(shí)末尾元素就是最大值)，然后將剩余的n-1個(gè)序列重新構(gòu)造成一個(gè)堆，這樣就會(huì)得到n個(gè)元素中的次最大值。如此反復(fù)執(zhí)行，就能得到一個(gè)有序序列了。這個(gè)過(guò)程其實(shí)就是先構(gòu)建一個(gè)最大/最小二叉堆，然后不停的取出最大/最小元素（頭結(jié)點(diǎn)），插入到新的隊(duì)列中，以此達(dá)到排序的目的。如下圖所示：

二、二叉樹(shù)定義

要了解堆首先得了解一下二叉樹(shù)，在計(jì)算機(jī)科學(xué)中，二叉樹(shù)是每個(gè)節(jié)點(diǎn)最多有兩個(gè)子樹(shù)的樹(shù)結(jié)構(gòu)。通常子樹(shù)被稱(chēng)作“左子樹(shù)”(left subtree)和“右子樹(shù)”(right subtree)。二叉樹(shù)常被用于實(shí)現(xiàn)二叉查找樹(shù)和二叉堆。二叉樹(shù)的每個(gè)結(jié)點(diǎn)至多只有二棵子樹(shù)（不存在度大于 2 的結(jié)點(diǎn)），二叉樹(shù)的子樹(shù)有左右之分，次序不能顛倒。二叉樹(shù)的第 i 層至多有 2i - 1 個(gè)結(jié)點(diǎn)；深度為 k 的二叉樹(shù)至多有 2k - 1 個(gè)結(jié)點(diǎn)；對(duì)任何一棵二叉樹(shù) T，如果其終端結(jié)點(diǎn)數(shù)為 n0，度為 2 的結(jié)點(diǎn)數(shù)為 n2，則n0 = n2 + 1。二叉樹(shù)又分為完全二叉樹(shù)（complete binary tree）和滿二叉樹(shù)（full binary tree）。樹(shù)和二叉樹(shù)的三個(gè)主要差別：

樹(shù)的結(jié)點(diǎn)個(gè)數(shù)至少為 1，而二叉樹(shù)的結(jié)點(diǎn)個(gè)數(shù)可以為 0
樹(shù)中結(jié)點(diǎn)的最大度數(shù)沒(méi)有限制，而二叉樹(shù)結(jié)點(diǎn)的最大度數(shù)為 2
樹(shù)的結(jié)點(diǎn)無(wú)左、右之分，而二叉樹(shù)的結(jié)點(diǎn)有左、右之分

1.滿二叉樹(shù)：一棵深度為 k，且有 2k - 1 個(gè)節(jié)點(diǎn)稱(chēng)之為滿二叉樹(shù)，即每一層上的節(jié)點(diǎn)數(shù)都是最大節(jié)點(diǎn)數(shù)。如下圖b所示：深度為3的滿二叉樹(shù)。

2.完全二叉樹(shù)：而在一棵二叉樹(shù)中，除最后一層外，若其余層都是滿的，并且最后一層或者是滿的，或者是在右邊缺少連續(xù)若干節(jié)點(diǎn)，則此二叉樹(shù)為完全二叉樹(shù)（Complete Binary Tree）。如下圖a所示：是一個(gè)深度為4的完全二叉樹(shù)。

三、堆的定義

堆（二叉堆）可以視為一棵完全的二叉樹(shù)，完全二叉樹(shù)的一個(gè)“優(yōu)秀”的性質(zhì)是，除了最底層之外，每一層都是滿的，這使得堆可以利用數(shù)組來(lái)表示（普通的一般的二叉樹(shù)通常用鏈表作為基本容器表示），每一個(gè)結(jié)點(diǎn)對(duì)應(yīng)數(shù)組中的一個(gè)元素。

對(duì)于7在數(shù)組存放的position=2，而它的子元素6的position=5=2*2[也就是父元素存放的位置]+1、子元素4的position=6=2*2[也就是父元素存放的位置]+2;同樣對(duì)于11在在數(shù)組存放的position=0，而它的子元素10的position=1=2*0[也就是父元素存放的位置]+1、子元素7的position=2=2*0[也就是父元素存放的位置]+2;所以對(duì)于i個(gè)元素，它的左右子節(jié)點(diǎn)在下標(biāo)以0開(kāi)始的數(shù)組中的位置分別為：2*i+1、2*i+2。那腦補(bǔ)一下，對(duì)于不完全二叉樹(shù)，如果用數(shù)組來(lái)存放會(huì)有什么問(wèn)題呢？當(dāng)然是中間有很多空的元素啦，所以說(shuō)對(duì)于不完全二叉樹(shù)最好是用鏈表來(lái)存儲(chǔ)~。

堆的構(gòu)建過(guò)程示例：建堆的核心內(nèi)容是調(diào)整堆，使二叉樹(shù)滿足堆的定義（每個(gè)節(jié)點(diǎn)的值都不大于其父節(jié)點(diǎn)的值）。調(diào)堆的過(guò)程應(yīng)該從最后一個(gè)非葉子節(jié)點(diǎn)開(kāi)始，假設(shè)有數(shù)組A = {1, 3, 4, 5, 7, 2, 6, 8, 0}。那么調(diào)堆的過(guò)程如下圖，數(shù)組下標(biāo)從0開(kāi)始，A[3] = 5開(kāi)始。分別與左孩子和右孩子比較大小，如果A[3]最大，則不用調(diào)整，否則和孩子中的值最大的一個(gè)交換位置，在圖1中是A[7] > A[3] > A[8]，所以A[3]與A[7]對(duì)換，從圖1.1轉(zhuǎn)到圖1.2。

二叉堆（英語(yǔ)：binary heap）是一種特殊的堆，二叉堆是完全二叉樹(shù)或者是近似完全二叉樹(shù)。二叉堆滿足堆特性：父節(jié)點(diǎn)的鍵值總是保持固定的序關(guān)系于任何一個(gè)子節(jié)點(diǎn)的鍵值，且每個(gè)節(jié)點(diǎn)的左子樹(shù)和右子樹(shù)都是一個(gè)二叉堆。當(dāng)父節(jié)點(diǎn)的鍵值總是大于或等于任何一個(gè)子節(jié)點(diǎn)的鍵值時(shí)為最大堆。當(dāng)父節(jié)點(diǎn)的鍵值總是小于或等于任何一個(gè)子節(jié)點(diǎn)的鍵值時(shí)為最小堆。二叉堆一般用數(shù)組來(lái)表示。如果根節(jié)點(diǎn)在數(shù)組中的位置是1，第n個(gè)位置的子節(jié)點(diǎn)分別在2n和 2n+1。因此，第1個(gè)位置的子節(jié)點(diǎn)在2和3，第2個(gè)位置的子節(jié)點(diǎn)在4和5。以此類(lèi)推。這種基于1的數(shù)組存儲(chǔ)方式便于尋找父節(jié)點(diǎn)和子節(jié)點(diǎn)。如果存儲(chǔ)數(shù)組的下標(biāo)基于0，那么下標(biāo)為i的節(jié)點(diǎn)的子節(jié)點(diǎn)是2i + 1與2i + 2；其父節(jié)點(diǎn)的下標(biāo)是⌊floor((i − 1) ∕ 2)⌋。函數(shù)floor(x)的功能是“向下取整”，或者說(shuō)“向下舍入”，即取不大于x的最大整數(shù)（與“四舍五入”不同，向下取整是直接取按照數(shù)軸上最接近要求值的左邊值，即不大于要求值的最大的那個(gè)值）。比如floor(1.1)、floor(1.9)都返回1。對(duì)于堆定義中的堆結(jié)構(gòu)插入元素：對(duì)于二叉堆來(lái)說(shuō)，要插入一個(gè)新元素其整個(gè)過(guò)程是怎么樣的呢？這里還是以我們之前的那個(gè)二叉堆進(jìn)行說(shuō)明，以插入"9"為例：

目前肯定不滿足二叉堆的要求，父接點(diǎn)6是小于新插入的節(jié)點(diǎn)9的，所以兩者進(jìn)行位置交換：

同樣的思路，父節(jié)點(diǎn)7比子節(jié)點(diǎn)9要小，所以需要調(diào)換位置:

至此元素插入完成，也符合二叉堆父元素大于子元素的規(guī)則，從添加過(guò)程中可以發(fā)現(xiàn)：只需更改待比較的元素，其它的任何元素位置不需要?jiǎng)?，所以效率還是很高的。對(duì)于堆定義中的堆結(jié)構(gòu)刪除元素：這里以刪除根結(jié)點(diǎn)為例【因?yàn)閯h除根節(jié)點(diǎn)是最重要的，所以以它為例】，整個(gè)過(guò)程如下：

這時(shí)當(dāng)然是不符合二叉堆的規(guī)則，接著這樣來(lái)做：

同理繼續(xù)進(jìn)行處理：

繼續(xù)：

經(jīng)過(guò)這些動(dòng)作之后就將一個(gè)根結(jié)點(diǎn)給刪除掉了，可以發(fā)現(xiàn)其實(shí)跟插入一個(gè)元素一樣，只需更改待比較的元素，其它的任何元素位置不需要?jiǎng)?，那像這種每次移除掉最大的值有啥用呢？堆排序就產(chǎn)生了，因?yàn)槊看螐母?jié)點(diǎn)拿肯定是最大的數(shù)【以最大堆來(lái)說(shuō)】，這樣拿出來(lái)的數(shù)就成了一個(gè)有序的數(shù)列了。注意：對(duì)于一個(gè)很大的堆，這種存儲(chǔ)是低效的。因?yàn)楣?jié)點(diǎn)的子節(jié)點(diǎn)很可能在另外一個(gè)內(nèi)存頁(yè)中。B-heap是一種效率更高的存儲(chǔ)方式，把每個(gè)子樹(shù)放到同一內(nèi)存頁(yè)。如果用指針鏈表存儲(chǔ)堆，那么需要能訪問(wèn)葉節(jié)點(diǎn)的方法。可以對(duì)二叉樹(shù)“穿線”(threading)方式，來(lái)依序遍歷這些節(jié)點(diǎn)。

四、堆排序Java代碼實(shí)現(xiàn)

package com.luna.sort;
public class HeapSortMaxAndMin{
	public static void main(String[] args) {
		int[] array = { 19, 38, 7, 36, 5, 5, 3, 2, 1, 0, 56 };
		System.out.println("排序前:");
		for (int i = 0; i < array.length; i++) {
			System.out.print(array[i] + ",");
		}
		System.out.println();
		System.out.println("分割線---------------");
		heapSort(array);
		System.out.println("排序后:");
		for (int i = 0; i < array.length; i++) {
			System.out.print(array[i] + ",");
		}
	}
	public static void heapSort(int[] array) {
		if (array == null || array.length == 1)
			return;
		buildArrayToHeap(array); //將數(shù)組元素轉(zhuǎn)化為大頂堆/小頂堆
		for (int i = array.length - 1; i >= 1; i--) {
			// 經(jīng)過(guò)上面的一些列操作，目前array[0]是當(dāng)前數(shù)組里最大的元素，需要和末尾的元素交換，然后拿出最大的元素
			swap(array, 0, i);
			/**
			 * 交換完后，下次遍歷的時(shí)候，就應(yīng)該跳過(guò)最后一個(gè)元素，也就是最大的那個(gè)
			 * 值，然后開(kāi)始重新構(gòu)建最大堆堆的大小就減去1，然后從0的位置開(kāi)始最大堆
			 */
//			buildMaxHeap(array, i, 0);
			buildMinHeap(array, i, 0);
		}
	}
	// 構(gòu)建堆
	public static void buildArrayToHeap(int[] array) {
		if (array == null || array.length == 1)
			return;
		//遞推公式就是 int root = 2*i, int left = 2*i+1, int right = 2*i+2;
		int cursor = array.length / 2;
		for (int i = cursor; i >= 0; i--) { // 這樣for循環(huán)下，就可以第一次排序完成
//			buildMaxHeap(array, array.length, i);
			buildMinHeap(array, array.length, i);
		}
	}
	//大頂堆
	public static void buildMaxHeap(int[] array, int heapSieze, int index) {
		int left = index * 2 + 1; // 左子節(jié)點(diǎn)
		int right = index * 2 + 2; // 右子節(jié)點(diǎn)
		int maxValue = index; // 暫時(shí)定在Index的位置就是最大值
		// 如果左子節(jié)點(diǎn)的值，比當(dāng)前最大的值大，就把最大值的位置換成左子節(jié)點(diǎn)的位置
		if (left < heapSieze && array[left] > array[maxValue]) {
			maxValue = left;
		}
		// 如果右子節(jié)點(diǎn)的值，比當(dāng)前最大的值大，就把最大值的位置換成右子節(jié)點(diǎn)的位置
		if (right < heapSieze && array[right] > array[maxValue]) {
			maxValue = right;
		}
		// 如果不相等說(shuō)明，這個(gè)子節(jié)點(diǎn)的值有比自己大的，位置發(fā)生了交換了位置
		if (maxValue != index) {
			swap(array, index, maxValue); // 就要交換位置元素
			// 交換完位置后還需要判斷子節(jié)點(diǎn)是否打破了最大堆的性質(zhì)。最大堆性質(zhì)：兩個(gè)子節(jié)點(diǎn)都比父節(jié)點(diǎn)小。
			buildMaxHeap(array, heapSieze, maxValue);
		}
	}
	//小頂堆
	public static void buildMinHeap(int[] array, int heapSieze, int index) {
		int left = index * 2 + 1; // 左子節(jié)點(diǎn)
		int right = index * 2 + 2; // 右子節(jié)點(diǎn)
		int maxValue = index; // 暫時(shí)定在Index的位置就是最小值
		// 如果左子節(jié)點(diǎn)的值，比當(dāng)前最小的值小，就把最小值的位置換成左子節(jié)點(diǎn)的位置
		if (left < heapSieze && array[left] < array[maxValue]) {
			maxValue = left;
		}
		// 如果右子節(jié)點(diǎn)的值，比當(dāng)前最小的值小，就把最小值的位置換成左子節(jié)點(diǎn)的位置
		if (right < heapSieze && array[right] < array[maxValue]) {
			maxValue = right;
		}
		// 如果不相等說(shuō)明這個(gè)子節(jié)點(diǎn)的值有比自己小的，位置發(fā)生了交換了位置
		if (maxValue != index) {
			swap(array, index, maxValue); // 就要交換位置元素
			// 交換完位置后還需要判斷子節(jié)點(diǎn)是否打破了最小堆的性質(zhì)。最小性質(zhì)：兩個(gè)子節(jié)點(diǎn)都比父節(jié)點(diǎn)大。
			buildMinHeap(array, heapSieze, maxValue);
		}
	}
	// 數(shù)組元素交換
	public static void swap(int[] a, int i, int j) {
		int temp = a[i];
		a[i] = a[j];
		a[j] = temp;
	}
}

大頂堆優(yōu)化實(shí)現(xiàn)算法：

import java.util.Arrays;
public class MaxHeapSort {
    private int[] arr;
    public MaxHeapSort(int[] arr){
        this.arr = arr;
    }
    /**
     * 堆排序的主要入口方法，共兩步。
     */
    public void sort(){
        /*
         *  第一步：將數(shù)組堆化
         *  beginIndex = 第一個(gè)非葉子節(jié)點(diǎn)。
         *  從第一個(gè)非葉子節(jié)點(diǎn)開(kāi)始即可。無(wú)需從最后一個(gè)葉子節(jié)點(diǎn)開(kāi)始。
         *  葉子節(jié)點(diǎn)可以看作已符合堆要求的節(jié)點(diǎn)，根節(jié)點(diǎn)就是它自己且自己以下值為最大。
         */
        int len = arr.length - 1;
        int beginIndex = (len - 1) >> 1; 
        for(int i = beginIndex; i >= 0; i--){
            maxHeapify(i, len);
        }
        /*
         * 第二步：對(duì)堆化數(shù)據(jù)排序
         * 每次都是移出最頂層的根節(jié)點(diǎn)A[0]，與最尾部節(jié)點(diǎn)位置調(diào)換，同時(shí)遍歷長(zhǎng)度 - 1。
         * 然后從新整理被換到根節(jié)點(diǎn)的末尾元素，使其符合堆的特性。
         * 直至未排序的堆長(zhǎng)度為 0。
         */
        for(int i = len; i > 0; i--){
            swap(0, i);
            maxHeapify(0, i - 1);
        }
    }
    private void swap(int i,int j){
        int temp = arr[i];
        arr[i] = arr[j];
        arr[j] = temp;
    }
    /**
     * 調(diào)整索引為 index 處的數(shù)據(jù)，使其符合堆的特性。
     * @param index 需要堆化處理的數(shù)據(jù)的索引
     * @param len 未排序的堆（數(shù)組）的長(zhǎng)度
     */
    private void maxHeapify(int index,int len){
        int li = (index << 1) + 1; // 左子節(jié)點(diǎn)索引
        int ri = li + 1;           // 右子節(jié)點(diǎn)索引
        int cMax = li;             // 子節(jié)點(diǎn)值最大索引，默認(rèn)左子節(jié)點(diǎn)。
        if(li > len) return;       // 左子節(jié)點(diǎn)索引超出計(jì)算范圍，直接返回。
        if(ri <= len && arr[ri] > arr[li]) // 先判斷左右子節(jié)點(diǎn)，哪個(gè)較大。
            cMax = ri;
        if(arr[cMax] > arr[index]){
            swap(cMax, index);      // 如果父節(jié)點(diǎn)被子節(jié)點(diǎn)調(diào)換，
            maxHeapify(cMax, len);  // 則需要繼續(xù)判斷換下后的父節(jié)點(diǎn)是否符合堆的特性。
        }
    }
    /**
     * 測(cè)試用例
     * 輸出：
     * [0, 0, 0, 1, 1, 1, 2, 2, 2, 3, 3, 3, 4, 4, 4, 5, 5, 5, 6, 6, 6, 7, 7, 7, 8, 8, 8, 9, 9, 9]
     */
    public static void main(String[] args) {
        int[] arr = new int[]{3,5,3,0,8,6,1,5,8,6,2,4,9,4,7,0,1,8,9,7,3,1,2,5,9,7,4,0,2,6};        
        new MaxHeapSort(arr).sort();        
        System.out.println(Arrays.toString(arr));
    }
}