快捷導(dǎo)航

C++快速排序的分析與優(yōu)化詳解

更新時(shí)間：2014年08月14日 11:04:09 投稿：shichen2014

這篇文章主要介紹了C++快速排序的分析與優(yōu)化,非常經(jīng)典的算法,分析也較為詳盡,需要的朋友可以參考下

相信學(xué)過數(shù)據(jù)結(jié)構(gòu)與算法的朋友對(duì)于快速排序應(yīng)該并不陌生，本文就以實(shí)例講述了C++快速排序的分析與優(yōu)化，對(duì)于C++算法的設(shè)計(jì)有很好的借鑒價(jià)值。具體分析如下：

一、快速排序的介紹

快速排序是一種排序算法，對(duì)包含n個(gè)數(shù)的輸入數(shù)組，最壞的情況運(yùn)行時(shí)間為Θ(n2)[Θ 讀作theta]。雖然這個(gè)最壞情況的運(yùn)行時(shí)間比較差，但快速排序通常是用于排序的最佳的實(shí)用選擇。這是因?yàn)槠淦骄闆r下的性能相當(dāng)好：期望的運(yùn)行時(shí)間為 Θ(nlgn)，且Θ(nlgn)記號(hào)中隱含的常數(shù)因子很小。另外，它還能夠進(jìn)行就地排序，在虛擬內(nèi)存環(huán)境中也能很好的工作。

和歸并排序一樣，快速排序也是基于分治法（Divide and conquer）：

分解：數(shù)組A[p..r]被劃分成兩個(gè)(可能為空)的子數(shù)組A[p..q-1]和A[q+1..r]，使得A[p..q-1]中的每個(gè)元素都小于等于A[q]，A[q+1..r]中的每個(gè)元素都大于等于A[q]。這樣元素A[q]就位于其最終位置上了。

解決：通過遞歸調(diào)用快速排序，對(duì)子數(shù)組A[p..q-1]和A[q+1..r]排序。

合并：因?yàn)閮蓚€(gè)子數(shù)組是就地排序，不需要合并，整個(gè)數(shù)組已有序。

偽代碼如下：

PARTITION(A, p, r) 
  x = A[p] 
  i = p 
  for j=p+1 to r 
    do if A[j] <= x 
      then i = i+1 
         exchange(A[i],A[j]) 
  exchange(A[p], A[i]) 
  return i 
 
QUICKSORT(A, p, r) 
  if p < r 
    then q = PARTITION(A, p, r) 
       QUICKSORT(A, p, q-1) 
       QUICKSORT(A, q+1, r)

二、性能分析

1、最壞情況

快速排序的最壞情況發(fā)生在當(dāng)數(shù)組已經(jīng)有序或者逆序排好的情況下。這樣的話劃分過程產(chǎn)生的兩個(gè)區(qū)域中有一個(gè)沒有元素，另一個(gè)包含n-1個(gè)元素。此時(shí)算法的運(yùn)行時(shí)間可以遞歸地表示為：T(n) = T(n-1)+T(0)+Θ(n)，遞歸式的解為T(n)=Θ(n^2)。可以看出，快速排序算法最壞情況運(yùn)行時(shí)間并不比插入排序的更好。

2、最好情況

如果我們足夠幸運(yùn)，在每次劃分操作中做到最平衡的劃分，即將數(shù)組劃分為n/2:n/2。此時(shí)得到的遞歸式為T(n) = 2T(n/2)+Θ(n)，根據(jù)主定理的情況二可得T(n)=Θ(nlgn)。

3、平均情況

假設(shè)一：快排中的劃分點(diǎn)非常偏斜，比如每次都將數(shù)組劃分為1/10 : 9/10的兩個(gè)子區(qū)域，這種情況下運(yùn)行時(shí)間是多少呢？運(yùn)行時(shí)間遞歸式為T(n) = T(n/10)+T(9n/10)+Θ(n)，使用遞歸樹解得T(n)=Θ(nlgn)?？梢钥闯?，當(dāng)劃分點(diǎn)非常偏斜的時(shí)候，運(yùn)行時(shí)間仍然是Θ(nlgn)。

假設(shè)二：Partition所產(chǎn)生的劃分既有“好的”，也有“差的”，它們交替出現(xiàn)。這種平均情況下運(yùn)行時(shí)間又是多少呢？這時(shí)的遞歸式為（G表示Good，B表示Bad）：

G(n) = 2B(n/2) + Θ(n)

B(n) = G(n-1) + Θ(n)

解：G(n) = 2(G(n/2-1) + Θ(n/2)) + Θ(n) = 2G(n/2-1) + Θ(n) = Θ(nlgn)

可以看出，當(dāng)好、差劃分交替出現(xiàn)時(shí)，快排的運(yùn)行時(shí)間就如全是好的劃分一樣，仍然是Θ(nlgn) 。

三、快排的優(yōu)化

經(jīng)過上面的分析可以知道，在輸入有序或逆序時(shí)快速排序很慢，在其余情況則表現(xiàn)良好。如果輸入本身已被排序，那么就糟了。那么我們?nèi)绾未_保對(duì)于所有輸入，它均能夠獲得較好的平均情況性能呢？前面的快速排序我們默認(rèn)使用數(shù)組中第一個(gè)元素作為主元。假設(shè)隨機(jī)選擇數(shù)組中的元素作為主元，則快排的運(yùn)行時(shí)間將不依賴于輸入序列的順序。我們把隨機(jī)選擇主元的快速排序叫做Randomized Quicksort。

在隨機(jī)化的快速排序中，我們不是始終選擇第一個(gè)元素作為主元，而是從數(shù)組A[p…r]中隨機(jī)選擇一個(gè)元素，然后將其與第一個(gè)元素交換。由于主元元素是隨機(jī)選擇的，我們期望在平均情況下，對(duì)輸入數(shù)組的劃分能夠比較對(duì)稱。

偽代碼如下：

RANDOMIZED-PARTITION(A, p, r) 
  i = RANDOM(p, r) 
  exchange(A[p], A[i]) 
  return PARTITION(A, p, r) 
 
RANDOMIZED-QUICKSORT(A, p, r) 
  if p < r 
    then q = RANDOMIZED-PARTITION(A, p, r) 
      RANDOMIZED-QUICKSORT(A, p, q-1) 
      RANDOMIZED-QUICKSORT(A, q+1, r)

我們對(duì)3萬個(gè)元素的有序序列分別進(jìn)行傳統(tǒng)的快速排序和隨機(jī)化的快速排序，并比較它們的運(yùn)行時(shí)間：

/************************************************************************* 
  > File Name: QuickSort.cpp 
  > Author: SongLee 
 ************************************************************************/ 
#include<iostream> 
#include<cstdlib> // srand rand 
#include<ctime> // clock_t clock 
using namespace std; 
 
void swap(int &a, int &b) 
{ 
  int tmp = a; 
  a = b; 
  b = tmp; 
} 
 
// 傳統(tǒng)劃分操作 
int Partition(int A[], int low, int high) 
{ 
  int pivot = A[low]; 
  int i = low; 
  for(int j=low+1; j<=high; ++j) 
  { 
    if(A[j] <= pivot) 
    { 
      ++i; 
      swap(A[i], A[j]); 
    } 
  } 
  swap(A[i], A[low]); 
  return i; 
} 
 
// 隨機(jī)化劃分操作，隨機(jī)選擇pivot 
int Partition_Random(int A[], int low, int high) 
{ 
  srand(time(NULL)); 
  int i = rand() % (high+1); 
  swap(A[low], A[i]); 
  return Partition(A, low, high); 
} 
 
// 傳統(tǒng)快排 
void QuickSort(int A[], int low, int high) 
{ 
  if(low < high) 
  { 
    int pos = Partition(A, low, high); 
    QuickSort(A, low, pos-1); 
    QuickSort(A, pos+1, high); 
  } 
} 
 
// 隨機(jī)化快速排序 
void QuickSort_Random(int A[], int low, int high) 
{ 
  if(low < high) 
  { 
    int pos = Partition_Random(A, low, high); 
    QuickSort_Random(A, low, pos-1); 
    QuickSort_Random(A, pos+1, high); 
  } 
} 
 
int main() 
{ 
  clock_t t1, t2; 
  // 初始化數(shù)組 
  int A[30000]; 
  for(int i=0; i<30000; ++i) 
    A[i] = i+1; 
     
  t1 = clock(); 
  QuickSort(A, 0, 30000-1); 
  t1 = clock() - t1; 
  cout << "Traditional quicksort took "<< t1 << " clicks(about " << ((float)t1)/CLOCKS_PER_SEC << " seconds)." << endl; 
 
  t2 = clock(); 
  QuickSort_Random(A, 0, 30000-1); 
  t2 = clock() - t2; 
  cout << "Randomized quicksort took "<< t2 << " clicks(about " << ((float)t2)/CLOCKS_PER_SEC << " seconds)." << endl; 
 
  return 0; 
}

運(yùn)行結(jié)果如下：

[songlee@localhost ~]$ ./QuickSort  
Traditional quicksort took 1210309 clicks(about 1.21031 seconds). 
Randomized quicksort took 457573 clicks(about 0.457573 seconds). 
[songlee@localhost ~]$ ./QuickSort  
Traditional quicksort took 1208038 clicks(about 1.20804 seconds). 
Randomized quicksort took 644950 clicks(about 0.64495 seconds).

從運(yùn)行結(jié)果可以看出，對(duì)于有序的輸入，隨機(jī)化版本的快速排序的效率會(huì)高很多。

問題記錄：

我們知道交換兩個(gè)變量的值有以下三種方法：

int tmp = a; // 方法一 
a = b; 
b = tmp 
 
a = a+b; // 方法二 
b = a-b; 
a = a-b; 
 
a = a^b; // 方法三 
b = a^b; 
a = a^b;

但是你會(huì)發(fā)現(xiàn)在本程序中，如果swap函數(shù)使用后面兩種方法會(huì)出錯(cuò)。由于方法二和方法三沒有使用中間變量，它們交換值的原理是直接對(duì)變量的內(nèi)存單元進(jìn)行操作。如果兩個(gè)變量對(duì)應(yīng)的同一內(nèi)存單元，則經(jīng)過兩次加減或異或操作，內(nèi)存單元的值已經(jīng)變?yōu)榱?，因而不能實(shí)現(xiàn)變量值交換。所以當(dāng)需要交換值的變量可能是同一變量時(shí)，必須使用第三變量實(shí)現(xiàn)交換，否則會(huì)對(duì)變量清零。

您可能感興趣的文章: