C++快速排序的分析與優(yōu)化詳解
相信學(xué)過數(shù)據(jù)結(jié)構(gòu)與算法的朋友對于快速排序應(yīng)該并不陌生,本文就以實例講述了C++快速排序的分析與優(yōu)化,對于C++算法的設(shè)計有很好的借鑒價值。具體分析如下:
一、快速排序的介紹
快速排序是一種排序算法,對包含n個數(shù)的輸入數(shù)組,最壞的情況運行時間為Θ(n2)[Θ 讀作theta]。雖然這個最壞情況的運行時間比較差,但快速排序通常是用于排序的最佳的實用選擇。這是因為其平均情況下的性能相當(dāng)好:期望的運行時間為 Θ(nlgn),且Θ(nlgn)記號中隱含的常數(shù)因子很小。另外,它還能夠進行就地排序,在虛擬內(nèi)存環(huán)境中也能很好的工作。
和歸并排序一樣,快速排序也是基于分治法(Divide and conquer):
分解:數(shù)組A[p..r]被劃分成兩個(可能為空)的子數(shù)組A[p..q-1]和A[q+1..r],使得A[p..q-1]中的每個元素都小于等于A[q],A[q+1..r]中的每個元素都大于等于A[q]。這樣元素A[q]就位于其最終位置上了。
解決:通過遞歸調(diào)用快速排序,對子數(shù)組A[p..q-1]和A[q+1..r]排序。
合并:因為兩個子數(shù)組是就地排序,不需要合并,整個數(shù)組已有序。
偽代碼如下:
PARTITION(A, p, r) x = A[p] i = p for j=p+1 to r do if A[j] <= x then i = i+1 exchange(A[i],A[j]) exchange(A[p], A[i]) return i QUICKSORT(A, p, r) if p < r then q = PARTITION(A, p, r) QUICKSORT(A, p, q-1) QUICKSORT(A, q+1, r)
二、性能分析
1、最壞情況
快速排序的最壞情況發(fā)生在當(dāng)數(shù)組已經(jīng)有序或者逆序排好的情況下。這樣的話劃分過程產(chǎn)生的兩個區(qū)域中有一個沒有元素,另一個包含n-1個元素。此時算法的運行時間可以遞歸地表示為:T(n) = T(n-1)+T(0)+Θ(n),遞歸式的解為T(n)=Θ(n^2)。可以看出,快速排序算法最壞情況運行時間并不比插入排序的更好。
2、最好情況
如果我們足夠幸運,在每次劃分操作中做到最平衡的劃分,即將數(shù)組劃分為n/2:n/2。此時得到的遞歸式為T(n) = 2T(n/2)+Θ(n),根據(jù)主定理的情況二可得T(n)=Θ(nlgn)。
3、平均情況
假設(shè)一:快排中的劃分點非常偏斜,比如每次都將數(shù)組劃分為1/10 : 9/10的兩個子區(qū)域,這種情況下運行時間是多少呢?運行時間遞歸式為T(n) = T(n/10)+T(9n/10)+Θ(n),使用遞歸樹解得T(n)=Θ(nlgn)??梢钥闯?,當(dāng)劃分點非常偏斜的時候,運行時間仍然是Θ(nlgn)。
假設(shè)二:Partition所產(chǎn)生的劃分既有“好的”,也有“差的”,它們交替出現(xiàn)。這種平均情況下運行時間又是多少呢?這時的遞歸式為(G表示Good,B表示Bad):
G(n) = 2B(n/2) + Θ(n)
B(n) = G(n-1) + Θ(n)
解:G(n) = 2(G(n/2-1) + Θ(n/2)) + Θ(n) = 2G(n/2-1) + Θ(n) = Θ(nlgn)
可以看出,當(dāng)好、差劃分交替出現(xiàn)時,快排的運行時間就如全是好的劃分一樣,仍然是Θ(nlgn) 。
三、快排的優(yōu)化
經(jīng)過上面的分析可以知道,在輸入有序或逆序時快速排序很慢,在其余情況則表現(xiàn)良好。如果輸入本身已被排序,那么就糟了。那么我們?nèi)绾未_保對于所有輸 入,它均能夠獲得較好的平均情況性能呢?前面的快速排序我們默認使用數(shù)組中第一個元素作為主元。假設(shè)隨機選擇數(shù)組中的元素作為主元,則快排的運行時間將不 依賴于輸入序列的順序。我們把隨機選擇主元的快速排序叫做Randomized Quicksort。
在隨機化的快速排序中,我們不是始終選擇第一個元素作為主元,而是從數(shù)組A[p…r]中隨機選擇一個元素,然后將其與第一個元素交換。由于主元元素是隨機選擇的,我們期望在平均情況下,對輸入數(shù)組的劃分能夠比較對稱。
偽代碼如下:
RANDOMIZED-PARTITION(A, p, r) i = RANDOM(p, r) exchange(A[p], A[i]) return PARTITION(A, p, r) RANDOMIZED-QUICKSORT(A, p, r) if p < r then q = RANDOMIZED-PARTITION(A, p, r) RANDOMIZED-QUICKSORT(A, p, q-1) RANDOMIZED-QUICKSORT(A, q+1, r)
我們對3萬個元素的有序序列分別進行傳統(tǒng)的快速排序 和 隨機化的快速排序,并比較它們的運行時間:
/************************************************************************* > File Name: QuickSort.cpp > Author: SongLee ************************************************************************/ #include<iostream> #include<cstdlib> // srand rand #include<ctime> // clock_t clock using namespace std; void swap(int &a, int &b) { int tmp = a; a = b; b = tmp; } // 傳統(tǒng)劃分操作 int Partition(int A[], int low, int high) { int pivot = A[low]; int i = low; for(int j=low+1; j<=high; ++j) { if(A[j] <= pivot) { ++i; swap(A[i], A[j]); } } swap(A[i], A[low]); return i; } // 隨機化劃分操作,隨機選擇pivot int Partition_Random(int A[], int low, int high) { srand(time(NULL)); int i = rand() % (high+1); swap(A[low], A[i]); return Partition(A, low, high); } // 傳統(tǒng)快排 void QuickSort(int A[], int low, int high) { if(low < high) { int pos = Partition(A, low, high); QuickSort(A, low, pos-1); QuickSort(A, pos+1, high); } } // 隨機化快速排序 void QuickSort_Random(int A[], int low, int high) { if(low < high) { int pos = Partition_Random(A, low, high); QuickSort_Random(A, low, pos-1); QuickSort_Random(A, pos+1, high); } } int main() { clock_t t1, t2; // 初始化數(shù)組 int A[30000]; for(int i=0; i<30000; ++i) A[i] = i+1; t1 = clock(); QuickSort(A, 0, 30000-1); t1 = clock() - t1; cout << "Traditional quicksort took "<< t1 << " clicks(about " << ((float)t1)/CLOCKS_PER_SEC << " seconds)." << endl; t2 = clock(); QuickSort_Random(A, 0, 30000-1); t2 = clock() - t2; cout << "Randomized quicksort took "<< t2 << " clicks(about " << ((float)t2)/CLOCKS_PER_SEC << " seconds)." << endl; return 0; }
運行結(jié)果如下:
[songlee@localhost ~]$ ./QuickSort Traditional quicksort took 1210309 clicks(about 1.21031 seconds). Randomized quicksort took 457573 clicks(about 0.457573 seconds). [songlee@localhost ~]$ ./QuickSort Traditional quicksort took 1208038 clicks(about 1.20804 seconds). Randomized quicksort took 644950 clicks(about 0.64495 seconds).
從運行結(jié)果可以看出,對于有序的輸入,隨機化版本的快速排序的效率會高很多。
問題記錄:
我們知道交換兩個變量的值有以下三種方法:
int tmp = a; // 方法一 a = b; b = tmp a = a+b; // 方法二 b = a-b; a = a-b; a = a^b; // 方法三 b = a^b; a = a^b;
但是你會發(fā)現(xiàn)在本程序中,如果swap函數(shù)使用后面兩種方法會出錯。由于方法二和方法三沒有使用中間變量,它們交換值的原理是直接對變量的內(nèi)存單元進行操作。如果兩個變量對應(yīng)的同一內(nèi)存單元,則經(jīng)過兩次加減或異或操作,內(nèi)存單元的值已經(jīng)變?yōu)榱?,因而不能實現(xiàn)變量值交換。所以當(dāng)需要交換值的變量可能是同一變量時,必須使用第三變量實現(xiàn)交換,否則會對變量清零。
相關(guān)文章
C++實現(xiàn)LeetCode(68.文本左右對齊)
這篇文章主要介紹了C++實現(xiàn)LeetCode(68.文本左右對齊),本篇文章通過簡要的案例,講解了該項技術(shù)的了解與使用,以下就是詳細內(nèi)容,需要的朋友可以參考下2021-07-07