給定一個數組A,要求找到數組A中第K大的數字。對於這個問題,解決方案有不少,此處我只給出三種:
方法1:
對數組A進行排序,然后遍歷一遍就可以找到第K大的數字。該方法的時間復雜度為O(N*logN)
方法2:
利用簡單選擇排序法的思想,每次通過比較選出最大的數字來,比較上K次就能找出第K大的數字來。該方法的時間復雜度為O(N*K),最壞情況下為O(N^2)。
方法3:
這種方法是本文談論的重點,可以利用快排的思想,首先快排每次執行都能確定一個元素的最終的位置,如果這個位置是n-k(其中n是數組A的長度)的話,那么就相當於找到了第K大的元素。設確定的元素位置m的話,如果m > n - k大的話,那么第K大的數字一定
在A[0]~A[m - 1]之間;如果m < n - k的話,那么第K大的數字一定在A[m+1]~A[n - 1]之間。整個過程可以通過遞歸實現,具體代碼如下:
#include<iostream> #include<cassert> #include<vector> #include<stack> #include<cstdio> #include<unordered_map> #include<queue> #include<cstring> #include<cstdlib> #include<cmath> #include<algorithm> using namespace std; int Partition(int* arr,int low ,int high) { int temp = arr[low]; while(low < high) { while(low < high && arr[high] >= temp) high--; arr[low] = arr[high]; while(low < high && arr[low] <= temp) low++; arr[high] = arr[low]; } arr[low] = temp;//確定參考元素的位置 return low; } int KthElement(int * arr,int low, int high,int n ,int k) { if(arr == nullptr || low >= high || k > n)//邊界條件和特殊輸入的處理 return 0; int pos = Partition(arr,low,high); while(pos != n - k) { if(pos > n - k) { high = pos - 1; pos = Partition(arr,low,high); } if(pos < n - k) { low = pos + 1; pos = Partition(arr,low,high); } } return arr[pos]; } int main() { int a[]={1,5,5,7,88,11}; cout<<KthElement(a,0,5,6,2); }
注意:
1.第K大的數字在數組中對應的位置為n-k(按照升序排序的話)。
2.該算法的時間復雜度整體上為O(N)。
3.需要注意的是:這種方法會改變數組中元素的順序,即會改變數組本身。
4.如果要求第K小的數字的話,只需把n-k換成k-1即可(升序排序)。
===================================================================================================================================================================================================
接下來,我們仔細分析一下方法3的時間復雜度,其實方法3在《算法導論》第九章有着比較詳細的描述,但《算法導論》說的是期望為線性時間的選擇算法,即該算法的時間復雜度在平均情況下或者一般情況下為O(n);因為此處利用的快排的思想,而快排的時間
復雜度在一般情況下為O(N*logN),但在最壞的情況下(即整個數組原本就是有序的情況)時間復雜度為O(N^2)。所以說對於方法3,《算導》最后給定結果是這樣的:平均時間復雜度為O(N),最壞情況下的時間復雜度為O(N^2)。
但是,此處的“平均”同快排一樣,是適用於絕大數的情況的。所以我們通常說該算法的時間復雜度為O(N)。
1.我們要搞清楚一點,快排是對參考元素兩邊都進行遞歸,而我們的方法3只考慮參考元素的一邊,即只對一邊進行遞歸。
2.我們可以粗略的估計下(具體計算還是參考《算導》),在一般情況下方法3的時間復雜度計算公式,假設我們的數據足夠的隨機,每次划分都在數據序列的中間位置,根據條件1,那么第一次划分我們需要遍歷約n個數,第二次需要遍歷約n/2個數,...,這樣遞歸下去,最后:
當m趨於無窮大時,該式子收斂於2n,故可以認為其期望時間復雜度為O(N).
===================================================================================================================================================================================================
實際上,《算導》還給出了一種最壞情況下時間復雜度為O(N)的解法,這種方法與方法3類似,都采用了類似快排的思想,但做了一些改變,同時把參考元素也作為輸入參數,具體的話此處不再詳述,感興趣可參考《算導》第九章第三節。