尋找數組中第K大的數


  給定一個數組A,要求找到數組A中第K大的數字。對於這個問題,解決方案有不少,此處我只給出三種:

方法1:

  對數組A進行排序,然后遍歷一遍就可以找到第K大的數字。該方法的時間復雜度為O(N*logN)

方法2:

  利用簡單選擇排序法的思想,每次通過比較選出最大的數字來,比較上K次就能找出第K大的數字來。該方法的時間復雜度為O(N*K),最壞情況下為O(N^2)。

方法3:  

  這種方法是本文談論的重點,可以利用快排的思想,首先快排每次執行都能確定一個元素的最終的位置,如果這個位置是n-k(其中n是數組A的長度)的話,那么就相當於找到了第K大的元素。設確定的元素位置m的話,如果m > n - k大的話,那么第K大的數字一定

在A[0]~A[m - 1]之間;如果m < n - k的話,那么第K大的數字一定在A[m+1]~A[n - 1]之間。整個過程可以通過遞歸實現,具體代碼如下:

#include<iostream>
#include<cassert>
#include<vector>
#include<stack>
#include<cstdio>
#include<unordered_map>
#include<queue>
#include<cstring>
#include<cstdlib>
#include<cmath>
#include<algorithm>
using namespace std;

int Partition(int* arr,int low ,int high)
{
    int temp = arr[low];
    while(low < high)
    {
        while(low < high && arr[high] >= temp)
            high--;
        arr[low] = arr[high];
        while(low < high && arr[low] <= temp)
            low++;
        arr[high] = arr[low];
    }
    arr[low] = temp;//確定參考元素的位置
    return low;
}
int KthElement(int * arr,int low, int high,int n ,int k)
{
    if(arr == nullptr || low >= high || k > n)//邊界條件和特殊輸入的處理
        return 0;
    int pos = Partition(arr,low,high);
    while(pos != n  - k)
    {
        if(pos > n - k)
        {
            high = pos - 1;
            pos = Partition(arr,low,high);
        }
        if(pos < n - k)
        {
            low = pos + 1;
            pos = Partition(arr,low,high);
        }
    }
    return arr[pos];

}

int main()
{

   int a[]={1,5,5,7,88,11};
   cout<<KthElement(a,0,5,6,2);
  
}

注意:

1.第K大的數字在數組中對應的位置為n-k(按照升序排序的話)。

2.該算法的時間復雜度整體上為O(N)。

3.需要注意的是:這種方法會改變數組中元素的順序,即會改變數組本身。

4.如果要求第K小的數字的話,只需把n-k換成k-1即可(升序排序)。

===================================================================================================================================================================================================

  接下來,我們仔細分析一下方法3的時間復雜度,其實方法3在《算法導論》第九章有着比較詳細的描述,但《算法導論》說的是期望為線性時間的選擇算法,即該算法的時間復雜度在平均情況下或者一般情況下為O(n);因為此處利用的快排的思想,而快排的時間

復雜度在一般情況下為O(N*logN),但在最壞的情況下(即整個數組原本就是有序的情況)時間復雜度為O(N^2)。所以說對於方法3,《算導》最后給定結果是這樣的:平均時間復雜度為O(N),最壞情況下的時間復雜度為O(N^2)。

但是,此處的“平均”同快排一樣,是適用於絕大數的情況的。所以我們通常說該算法的時間復雜度為O(N)。

1.我們要搞清楚一點,快排是對參考元素兩邊都進行遞歸,而我們的方法3只考慮參考元素的一邊,即只對一邊進行遞歸。

2.我們可以粗略的估計下(具體計算還是參考《算導》),在一般情況下方法3的時間復雜度計算公式,假設我們的數據足夠的隨機,每次划分都在數據序列的中間位置,根據條件1,那么第一次划分我們需要遍歷約n個數,第二次需要遍歷約n/2個數,...,這樣遞歸下去,最后:

 

當m趨於無窮大時,該式子收斂於2n,故可以認為其期望時間復雜度為O(N).

===================================================================================================================================================================================================

實際上,《算導》還給出了一種最壞情況下時間復雜度為O(N)的解法,這種方法與方法3類似,都采用了類似快排的思想,但做了一些改變,同時把參考元素也作為輸入參數,具體的話此處不再詳述,感興趣可參考《算導》第九章第三節。


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM