算法之線性時間選擇（最壞情況下）

本文轉載自查看原文 2014-04-09 12:45 6751 java

線性時間選擇（Linear Select）:這個名字不太好理解，什么叫線性時間選擇？一句話，在線性時間內完成選擇。一般情況下是這樣的，我們想要找出一個數組中的最大值或最小值，那就只需要一次排列，然后輸出第一個或最后一個元素就行了，但如果是要找出一個數組中的第k小的元素呢？

　　在一般情況下，可以用RandomizedSelect方法來找出第k小的元素，平均時間是O(n)，但在最壞情況下，所用的時間則是n^2，因此，本文討論的就是在最壞情況下，如何在O(n)時間內完成選擇。算法的思路總體有些復雜，但每一步其實不難，下面即給大家介紹最壞情況下的線性時間選擇算法。

（1）：將n個輸入元素以每組5個地划分，共划分出(n/5)個組，每個組分別進行排列，找出中位數，然后按照每個組的順序，把每個組的中位數與整個數組的前(n/5)個數交換；

（2）：那么，前(n/5)個數就是各組的中位數了，然后，我們通過select方法找出這些中位數的中位數，以這個中位數的中位數為基准，調用partition方法；

（3）：調用了partition方法后的基准元素正是處於數組的正確位置（前邊的元素都比基准元素小，后邊的元素都比基准元素大），記下基准元素前邊的元素個數leftNum，如果k小於或等於leftNum，則在基准位置前的這部分調用select方法即可，如果在k大於leftNum，則在基准位置后的這部分調用select方法。

下面，我直接把代碼貼出，讀者可以通過我的注釋來理解每一步的意義。

 1 private static int select(int[] a,int l,int r,int k){
 2     if(r - l < 75){
 3         insertSort(a, l, r);    //用快速排序進行排序
 4         return a[l + k - 1];
 5     }
 6     int group = (r-l+5)/5;
 7     for(int i = 0;i<group;i++){
 8         int left = l+5*i;
 9         int right = (l + i * 5 + 4) > r ? r : l + i * 5 + 4;  //如果超出右邊界就用右邊界賦值
10         int mid = (left+right)/2;
11         insertSort(a, left, right);
12         swap(a, l + i, mid);     // 將各組中位數與前i個 
13     }
14     int pivot = select(a,l,l+group-1,(group+1)/2);  //找出中位數的中位數
15     int p = partition(a,l,r,pivot);    //用中位數的中位數作為基准的位置
16     int leftNum = p - l;       //leftNum用來記錄基准位置的前邊的元素個數
17     if (k == leftNum + 1)
18         return a[p];
19     else if (k <= leftNum)
20         return select(a, l, p - 1, k);
21     else                    //若k在基准位子的后邊，則要從基准位置的后邊數起，即第（k - leftNum - 1）個
22         return select(a, p + 1, r, k - leftNum - 1);
23 }

到此大家也可以看出，這里的partition方法與前邊講到過的快速排序所用到的partition方法稍有不同，參數個數都變了，但其實變化只是很小，只是取消了一開始定義基准位置的步驟而已，代碼如下：

 1 private static int partition(int[] a,int l,int r,int pivot){   //適用於線性時間選擇的partition方法
 2     int i = l;
 3     int j = r;
 4     while(true){
 5         while(a[i] <= pivot && i < r)
 6             ++i;   //i一直向后移動，直到出現a[i]>pivot
 7         while(a[j] > pivot)
 8             --j;   //j一直向前移動，直到出現a[j]<pivot
 9         if(i >= j) break;
10         swap(a,i,j);
11     }
12     a[l] = a[j];
13     a[j] = pivot;
14     return j;
15 }

下面是select方法中，如果輸入規模小於75時用到的插入排序算法代碼：

 1 private static void insertSort(int[] a, int law, int high) {    //插入排序
 2        for (int i = law + 1; i <= high; i++) {  
 3            int key = a[i];  
 4            int j = i - 1;  
 5            while (j >= law && a[j] > key) {  
 6                a[j + 1] = a[j];  
 7                j--;  
 8            }  
 9            a[j + 1] = key;  
10        }  
11 }

適用於數組元素之間的swap方法如下：

1 private static void swap(int[] a,int i,int j){
2     int temp = a[i];
3     a[i] = a[j];
4     a[j] = temp;
5 }

　　各位可能有個疑問，為什么輸入規模不足75時調用插入排序而不用線性時間選擇呢？那是因為當輸入規模不足75時，因為輸入規模太小，時間復雜度幾乎是一個常量，因此沒有必要用到比較復雜的線性時間選擇算法。

　　我還看到一個比較好懂的學習線性時間選擇的動畫，能形象地看到線性時間選擇的執行過程，鏈接如下：

http://resource.jingpinke.com/details?uuid=ff808081-22e8911b-0122-e8912643-048d&objectId=oid:ff808081-22e8911b-0122-e8912643-048e

　　如果有不足之處或者對該算法有更好的建議，請提出！

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 在 n 個數當中找第k小元素 (BFPRT算法，最壞情況為線性時間的選擇問題) 哪些情況下索引會失效？線性時間選擇線性選擇算法 kafka不停止服務的情況下修改日志保留時間三色標記算法在並發情況下的漏標問題分析【純理論】線性時間排序算法線性時間的排序算法插入排序最好、最壞、平均情況時間復雜度分析什么情況下使用多線程