求中位數,O(n)的java實現【利用快速排序折半查找中位數】


查找無序數組的中位數,要想時間復雜度為O(n)其實用計數排序就能很方便地實現,在此討論使用快速排序進行定位的方法。

1、中位數定義

2、算法思想

3、Java代碼實現

4、時間復雜度分析

5、附錄

 

 

中位數一般兩種定義:

第一種:

排序后數組的中間位置的值,如果數組的個數是偶數個,則返回排序后數組的第N/2個數。

第一種(官方):

排序后數組的中間位置的值,如果數組的個數是偶數個,則返回最中間兩個數的平均數。

例如:{ 7, 9, 4, 5}   第一種輸出5;第二種輸出6.0

 

 

算法思想:大家應該都知道,快速排序每一躺都能定位一個數在這個數組的最終位置,所以可以利用此特性對數組中任意一個位置進行二分法定位。

    方法就是:一趟快排的partition結束之后,將此時定位的位置與欲定位位置進行比較,如果不等於,則將partition的區間折半,直到等於為止,返回這個位置的值

 

Java代碼實現

因為第二種中位數定義需要定位兩個位置,在第一種上擴展即可,所以先討論第一種:

 1     public static int getMedian(int[] nums) {
 2         return partition(nums, 0, nums.length - 1);
 3     }
 4 
 5     private static int partition(int[] nums, int start, int end) {
 6         /***快排partition函數原代碼——start***/
 7         int left = start;
 8         int right = end + 1;
 9 
10         int point = nums[start];
11         while (true) {
12             while (left < right && nums[--right] >= point)
13                 ;
14             while (left < right && nums[++left] <= point)
15                 ;
16             if (left == right) {
17                 break;
18             } else {
19                 int tmp = nums[left];
20                 nums[left] = nums[right];
21                 nums[right] = tmp;
22             }
23         }
24         nums[start] = nums[left];
25         nums[left] = point;
26         /***快排partition函數原代碼——end***/
27         
28         /***定位判斷***/
29         if (left == (nums.length - 1) / 2) {
30             return nums[left];
31         } else if (left > (nums.length - 1) / 2) {
32             return partition(nums, start, left - 1);
33         } else {
34             return partition(nums, left + 1, end);
35         }
36     }

 其實就是在原來的partition結束后加了一個定位判斷,此時left指向的就是已經本趟定位的那一個數,如果沒有定位成功則將上下界調整折半。

【注意】:“如果數組的個數是偶數個,則返回排序后數組的第N/2個數”這句話需要用 (nums.length - 1) / 2 來實現這句描述的下標,並滿足奇數時取最中間下標的效果。

 

時間復雜度分析

由於此方法采用的也是遞歸,那么必定符合遞歸的復雜度通項表達式: T(n) = aT(n/b) + f(n) 

其中a為每次遞歸會分成幾個需要計算的下一層,(n/b)為下一層計算的元素個數,f(n)為本層的計算復雜度

由於是折半查找,所以有:a=1、b=2(平均)、f(n)=n(每次的遍歷比較交換)

所以有

T(n) = T(n/2) +n
        =  T(n/4) + n/2 +n
        ……
        = T(1) + 2 + …… + n/2 +n    // T(1)≈1 等比數列求和
        = (1 - n * 2)/(1 - 2)
        = 2n - 1

所以最后平均時間復雜度為O(n)

【最優情況下b=n復雜度O(n);

 最壞情況下b=n-1/n,也就是(n/b)=(n-1),此時復雜度為O(n²),請自行計算哈】

 

附錄——第二種求中位數的實現

思路:第一種已經解決了定位一個數字,而第二種就是定位兩個數字,由於定位一個數字的時候不能保證另一個數字已經排序好,所以還需重新調用方法

  那么就把方法中定位判斷的部分單獨移出來做一個getByQuickSort(int[] nums,int stop)

 

java代碼實現:

 1     public static double getByQuickSort(int[] nums, int stop) {
 2         if (stop < 0 || stop >= nums.length) {
 3             throw new IndexOutOfBoundsException();
 4         }
 5         
 6         int start = 0;
 7         int end = nums.length -1;
 8         int par = 0;
 9         
10         while (start <= end) {
11             par = partition(nums, start, end);
12             if (par == stop) {
13                 break;
14             } else if (par > stop) {
15                 end = par - 1;
16             } else {
17                 start = par + 1;
18             }
19         }
20         return nums[par];
21     }

此處的partition(...)方法就是上一段代碼中的partition方法中把 /***定位判斷***/ 以下都去掉,然后加一個 return left; 即可。

而找中位數就再寫一個方法getMedian2(...)判斷一下奇偶,再調用getByQuickSort(....)就可以了:

1     public static double getMedian2(int[] nums) {
2         if (nums.length % 2 == 1) {
3             return getByQuickSort(nums, nums.length / 2);
4         } else {
5             return (getByQuickSort(nums, nums.length / 2 - 1) + 
6                     getByQuickSort(nums, nums.length / 2)) / 2.0;
7         }
8     }

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM