Java集合---Array類源碼解析 ---轉自:牛奶、不加糖
一、Arrays.sort()數組排序
Java Arrays中提供了對所有類型的排序。其中主要分為Primitive(8種基本類型)和Object兩大類。
基本類型:采用調優的快速排序;
對象類型:采用改進的歸並排序。
1、對於基本類型源碼分析如下(以int[]為例):
Java對Primitive(int,float等原型數據)數組采用快速排序,對Object對象數組采用歸並排序。對這一區別,sun在<<The Java Tutorial>>中做出的解釋如下:
The sort operation uses a slightly optimized merge sort algorithm that is fast and stable:
* Fast: It is guaranteed to run in n log(n) time and runs substantially faster on nearly sorted lists. Empirical tests showed it to be as fast as a highly optimized quicksort. A quicksort is generally considered to be faster than a merge sort but isn't stable and doesn't guarantee n log(n) performance.
* Stable: It doesn't reorder equal elements. This is important if you sort the same list repeatedly on different attributes. If a user of a mail program sorts the inbox by mailing date and then sorts it by sender, the user naturally expects that the now-contiguous list of messages from a given sender will (still) be sorted by mailing date. This is guaranteed only if the second sort was stable.
也就是說,優化的歸並排序既快速(nlog(n))又穩定。
對於對象的排序,穩定性很重要。比如成績單,一開始可能是按人員的學號順序排好了的,現在讓我們用成績排,那么你應該保證,本來張三在李四前面,即使他們成績相同,張三不能跑到李四的后面去。
而快速排序是不穩定的,而且最壞情況下的時間復雜度是O(n^2)。
另外,對象數組中保存的只是對象的引用,這樣多次移位並不會造成額外的開銷,但是,對象數組對比較次數一般比較敏感,有可能對象的比較比單純數的比較開銷大很多。歸並排序在這方面比快速排序做得更好,這也是選擇它作為對象排序的一個重要原因之一。
排序優化:實現中快排和歸並都采用遞歸方式,而在遞歸的底層,也就是待排序的數組長度小於7時,直接使用冒泡排序,而不再遞歸下去。
分析:長度為6的數組冒泡排序總比較次數最多也就1+2+3+4+5+6=21次,最好情況下只有6次比較。而快排或歸並涉及到遞歸調用等的開銷,其時間效率在n較小時劣勢就凸顯了,因此這里采用了冒泡排序,這也是對快速排序極重要的優化。
源碼中的快速排序,主要做了以下幾個方面的優化:
1)當待排序的數組中的元素個數較少時,源碼中的閥值為7,采用的是插入排序。盡管插入排序的時間復雜度為0(n^2),但是當數組元素較少時,插入排序優於快速排序,因為這時快速排序的遞歸操作影響性能。
2)較好的選擇了划分元(基准元素)。能夠將數組分成大致兩個相等的部分,避免出現最壞的情況。例如當數組有序的的情況下,選擇第一個元素作為划分元,將使得算法的時間復雜度達到O(n^2).
源碼中選擇划分元的方法:
當數組大小為 size=7 時 ,取數組中間元素作為划分元。int n=m>>1;(此方法值得借鑒)
當數組大小 7<size<=40時,取首、中、末三個元素中間大小的元素作為划分元。
當數組大小 size>40 時 ,從待排數組中較均勻的選擇9個元素,選出一個偽中數做為划分元。
3)根據划分元 v ,形成不變式 v* (<v)* (>v)* v*
普通的快速排序算法,經過一次划分后,將划分元排到素組較中間的位置,左邊的元素小於划分元,右邊的元素大於划分元,而沒有將與划分元相等的元素放在其附近,這一點,在Arrays.sort()中得到了較大的優化。
舉例:15、93、15、41、6、15、22、7、15、20
因 7<size<=40,所以在15、6、和20 中選擇v = 15 作為划分元。
經過一次換分后: 15、15、7、6、41、20、22、93、15、15. 與划分元相等的元素都移到了素組的兩邊。
接下來將與划分元相等的元素移到數組中間來,形成:7、6、15、15、15、15、41、20、22、93.
最后遞歸對兩個區間進行排序[7、6]和[41、20、22、93].
部分源代碼(一)如下:
1 package com.util; 2 3 public class ArraysPrimitive { 4 private ArraysPrimitive() {} 5 6 /** 7 * 對指定的 int 型數組按數字升序進行排序。 8 */ 9 public static void sort(int[] a) { 10 sort1(a, 0, a.length); 11 } 12 13 /** 14 * 對指定 int 型數組的指定范圍按數字升序進行排序。 15 */ 16 public static void sort(int[] a, int fromIndex, int toIndex) { 17 rangeCheck(a.length, fromIndex, toIndex); 18 sort1(a, fromIndex, toIndex - fromIndex); 19 } 20 21 private static void sort1(int x[], int off, int len) { 22 /* 23 * 當待排序的數組中的元素個數小於 7 時,采用插入排序 。 24 * 25 * 盡管插入排序的時間復雜度為O(n^2),但是當數組元素較少時, 插入排序優於快速排序,因為這時快速排序的遞歸操作影響性能。 26 */ 27 if (len < 7) { 28 for (int i = off; i < len + off; i++) 29 for (int j = i; j > off && x[j - 1] > x[j]; j--) 30 swap(x, j, j - 1); 31 return; 32 } 33 /* 34 * 當待排序的數組中的元素個數大於 或等於7 時,采用快速排序 。 35 * 36 * Choose a partition element, v 37 * 選取一個划分元,V 38 * 39 * 較好的選擇了划分元(基准元素)。能夠將數組分成大致兩個相等的部分,避免出現最壞的情況。例如當數組有序的的情況下, 40 * 選擇第一個元素作為划分元,將使得算法的時間復雜度達到O(n^2). 41 */ 42 // 當數組大小為size=7時 ,取數組中間元素作為划分元。 43 int m = off + (len >> 1); 44 // 當數組大小 7<size<=40時,取首、中、末 三個元素中間大小的元素作為划分元。 45 if (len > 7) { 46 int l = off; 47 int n = off + len - 1; 48 /* 49 * 當數組大小 size>40 時 ,從待排數組中較均勻的選擇9個元素, 50 * 選出一個偽中數做為划分元。 51 */ 52 if (len > 40) { 53 int s = len / 8; 54 l = med3(x, l, l + s, l + 2 * s); 55 m = med3(x, m - s, m, m + s); 56 n = med3(x, n - 2 * s, n - s, n); 57 } 58 // 取出中間大小的元素的位置。 59 m = med3(x, l, m, n); // Mid-size, med of 3 60 } 61 62 //得到划分元V 63 int v = x[m]; 64 65 // Establish Invariant: v* (<v)* (>v)* v* 66 int a = off, b = a, c = off + len - 1, d = c; 67 while (true) { 68 while (b <= c && x[b] <= v) { 69 if (x[b] == v) 70 swap(x, a++, b); 71 b++; 72 } 73 while (c >= b && x[c] >= v) { 74 if (x[c] == v) 75 swap(x, c, d--); 76 c--; 77 } 78 if (b > c) 79 break; 80 swap(x, b++, c--); 81 } 82 // Swap partition elements back to middle 83 int s, n = off + len; 84 s = Math.min(a - off, b - a); 85 vecswap(x, off, b - s, s); 86 s = Math.min(d - c, n - d - 1); 87 vecswap(x, b, n - s, s); 88 // Recursively sort non-partition-elements 89 if ((s = b - a) > 1) 90 sort1(x, off, s); 91 if ((s = d - c) > 1) 92 sort1(x, n - s, s); 93 } 94 95 /** 96 * Swaps x[a] with x[b]. 97 */ 98 private static void swap(int x[], int a, int b) { 99 int t = x[a]; 100 x[a] = x[b]; 101 x[b] = t; 102 } 103 104 /*