歸並排序是建立在歸並操作上的一種有效的排序算法。該算法是採用分治法(Divide and Conquer)的一個很典型的應用。
首先考慮下怎樣將將二個有序數列合並。這個很easy,僅僅要從比較二個數列的第一個數,誰小就先取誰,取了后就在相應數列中刪除這個數。然后再進行比較,假設有數列為空,那直接將還有一個數列的數據依次取出就可以。
//將有序數組a[]和b[]合並到c[]中 void MemeryArray(int a[], int n, int b[], int m, int c[]) { int i, j, k; i = j = k = 0; while (i < n && j < m) { if (a[i] < b[j]) c[k++] = a[i++]; else c[k++] = b[j++]; } while (i < n) c[k++] = a[i++]; while (j < m) c[k++] = b[j++]; }
能夠看出合並有序數列的效率是比較高的,能夠達到O(n)。
攻克了上面的合並有序數列問題,再來看歸並排序,其的基本思路就是將數組分成二組A,B,假設這二組組內的數據都是有序的,那么就能夠非常方便的將這二組數據進行排序。怎樣讓這二組組內數據有序了?
能夠將A,B組各自再分成二組。依次類推,當分出來的小組僅僅有一個數據時,能夠覺得這個小組組內已經達到了有序,然后再合並相鄰的二個小組就能夠了。這樣通過先遞歸的分解數列,再合並數列就完畢了歸並排序。
//將有二個有序數列a[first...mid]和a[mid...last]合並。 void mergearray(int a[], int first, int mid, int last, int temp[]) { int i = first, j = mid + 1; int m = mid, n = last; int k = 0; while (i <= m && j <= n) { if (a[i] <= a[j]) temp[k++] = a[i++]; else temp[k++] = a[j++]; } while (i <= m) temp[k++] = a[i++]; while (j <= n) temp[k++] = a[j++]; for (i = 0; i < k; i++) a[first + i] = temp[i]; } void mergesort(int a[], int first, int last, int temp[]) { if (first < last) { int mid = (first + last) / 2; mergesort(a, first, mid, temp); //左邊有序 mergesort(a, mid + 1, last, temp); //右邊有序 mergearray(a, first, mid, last, temp); //再將二個有序數列合並 } } bool MergeSort(int a[], int n) { int *p = new int[n]; if (p == NULL) return false; mergesort(a, 0, n - 1, p); delete[] p; return true; }
歸並排序的效率是比較高的,設數列長為N,將數列分開成小數列一共要logN步,每步都是一個合並有序數列的過程,時間復雜度能夠記為O(N),故一共為O(N*logN)。由於歸並排序每次都是在相鄰的數據中進行操作,所以歸並排序在O(N*logN)的幾種排序方法(高速排序,歸並排序,希爾排序,堆排序)也是效率比較高的。
在本人電腦上對冒泡排序,直接插入排序,歸並排序及直接使用系統的qsort()進行比較(均在Release版本號下)
對20000個隨機數據進行測試:
對50000個隨機數據進行測試:
再對200000個隨機數據進行測試:
注:有的書上是在mergearray()合並有序數列時分配暫時數組,可是過多的new操作會很費時。因此作了下小小的變化。僅僅在MergeSort()中new一個暫時數組。后面的操作都共用這一個暫時數組。