本章通過介紹插入排序和歸並排序兩種常見的排序算法來說明算法的過程及算法分析,在介紹歸並排序算法過程中引入了分治(divide-and-conquer)算法策略。
1、插入排序
輸入:n個數(a1,a2,a3,...,an)
輸出:輸入序列的一個排列(a1',a2',a3',...an')使得(a1'≤a2'≤a3'≤...≤an')。
插入排序的基本思想是:將第i個元素插入到前面i-1個已經有序的元素中。具體實現是從第2個元素開始(因為1個元素是有序的),將第2個元素插入到前面的1個元素中,構成兩個有序的序列,然后從第3個元素開始,循環操作,直到把第n元素插入到前面n-1個元素中,最終使得n個元素是有序的。該算法設計的方法是增量方法。書中給出了插入排序的為代碼,並采用循環不變式證明算法的正確性。我采用C語言實插入排序,完整程序如下:
1 void insert_sort(int *datas,int length) 2 { 3 int i,j; 4 int key,tmp; 5 //判斷參數是否合法 6 if(NULL == datas || 0==length) 7 { 8 printf("Check datas or length.\n"); 9 exit(1); 10 } 11 //數組下標是從0開始的,從第二個元素(對應下標1)開始向前插入 12 for(j=1;j<length;j++) 13 { 14 key = datas[j]; //記錄當前要插入的元素 15 i = j-1; //前面已經有序的元素 16 //尋找待插入元素的位置,從小到到排序,如果是從大到小改為datas[i]<key 17 while(i>=0 && datas[i] > key) 18 { 19 /×tmp = datas[i+1]; 20 datas[i+1] = datas[i]; 21 datas[i] = tmp;×/ 這個過程不需要進行交換,因為要插入的值保存在key中,沒有被覆蓋掉,在此感謝”兩生花“指出問題所在
datas[i+1] = datas[i]; 22 i--; //向前移動 23 } 24 datas[i+1] = key; //最終確定待插入元素的位置 25 } 26 }
插入排序算法的分析
算法分析是對一個算法所需的資源進行預測,資源是指希望測度的計算時間。插入排序過程的時間與輸入相關的。插入排序的最好情況是輸入數組開始時候就是滿足要求的排好序的,時間代價為θ(n),最壞情況下,輸入數組是按逆序排序的,時間代價為θ(n^2)。
2、歸並排序
歸並排序采用了算法設計中的分治法,分治法的思想是將原問題分解成n個規模較小而結構與原問題相似的小問題,遞歸的解決這些子問題,然后再去合並其結果,得到原問題的解。分治模式在每一層遞歸上有三個步驟:
分解(divide):將原問題分解成一系列子問題。
解決(conquer):遞歸地解答各子問題,若子問題足夠小,則直接求解。
合並(combine):將子問題的結果合並成原問題的解。
歸並排序(merge sort)算法按照分治模式,操作如下:
分解:將n個元素分解成各含n/2個元素的子序列
解決:用合並排序法對兩個序列遞歸地排序
合並:合並兩個已排序的子序列以得到排序結果
在對子序列排序時,長度為1時遞歸結束,單個元素被視為已排序好的。歸並排序的關鍵步驟在於合並步驟中的合並兩個已經有序的子序列,引入了一個輔助過程,merge(A,p,q,r),將已經有序的子數組A[p...q]和A[q+1...r]合並成為有序的A[p...r]。書中給出了采用哨兵實現merge的偽代碼,課后習題要求不使用哨兵實現merge過程。在這個兩種方法中都需要引入額外的輔助空間,用來存放即將合並的有序子數組,總的空間大小為n。現在用C語言完整實現這兩種方法,程序如下:
1 //采用哨兵實現merge 2 #define MAXLIMIT 65535 3 void merge(int *datas,int p,int q,int r) 4 { 5 int n1 = q-p+1; //第一個有序子數組元素個數 6 int n2 = r-q; //第二個有序子數組元素個數 7 int *left = (int*)malloc(sizeof(int)*(n1+1)); 8 int *right = (int*)malloc(sizeof(int)*(n2+1)); 9 int i,j,k; 10 //將子數組復制到臨時輔助空間 11 for(i=0;i<n1;++i) 12 left[i] = datas[p+i]; 13 for(j=0;j<n2;++j) 14 right[j] = datas[q+j+1]; 15 //添加哨兵 16 left[n1] = MAXLIMIT; 17 right[n2] = MAXLIMIT; 18 //從第一個元素開始合並 19 i = 0; 20 j = 0; 21 //開始合並 22 for(k=p;k<=r;k++) 23 { 24 if(left[i] < right[j]) 25 { 26 datas[k] = left[i]; 27 i++; 28 } 29 else 30 { 31 datas[k] = right[j]; 32 j++; 33 } 34 } 35 free(left); 36 free(right); 37 }
不采用哨兵實現,需要考慮兩個子數組在合並的過程中哪一個先合並結束,剩下的那個子數組剩下部分復制到數組中,程序實現如下:
1 int merge(int *datas,int p,int q,int r) 2 { 3 int n1 = q-p+1; 4 int n2 = r-q; 5 int *left = (int*)malloc(sizeof(int)*(n1+1)); 6 int *right = (int*)malloc(sizeof(int)*(n2+1)); 7 int i,j,k; 8 memcpy(left,datas+p,n1*sizeof(int)); 9 memcpy(right,datas+q+1,n2*sizeof(int)); 10 i = 0; 11 j = 0; 12 for(k=p;k<=r;++k) 13 { 14 if(i <n1 && j< n2) //歸並兩個子數組 15 { 16 if(left[i] < right[j]) 17 { 18 datas[k] = left[i]; 19 i++; 20 } 21 else 22 { 23 datas[k] = right[j]; 24 j++; 25 } 26 } 27 else 28 break; 29 } 30 //將剩下的合並到數組中 31 while(i != n1) 32 datas[k++] = left[i++]; 33 while(j != n2) 34 datas[k++] = right[j++]; 35 free(left); 36 free(right); 37 }
merge過程的運行時間是θ(n),現將merge過程作為歸並排序中的一個子程序使用,merge_sort(A,p,r),對數組A[p...r]進行排序,實例分析如下圖所示:
C語言實現如下:
1 void merge_sort(int *datas,int p,int r) 2 { 3 int q; 4 if(p < r) 5 { 6 q = (p+r)/2; //分解,計算出子數組的中間位置 7 merge_sort(datas,p,q); //對第一個子數組排序; 8 merge_sort(datas,q+1,r); //對第二個子數組排序 9 merge(datas,p,q,r); //合並; 10 } 11 }
歸並排序算法分析:
算法中含有對其自身的遞歸調用,其運行時間可以用一個遞歸方程(或遞歸式)來表示。歸並排序算法分析采用遞歸樹進行,遞歸樹的層數為lgn+1,每一層的時間代價是cn,整棵樹的代價是cn(lgn+1)=cnlgn+cn,忽略低階和常量c,得到結果為θ(nlg n)。
3、課后習題
有地道題目比較有意思,認真做了做,題目如下:
方法1:要求運行時間為θ(nlgn),對於集合S中任意一個整數a,設b=x-a,采用二分查找算法在S集合中查找b是否存在,如果b存在說明集合S中存在兩個整數其和等於x。而二分查找算起的前提是集合S是有序的,算法時間為θ(lgn),因此先需要采用一種時間最多為θ(nlgn)的算法對集合S進行排序。可以采用歸並排序算法,這樣總的運行時間為θ(nlgn),滿足題目給定的條件。
具體實現步驟:
1、采用歸並排序算法對集合S進行排序
2、對集合S中任意整數a,b=x-a,采用二分查找算法b是否在集合S中,若在則集合S中存在兩個整數其和等於x,如果遍歷了S中所有的元素,沒能找到b,即集合S中不存在兩個整數其和等於x。
采用C語言實現如下:

1 #include <stdio.h> 2 #include <stdlib.h> 3 #include <string.h> 4 5 //非遞歸二叉查找 6 int binary_search(int *datas,int length,int obj) 7 { 8 int low,mid,high; 9 low = 0; 10 high = length; 11 while(low < high) 12 { 13 mid = (low + high)/2; 14 if(datas[mid] == obj) 15 return mid; 16 else if(datas[mid] > obj) 17 high = mid; 18 else 19 low = mid+1; 20 } 21 return -1; 22 } 23 24 //遞歸形式二分查找 25 int binary_search_recursive(int *datas,int beg,int end,int obj) 26 { 27 int mid; 28 if(beg < end) 29 { 30 mid = (beg+end)/2; 31 if(datas[mid] == obj) 32 return mid; 33 if(datas[mid] > obj) 34 return binary_search_recursive(datas,beg,mid,obj); 35 else 36 return binary_search_recursive(datas,mid+1,end,obj); 37 38 } 39 return -1; 40 } 41 //合並子程序 42 int merge(int *datas,int p,int q,int r) 43 { 44 int n1 = q-p+1; 45 int n2 = r-q; 46 int *left = (int*)malloc(sizeof(int)*(n1+1)); 47 int *right = (int*)malloc(sizeof(int)*(n2+1)); 48 int i,j,k; 49 memcpy(left,datas+p,n1*sizeof(int)); 50 memcpy(right,datas+q+1,n2*sizeof(int)); 51 i = 0; 52 j = 0; 53 for(k=p;k<=r;++k) 54 { 55 if(i <n1 && j< n2) 56 { 57 if(left[i] < right[j]) 58 { 59 datas[k] = left[i]; 60 i++; 61 } 62 else 63 { 64 datas[k] = right[j]; 65 j++; 66 } 67 } 68 else 69 break; 70 } 71 while(i != n1) 72 datas[k++] = left[i++]; 73 while(j != n2) 74 datas[k++] = right[j++]; 75 free(left); 76 free(right); 77 } 78 //歸並排序 79 void merge_sort(int *datas,int beg,int end) 80 { 81 int pos; 82 if(beg < end) 83 { 84 pos = (beg+end)/2; 85 merge_sort(datas,beg,pos); 86 merge_sort(datas,pos+1,end); 87 merge(datas,beg,pos,end); 88 } 89 } 90 91 int main(int argc,char *argv[]) 92 { 93 int i,j,x,obj; 94 int datas[10] = {34,11,23,24,90,43,78,65,90,86}; 95 if(argc != 2) 96 { 97 printf("input error.\n"); 98 exit(0); 99 } 100 x = atoi(argv[1]); 101 merge_sort(datas,0,9); 102 for(i=0;i<10;i++) 103 { 104 obj = x - datas[i]; 105 j = binary_search_recursive(datas,0,10,obj); 106 //j = binary_search(datas,10,obj); 107 if( j != -1 && j!= i) //判斷是否查找成功 108 { 109 printf("there exit two datas (%d and %d) which their sum is %d.\n",datas[i],datas[j],x); 110 break; 111 } 112 } 113 if(i==10) 114 printf("there not exit two datas whose sum is %d.\n",x); 115 exit(0); 116 }
程序執行結果如下:
方法2:網上課后習題答案上面給的一種方法,具體思想如下:
1、對集合S進行排序,可以采用歸並排序算法
2、對S中每一個元素a,將b=x-a構造一個新的集合S',並對S’進行排序
3、去除S和S'中重復的數據
4、將S和S'按照大小進行歸並,組成新的集合T,若干T中有兩隊及以上兩個連續相等數據,說明集合S中存在兩個整數其和等於x。
例如:S={7,10,5,4,2,5},設x=11,執行過程如下:
對S進行排序,S={2,4,5,5,7,10}。
S'={9,7,6,6,4,1},排序后S’={1,4,6,6,7,9}。
去除S和S'中重復的數據后S={2,4,5,7,10},S'={1,4,6,7,9}
歸納S和S'組成新集合T={1,2,4,4,5,6,7,7,9,10},可以看出集合T中存在兩對連續相等數據4和7,二者存在集合S中,滿足4+7=11。