接上文--->【每日算法】C語言8大經典排序算法(1)
二、插入類排序
插入排序(Insertion Sort)的基本思想是:每次將一個待排序的記錄,按其關鍵字大小插入到前面已經排好序的子文件中的適當位置,直到全部記錄插入完成為止。
插入排序一般意義上有兩種:直接插入排序和希爾排序,下面分別介紹。
3、直接插入排序
基本思想:
最基本的操作是將第i個記錄插入到前面i-1個以排好序列的記錄中。具體過程是:將第i個記錄的關鍵字K依次與其前面的i-1個已經拍好序列的記錄進行比較。將所有大於K的記錄依次向后移動一個位置,直到遇到一個關鍵字小於或等於K的記錄,此時它后面的位置必定為空,則將K插入。
圖示:
C語言實現:
void InsertSort(int arr[], int n) { int temp; int i,j; for (int i = 1; i < arr.Length; i++)
{
int temp = arr[i];
int j = i;
while ((j > 0) && (arr[j - 1] > t))
{
arr[j] = arr[j - 1];//交換順序
--j;
}
arr[j] = temp;
} }
算法分析:
1.算法的時間性能分析
對於具有n個記錄的文件,要進行n-1趟排序。
各種狀態下的時間復雜度:
初始文件狀態 正序 反序 無序(平均)
字比較次數 1 i+1 (i-2)/2
總關鍵字比較次數 n-1 (n+2)(n-1)/2 ≈n2/4
第i趟記錄移動次數 0 i+2 (i-2)/2
總的記錄移動次數 0 (n-1)(n+4)/2 ≈n2/4
時間復雜度 0(n) O(n2) O(n2)
注意:
初始文件按關鍵字遞增有序,簡稱"正序"。
初始文件按關鍵字遞減有序,簡稱"反序"。
2.算法的空間復雜度分析
算法所需的輔助空間是一個監視哨,輔助空間復雜度S(n)=O(1)。是一個就地排序。
3.直接插入排序的穩定性
直接插入排序是穩定的排序方法。
直接插入排序法,針對少量的數據項排序,速度比較快,數據越大,這中方法的劣勢也就越明顯了。
改進方案:折半插入排序(binary insertion sort)
思路:折半插入排序(binary insertion sort)是對插入排序算法的一種改進,由於排序算法過程中,就是不斷的依次將元素插入前面已排好序的序列中。由於前半部分為已排好序的數列,這樣我們不用按順序依次尋找插入點,可以采用折半查找的方法來加快尋找插入點的速度。
具體操作:在將一個新元素插入已排好序的數組的過程中,尋找插入點時,將待插入區域的首元素設置為a[low],末元素設置為a[high],則輪比較時將待插入元素與a[m],其中m=(low+high)/2相比較,如果比參考元素小,則選擇a[low]到a[m-1]為新的插入區域(即high=m-1),否則選擇a[m+1]到a[high]為新的插入區域(即low=m+1),如此直至low<=high不成立,即將此位置之后所有元素后移一位,並將新元素插入a[high+1]。
C語言實現:
void BInsertSort(int data[],int n) { int low,high,mid; int temp,i,j; for(i=1;i<n;i++) { low=0; temp=data[i];// 保存要插入的元素 high=i-1; while(low<=high) //折半查找到要插入的位置 { mid=(low+high)/2; if(data[mid]>temp) high=mid-1; else low=mid+1; } int j = i; while ((j > low) && (arr[j - 1] > t)) { arr[j] = arr[j - 1];//交換順序 --j; } arr[low] = temp; } }
算法分析:折半插入排序算法是一種穩定的排序算法,比直接插入算法明顯減少了關鍵字之間比較的次數,因此速度比直接插入排序算法快,但記錄移動的次數沒有變,所以折半插入排序算法的時間復雜度仍然為O(n^2),與直接插入排序算法相同。附加空間O(1)。
4、希爾排序
希爾排序(Shell Sort)是插入排序的一種。是針對直接插入排序算法的改進。該方法又稱縮小增量排序,因DL.Shell於1959年提出而得名。
基本思想:
先取一個小於n的整數d1作為第一個增量,把文件的全部記錄分成d1個組。所有距離為dl的倍數的記錄放在同一個組中。先在各組內進行直接插人排序;然后,取第二個增量d2<d1重復上述的分組和排序,直至所取的增量dt=1(dt<dt-l<…<d2<d1),即所有記錄放在同一組中進行直接插入排序為止。
該方法實質上是一種分組插入方法。
舉例闡述:
例如,假設有這樣一組數[ 13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10 ],如果我們以步長為5開始進行排序,我們可以通過將這列表放在有5列的表中來更好地描述算法,這樣他們就應該看起來是這樣:
13 14 94 33 82 25 59 94 65 23 45 27 73 25 39 10
然后我們對每列進行排序:
10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45
將上述四行數字,依序接在一起時我們得到:[ 10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45 ].這時10已經移至正確位置了,然后再以3為步長進行排序:
10 14 73 25 23 13 27 94 33 39 25 59 94 65 82 45
排序之后變為:
10 14 13 25 23 33 27 25 59 39 65 73 45 94 82 94
最后以1步長進行排序(此時就是簡單的插入排序了)。
圖示:
C++代碼實現:
1 void shellsort(int *data, size_t size) 2 { 3 for (int gap = size / 2; gap > 0; gap /= 2) 4 for (int i = gap; i < size; ++i) 5 { 6 7 int key = data[i]; 8 int j = 0; 9 for( j = i -gap; j >= 0 && data[j] > key; j -=gap) 10 { 11 data[j+gap] = data[j]; 12 } 13 data[j+gap] = key; 14 } 15 }
性能分析:
希爾排序是按照不同步長對元素進行插入排序,當剛開始元素很無序的時候,步長最大,所以插入排序的元素個數很少,速度很快;當元素基本有序了,步長很小,插入排序對於有序的序列效率很高。所以,希爾排序的時間復雜度會比o(n^2)好一些。由於多次插入排序,我們知道一次插入排序是穩定的,不會改變相同元素的相對順序,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,最后其穩定性就會被打亂,所以shell排序是不穩定的。
最差時間復雜度 | 根據步長序列的不同而不同。 已知最好的: ![]() |
---|---|
最優時間復雜度 | O(n) |
平均時間復雜度 | 根據步長序列的不同而不同。 |