插入排序包括直接插入排序、希爾排序。
1、直接插入排序:
如何寫成代碼:
首先設定插入次數,即循環次數,for(int i=1;i<length;i++),1個數的那次不用插入。
設定插入數和得到已經排好序列的最后一個數的位數。insertNum和j=i-1。
從最后一個數開始向前循環,如果插入數小於當前數,就將當前數向后移動一位。
將當前數放置到空着的位置,即j+1。

代碼實現如下:
package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
public class InsertSortDirectly {
public static void insertSort(int[] a){
int length = a.length; //求取出length是為了提高速度
int insertNum ;
for(int i=1;i<length;i++){//要插入的數
insertNum = a[i];
int j = i-1;
while(j>=0&&insertNum<a[j]){
a[j+1] = a[j];
j--;
}
//比如3 6 5,此時找到j為3,則在j+1的位置插入5。
a[j+1]=insertNum;
}
}
public static void main(String[] args) {
int[] a= {3,6,5};
insertSort(a);
System.out.println(Arrays.toString(a));
}
}
直接插入排序,最好的情況是數據元素已經全部排好序,那么內循環次數為0,外循環次數為n-1,所以,最好的情況下時間復雜度為O(N)。最壞的情況是原始數據元素集合反序排列,此時,算法中內層while循環的循環次數每次均為i。因此,最壞的情況下時間復雜度為O(N^2)。直接插入排序的空間復雜度為O(1),顯然直接插入排序是一種穩定的排序算法。
2、希爾排序:


package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
public class SheelSort {
public static void SheelSort(int[] a){
int d = a.length;
while(d!=0){
d = d/2;
for(int x = 0; x < d; x++){//分的組數
for(int i=x+d; i<a.length; i=i+d){//組中的元素,從第2個開始
int j = i-d; //j為有序序列最后一位的位數
int temp = a[i]; //要插入的元素
for(; j>=0&&temp<a[j]; j=j-d){
a[j+d] = a[j];//向后移動d位
}
a[j+d] = temp;
}
}
}
}
public static void main(String[] args) {
int[] a ={592,401,874,141,348,72,911,887,820,283};
SheelSort(a);
System.out.println(Arrays.toString(a));
}
}
希爾排序雖然用了四重循環,但是其實前兩層的循環次數很少,后兩層就是直接插入排序,由於希爾排序小組內數據基本有序,因此內部的直接插入排序很快就排好。所以,希爾排序的時間復雜度為O(nlbn),空間復雜度為O(1),由於希爾排序算法是按增量分組進行的排序,所以,希爾排序是一種不穩定的排序算法。如5,1,1,5,如果采用步長為2,則兩個1相對位置進行了交換。
選擇排序包括直接選擇排序和堆排序。
3、直接選擇排序


package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
public class SelectSortDirectly {
public static void selectSort(int[] a){
int len = a.length;
int minIndex,temp;
for(int i=0;i<len-1;i++){
minIndex = i;
for(int j=i+1;j<len;j++){
if(a[j]<a[minIndex]){
minIndex = j;
}
}
temp = a[i];
a[i] = a[minIndex];
a[minIndex] = temp;
}
}
public static void main(String[] args) {
int[] a ={592,401,874,141,348,72,911,887,820,283};
selectSort(a);
System.out.println(Arrays.toString(a));
}
}
直接選擇排序的時間復雜度是O(N^2),空間復雜度是O(1),它是一種不穩定的排序算法。比如2 2 2 1,這樣選出最小數1和第一個2交換,那么2的相對位置發生了改變。如果在選出最小記錄后,將它前面的無序記錄依次后移,然后再將最小記錄放在有序區的后面,這樣就能保證排序算法的穩定性。
4、堆排序
對簡單選擇排序的優化。
將序列構建成大頂堆。
將根節點與最后一個節點交換,然后斷開最后一個節點。
重復第一、二步,直到所有節點斷開。
堆排序關鍵要理解,從下往上,調整節點,比如說,這棵樹一共3層,那么將第2層的樹作為根節點,保證它的子節點都小於它,此時,如果調整第1層,若其左節點是最大值,必然會將第一層根節點和左節點進行交換,以保證第1層滿足最大堆的結構,但此時,有可能會破壞第1層的左節點的最大堆結構,因此需要對這個第1層的左節點的堆進行重新調整。-------------這是關鍵要理解的地方!

package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
public class HeapSort {
public HeapSort(){
}
public static void heapSort(int[] a){
System.out.println("開始排序");
int arrayLength=a.length;
//循環建堆
for(int i=0;i<arrayLength-1;i++){
//建堆
buildMaxHeap(a,arrayLength-1-i);
//交換堆頂和最后一個元素
swap(a,0,arrayLength-1-i);
}
}
private static void swap(int[] data, int i, int j) {
//TODO Auto-generated method stub
int tmp=data[i];
data[i]=data[j];
data[j]=tmp;
}
//對data數組從0到lastIndex建大頂堆
private static void buildMaxHeap(int[] data, int lastIndex) {
//從lastIndex處節點(最后一個節點)的父節點開始
for(int i=(lastIndex-1)/2;i>=0;i--){
//k保存正在判斷的節點
int k=i;
//如果當前k節點的子節點存在
while(k*2+1<=lastIndex){
//k節點的左子節點的索引
int biggerIndex=2*k+1;
//如果biggerIndex小於lastIndex,即biggerIndex+1代表的k節點的右子節點存在
if(biggerIndex<lastIndex){
//若果右子節點的值較大
if(data[biggerIndex]<data[biggerIndex+1]){
//biggerIndex總是記錄較大子節點的索引
biggerIndex++;
}
}
//如果k節點的值小於其較大的子節點的值
if(data[k]<data[biggerIndex]){
//交換他們
swap(data,k,biggerIndex);
//將biggerIndex賦予k,開始while循環的下一次循環,重新保證k節點的值大於其左右子節點的值
//如果不理解,那么請使用打斷點的方式來運行,則可發現,當i=0時,由於節點1和節點0發生了交換,因此需要重新調整1節點的堆結構,保證
//1節點的值仍然大於其左右節點的值
k=biggerIndex;
}else{
break;
}
}
}
}
public static void main(String[] args) {
int a[] = {7,13,6,43,5,23,4};
heapSort(a);
System.out.println(Arrays.toString(a));
}
}
堆排序算法是基於完全二叉樹的排序,其時間復雜度是O(nlbn),其空間復雜度是O(1),堆排序是一種不穩定的排序算法,比如5 5 5,這樣,構建好最大堆后,第1個5和最后一個5要進行交換,因此,堆排序是一種不穩定的排序算法。
利用交換數據元素的位置進行排序的方法是交換排序。常用的交換排序有冒泡排序和快速排序。快速排序是一種分區交換排序方法。
5、冒泡排序
將序列中所有元素兩兩比較,將最大的放在最后面。
將剩余序列中所有元素兩兩比較,將最大的放在最后面。
重復第二步,直到只剩下一個數。

如何寫成代碼:
設置循環次數。
設置開始比較的位數,和結束的位數。
兩兩比較,將最小的放到前面去。
重復2、3步,直到循環次數完畢。

package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
public class BubbleSort {
public static void bubbleSort(int[] a){
boolean isSorted = true;
for(int i=0;i<a.length-1&&isSorted;i++){
isSorted = false;
for(int j=0;j<a.length-1-i;j++){
if(a[j]>a[j+1]){
int temp = a[j];
a[j] = a[j+1];
a[j+1] = temp;
isSorted = true;//內循環如果發生了交換,則證明還在繼續排序
}
}
//如果經過1趟就已經排序完畢,那么第2趟結束后,isSorted = false; ,此時,
//外循環可以根據isSorted的標記狀態提前結束。
}
}
public static void main(String[] args) {
int[] a ={592,401,874,141,348,72,911,887,820,283};
bubbleSort(a);
System.out.println(Arrays.toString(a));
}
}
冒泡排序的時間復雜度是O(n^2),空間復雜度為O(1),冒泡排序是一種穩定的排序算法。
快速排序是一種二叉樹結構的交換排序方法。
6、快速排序

package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
public class QuickSort {
/**
* 查找出中軸(默認是最低位low)的在numbers數組排序后所在位置
*
* @param numbers 帶查找數組
* @param low 開始位置
* @param high 結束位置
* @return 中軸所在位置
*/
public static int getMiddle(int[] numbers, int low,int high){
int temp = numbers[low]; //數組的第一個作為中軸
while(low < high){
while(low < high && numbers[high] > temp){
high--;
}
if(low<high){
numbers[low++] = numbers[high];//強制塞值並向前移一位
}
while(low < high && numbers[low] < temp){
low++;
}
if(low<high){
numbers[high--] = numbers[low] ; //強制塞值並向前移一位
}
}
numbers[low] = temp ; //中軸記錄到尾
return low ; // 返回中軸的位置
}
/**
*
* @param numbers 帶排序數組
* @param low 開始位置
* @param high 結束位置
*/
public static void quickSort(int[] numbers,int low,int high){
if(low < high){
int middle = getMiddle(numbers,low,high); //將numbers數組進行一分為二
quickSort(numbers, low, middle-1); //對低字段表進行遞歸排序
quickSort(numbers, middle+1, high); //對高字段表進行遞歸排序
}
}
/**
* 快速排序
* @param numbers 帶排序數組
*/
public static void quick(int[] numbers){
if(numbers.length > 0){ //查看數組是否為空{
quickSort(numbers, 0, numbers.length-1);
}
}
public static void main(String[] args) {
int a[] = {6,7,18,5,3,12};
quick(a);
System.out.println(Arrays.toString(a));
}
}
快速排序如果每次選取的標准元素都能均分兩個子數組區間長度,這樣的快速排序過程是一個完全二叉樹結構。最好情況下快速排序算法時間復雜度是O(nlbn)。快速排序最壞的情況是,數據元素已經全部有序,此時數組根節點的分解次數構成一顆二叉退化樹,所以,最壞情況下快速排序算法的時間復雜度是O(n^2)。
由於快速排序算法需要堆棧空間臨時保存遞歸調用參數,堆棧空間的使用個數和遞歸調用的次數有關,由於二叉樹有可能是單支二叉樹,而單支二叉樹的深度為n-1,所以,最壞情況下快速排序算法的空間復雜度是O(n)。
7、歸並排序


package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
public class MergeSort {
/**
* 歸並排序
* 簡介:將兩個(或兩個以上)有序表合並成一個新的有序表 即把待排序序列分為若干個子序列,每個子序列是有序的。然后再把有序子序列合並為整體有序序列
* 時間復雜度為O(nlogn)
* 穩定排序方式
* @param nums 待排序數組
* @return 輸出有序數組
*/
public static int[] sort(int[] nums, int low, int high) {
int mid = (low + high) / 2;
if (low < high) {
//左邊
sort(nums, low, mid);
//右邊
sort(nums, mid + 1, high);
//左右歸並
merge(nums, low, mid, high);
}
return nums;
}
public static void merge(int[] nums, int low, int mid, int high) {
int[] temp = new int[high - low + 1];
int i = low;// 左指針
int j = mid + 1;// 右指針
int k = 0;
//把較小的數先移到新數組中
while (i <= mid && j <= high) {
if (nums[i] < nums[j]) {
temp[k++] = nums[i++];
} else {
temp[k++] = nums[j++];
}
}
//把左邊剩余的數移入數組
while (i <= mid) {
temp[k++] = nums[i++];
}
//把右邊邊剩余的數移入數組
while (j <= high) {
temp[k++] = nums[j++];
}
//把新數組中的數覆蓋nums數組
for (int k2 = 0; k2 < temp.length; k2++) {
nums[k2 + low] = temp[k2];
}
}
//歸並排序的實現
public static void main(String[] args) {
int[] nums = { 2, 7, 8, 3, 1, 6, 9, 0, 5, 4 };
MergeSort.sort(nums, 0, nums.length-1);
System.out.println(Arrays.toString(nums));
}
}
歸並排序的時間復雜度是O(nlbn),由於歸並排序使用了n個臨時內存單元存放數據元素,所以,歸並排序算法的空間復雜度是O(n)。
歸並排序是一種穩定的排序算法。前面的幾個時間復雜度是O(nlbn)的排序算法都是不穩定的排序算法,而歸並排序算法不僅時間復雜度是O(nlbn),而且還是一種穩定的排序算法。這是歸並排序算法的最大特點。
8、基數排序
基數排序,因為要求進出桶中的數據元素要滿足先入先出的原則,因此,這里所說的桶其實就是隊列。

package zhouls.bigdata.DataFeatureSelection;
import java.util.Arrays;
/*
* 對於一個int數組,請編寫一個基數排序算法,對數組元素排序。
* 給定一個int數組A及數組的大小n,請返回排序后的數組。保證元素均小於等於2000。
*
測試樣例:
[1,2,3,5,2,3],6
[1,2,2,3,3,5]
*/
public class RadisSort {
//各位裝通法
public static int[] radixSort(int[] A, int n) {
//首先確定排序的趟數;
int max=A[0];
for(int i=1;i<n;i++){
if(A[i]>max){
max=A[i];
}
}
int time=0;
//判斷位數;
while(max>0){
max/=10;
time++;
}
int length = n;
int divisor = 1;// 定義每一輪的除數,1,10,100...
int[][] bucket = new int[10][length];// 定義了10個桶,以防每一位都一樣全部放入一個桶中
int[] count = new int[10];// 統計每個桶中實際存放的元素個數
int digit;// 獲取元素中對應位上的數字,即裝入那個桶
for (int i = 1; i <= time; i++) {// 經過4次裝通操作,排序完成
for (int temp : A) {// 計算入桶
digit = (temp / divisor) % 10;
bucket[digit][count[digit]++] = temp;
}
int k = 0;// 被排序數組的下標
for (int b = 0; b < 10; b++) {// 從0到9號桶按照順序取出
if (count[b] == 0)// 如果這個桶中沒有元素放入,那么跳過
continue;
for (int w = 0; w < count[b]; w++) {
A[k++] = bucket[b][w];
}
count[b] = 0;// 桶中的元素已經全部取出,計數器歸零
}
divisor *= 10;
}
return A;
}
public static void main(String[] args) {
int a[] = {1,2,3,5,2,3};
System.out.println(Arrays.toString(radixSort(a, a.length)));
}
}
基數排序時間復雜度是O(mn),m是數字的最大位數,由於基數排序算法中要m次使用n個節點臨時存放n個數據元素,因此,基數排序算法的空間復雜度為O(n)。
基數排序是一種穩定的排序算法。
總結:
排序分內部排序和外部排序兩種。內部排序是指把待排數據元素全部調入內存中進行的排序。如果數據元素的數量太大,需要分批導入內存中。分批導入內存的數據元素排好序后再分批導出到磁盤的排序方法稱作外部排序。兩者排序算法原理很大地方都相同,但是內存中的讀寫速度和在外存的讀寫速度差別很大,所以評價標准差別很大。這里只討論內部排序。
排序算法優劣的標准:
1、時間復雜度。
2、空間復雜度:算法中使用的輔助存儲空間是多少。當排序算法中使用的輔助存儲空間與要排序數據元素的個數n無關時,其空間復雜度為O(1)。
3、穩定性。
各種排序算法性能比較:
排序方法 最好時間 平均時間 最壞時間 最壞輔助空間 穩定性
直接插入排序 O(n) O(n^2) O(n^2) O(1) 穩定
希爾排序 O(nlbn) O(nlbn) O(nlbn) O(1) 不穩定
直接選擇排序 O(n^2) O(n^2) O(n^2) O(1) 不穩定
堆排序 O(nlbn) O(nlbn) O(nlbn) O(1) 不穩定
冒泡排序 O(n) O(n^2) O(n^2) O(1) 穩定
快速排序 O(nlbn) O(nlbn) O(n^2) O(n) 不穩定
歸並排序 O(nlbn) O(nlbn) O(nlbn) O(n) 穩定
基數排序 O(mn) O(mn) O(mn) O(n) 穩定

