十大排序算法

本文轉載自查看原文 2021-11-26 09:32 117 算法

冒泡排序

從數組頭開始，比較相鄰的元素。如果第一個比第二個大(小)，就交換它們兩個
對每一對相鄰元素作同樣的工作，從開始第一對到尾部的最后一對，這樣在最后的元素應該會是最大(小)的數
重復步驟1~2，重復次數等於數組的長度，直到排序完成

代碼實現

對下面數組實現排序：{24, 7, 43, 78, 62, 98, 82, 18, 54, 37, 73, 9}

代碼實現

public class BubbleSort {

    public static final int[] ARRAY = {24, 7, 43, 78, 62, 98, 82, 18, 54, 37, 73, 9};

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        for (int i = 0; i < array.length; i++) {
            //array.length - 1 -i 已經冒泡到合適位置無需在進行排序，減少比較次數
            for (int j = 0; j < array.length - 1 -i; j++) {
                //前面的數大於后面的數交換
                if (array[j + 1] < array[j]) {
                    int temp = array[j + 1];
                    array[j + 1] = array[j];
                    array[j] = temp;
                }
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }
}

時間復雜度

對於上面12個數據項，從第一個元素開始，第一趟比較了11次，第二趟比較了10次，依次類推，一直到最后一趟，就是：

11 + 10 + 9 + 8 + 7 + 6 + 5  + 4 + 3  + 2 + 1  =  66次

若有n個元素，則第一趟比較為(n-1)次，第二趟比較為(n-2)次，依次類推：

(n-1) + (n-2) + (n-3) + ...+ 2 + 1 = n * (n-1)/2

在大O表示法中，去掉常數系數和低階項，該排序方式的時間復雜度為：O(n²)

算法穩定性

假定在待排序的記錄序列中，存在多個具有相同的關鍵字的記錄，若經過排序，這些記錄的相對次序保持不變，即在原序列中，r[i]=r[j]，且r[i]在r[j]之前，而在排序后的序列中，r[i]仍在r[j]之前，則稱這種排序算法是穩定的；否則稱為不穩定的。——百度百科

在代碼中可以看到，array[j + 1] = array[j]的時候，我們可以不移動array[i]和array[j]，所以冒泡排序是穩定的。

選擇排序

找到數組中最大（或最小）的元素
將它和數組的第一個元素交換位置（如果第一個元素就是最大（小）元素那么它就和自己交換）
在剩下的元素中找到最大（小）的元素，將它與數組的第二個元素交換位置。如此往復，直到將整個數組排序。

代碼實現

對下面數組實現排序：{87, 23, 7, 43, 78, 62, 98, 81, 18, 53, 73, 9}

動圖演示

選擇排序

代碼實現

public class SelectionSort {

    public static final int[] ARRAY = {87, 23, 7, 43, 78, 62, 98, 81, 18, 53, 73, 9};

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        for (int i = 0; i < array.length; i++) {
            //最小數的下標，每個循環開始總是假設第一個數最小
            int minIndex = i;
            for (int j = i; j < array.length; j++) {
                //找到最小索引
                if (array[j] < array[minIndex]) {
                    //保存最小索引
                    minIndex = j;
                }
            }
            //最小索引的值
            int temp = array[minIndex];
            array[minIndex] = array[i];
            array[i] = temp;
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

很明顯，和冒泡排序相比，在查找最小（或最大）元素的索引，比較次數仍然保持為O(n²)

，但元素交換次數為O(n)。

算法穩定性

選擇排序是給每個位置選擇當前元素最小的，比如給第一個位置選擇最小的，在剩余元素里面給第二個元素選擇第二小的，依次類推，直到第n-1個元素，第n個元素不用選擇了，因為只剩下它一個最大的元素了。那么，在一趟選擇，如果一個元素比當前元素小，而該小的元素又出現在一個和當前元素相等的元素后面，那么交換后穩定性就被破壞了。舉個例子，數組5，8，5，2，9，我們知道第一遍選擇第1個元素5會和2交換，那么原序列中兩個5的相對前后順序就被破壞了，所以選擇排序是一個不穩定的排序算法。

插入排序

當我們在玩撲克牌的時候，總是在牌堆里面抽取最頂部的一張然后按順序在手中排列。

插入排序是指在待排序的元素中，假設前面n-1(其中n>=2)個數已經是排好順序的，現將第n個數插到前面已經排好的序列中，然后找到合適自己的位置，使得插入第n個數的這個序列也是排好順序的。

對於未排序數據（一般取數組的二個元素，把第一個元素當做有序數組），在已排序序列中從左往右掃描，找到相應位置並插入。
為了給要插入的元素騰出空間，需要將插入位置之后的已排序元素在都向后移動一位。

代碼實現

對下面數組實現排序：{15, 51, 86, 70, 6, 42, 26, 61, 45, 81, 17, 1}

動圖演示

插入排序

代碼實現

public class InsertionSort {

    public static final int[] ARRAY = {15, 51, 86, 70, 6, 42, 26, 61, 45, 81, 17, 1};

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        //待排序數據，改數據之前的已被排序
        int current;
        for (int i = 0; i < array.length - 1; i++) {
            //已被排序數據的索引
            int index = i;
            current = array[index + 1];
            //將當前元素后移一位
            while (index >= 0 && current < array[index]) {
                array[index + 1] = array[index];
                index--;
            }
            //插入
            array[index + 1] = current;
        }
        return array;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

在上面圖示中，第一趟循環比較一次，第二趟循環兩次，依次類推，則最后一趟比較n-1次：

1 + 2 + 3 +… + n-1 = n*(n-1)/2

也就是說，在最壞的情況下（逆序），比較的時間復雜度為O(n²)

在最優的情況下，即while循壞總是假的，只需當前數跟前一個數比較一下就可以了，這時一共需要比較n-1次，時間復雜度為O(n)。

算法穩定性

在比較的時候，過兩個數相等的話，不會進行移動，前后兩個數的次序不會發生改變，所以插入排序是穩定的。

希爾排序

一種基於插入排序的快速的排序算法。簡單插入排序對於大規模亂序數組很慢，因為元素只能一點一點地從數組的一端移動到另一端。例如，如果主鍵最小的元素正好在數組的盡頭，要將它挪到正確的位置就需要n-1次移動。

希爾排序為了加快速度簡單地改進了插入排序，也稱為縮小增量排序。

希爾排序是把待排序數組按一定的數量分組，對每組使用直接插入排序算法排序；然后縮小數量繼續分組排序，隨着數量逐漸減少，每組包含的元素越來越多，當數量減至 1 時，整個數組恰被分成一組，排序便完成了。這個不斷縮小的數量，就構成了一個增量序列，這里的數量稱為增量。

代碼實現

public class ShellSort {

    public static final int[] ARRAY = {12, 9, 6, 11, 5, 1, 14, 2, 10, 4, 8, 7, 13, 3};

    public static int[] sort(int[] array) {
        int len = array.length;
        if (len < 2) {
            return array;
        }
        //當前待排序數據，該數據之前的已被排序
        int current;
        //增量
        int gap = len / 2;
        while (gap > 0) {
            for (int i = gap; i < len; i++) {
                current = array[i];
                //前面有序序列的索引
                int index = i - gap;
                while (index >= 0 && current < array[index]) {
                    array[index + gap] = array[index];
                    //有序序列的下一個
                    index -= gap;
                }
                //插入
                array[index + gap] = current;
            }
            //int相除取整
            gap = gap / 2;
        }
        return array;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

希爾排序的復雜度和增量序列有關。

在先前較大的增量下每個子序列的規模都不大,用直接插入排序效率都較高，盡管在隨后的增量遞減分組中子序列越來越大,由於整個序列的有序性也越來越明顯,則排序效率依然較高。

從理論上說，只要一個數組是遞減的，並且最后一個值是1，都可以作為增量序列使用。有沒有一個步長序列,使得排序過程中所需的比較和移動次數相對較少,並且無論待排序列記錄數有多少,算法的時間復雜度都能漸近最佳呢？但是目前從數學上來說，無法證明某個序列是最好的。

常用的增量序列：

希爾增量序列：{n/2, (n / 2)/2, ..., 1}，其中N為原始數組的長度，這是最常用的序列，但卻不是最好的
Hibbard序列：{2^k-1, ..., 3,1}
Sedgewick序列：{... , 109 , 41 , 19 , 5，1} 表達式為9 * 4ⁱ- 9 * 2ⁱ + 1，i = 0，1，2，3，4...

算法穩定性

由於多次插入排序，我們知道一次插入排序是穩定的，不會改變相同元素的相對順序，但在不同的插入排序過程中，相同的元素可能在各自的插入排序中移動，如數組5，2，2，1，第一次排序第一個元素5會和第三個元素2交換，第二個元素2會和第四個元素1交換，原序列中兩個2的相對前后順序就被破壞了，所以希爾排序是一個不穩定的排序算法。

歸並排序

歸並，指合並，合在一起。歸並排序（Merge Sort）是建立在歸並操作上的一種排序算法。其主要思想是分而治之。什么是分而治之？分而治之就是將一個復雜的計算，按照設定的閾值進行分解成多個計算，然后將各個計算結果進行匯總。即“分”就是把一個大的通過遞歸拆成若干個小的，“治”就是將分后的結果在合在一起。

若將兩個有序集合並成一個有序表，稱為2-路歸並，與之對應的還有多路歸並。

怎么分

對於排序最好的情況來講，就是只有兩個元素，這時候比較大小就很簡單，但是還是需要比較
如果拆分為左右各一個，無需比較即是有序的。

怎么治

借助一個輔助空數組，把左右兩邊的數組按照大小比較，按順序放入輔助數組中即可。

以下面兩個有序數組為例：

歸並排序

代碼實現

public class MergeSort {
    public static final int[] ARRAY = {8, 5, 6, 4, 3, 1, 7, 2};

    public static int[] sort(int[] array) {
        if (array.length < 2) return array;
        int mid = array.length / 2;
        //分成2組
        int[] left = Arrays.copyOfRange(array, 0, mid);
        int[] right = Arrays.copyOfRange(array, mid, array.length);
        //遞歸拆分
        return merge(sort(left), sort(right));
    }

    //治---合並
    public static int[] merge(int[] left, int[] right) {
        int[] result = new int[left.length + right.length];
        //i代表左邊數組的索引，j代表右邊
        for (int index = 0, i = 0, j = 0; index < result.length; index++) {
            if (i >= left.length) {//說明左側的數據已經全部取完，取右邊的數據
                result[index] = right[j++];
            } else if (j >= right.length) {//說明右側的數據已經全部取完，取左邊的數據
                result[index] = left[i++];
            } else if (left[i] > right[j]) {//左邊大於右邊，取右邊的
                int a = right[j++];
                result[index] = a;
            } else {//右邊大於左邊，取左邊的
                result[index] = left[i++];
            }
        }
        return result;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

歸並排序方法就是把一組n個數的序列，折半分為兩個序列，然后再將這兩個序列再分，一直分下去，直到分為n個長度為1的序列。然后兩兩按大小歸並。如此反復，直到最后形成包含n個數的一個數組。

歸並排序總時間 = 分解時間 + 子序列排好序時間 + 合並時間

無論每個序列有多少數都是折中分解，所以分解時間是個常數，可以忽略不計，則：

歸並排序總時間 = 子序列排好序時間 + 合並時間

假設處理的數據規模大小為 n，運行時間設為：T(n)，則T(n) = n，當 n = 1時，T(1) = 1

由於在合並時，兩個子序列已經排好序，所以在合並的時候只需要 if 判斷即可，所以n個數比較，合並的時間復雜度為 n。

將 n 個數的序列，分為兩個 n/2 的序列，則：T(n) = 2T(n/2) + n
將 n/2 個數的序列，分為四個 n/4 的序列，則：T(n) = 4T(n/4) + 2n
將 n/4 個數的序列，分為八個 n/8 的序列，則：T(n) = 8T(n/8) + 3n
......
將 n/2^k 個數的序列，分為2^k個 n/2^k 的序列，則：T(n) = 2^kT(n/2^k) + kn

當 T(n/2^k) = T(1)時，即n/2^k = 1（此時也是把n分解到只有1個數據的時候），轉換為以2為底n的對數：k = log₂ⁿ，把k帶入到T(n)中，得：T(n) = n + nlog₂ⁿ。

使用大O表示法，去掉常數項 n，省略底數 2，則歸並排序的時間復雜度為：O(nlogⁿ)

算法穩定性

從原理分析和代碼可以看出，為在合並的時候，如果相等，選擇前面的元素到輔助數組，所以歸並排序是穩定的。

快速排序

快速排序是對冒泡排序的一種改進，也是采用分治法的一個典型的應用。JDK中Arrays的sort()方法，具體的排序細節就是使用快速排序實現的。

從數組中任意選取一個數據（比如數組的第一個數或最后一個數）作為關鍵數據，我們稱為基准數(pivot，或中軸數)，然后將所有比它小的數都放到它前面，所有比它大的數都放到它后面，這個過程稱為一趟快速排序，也稱為分區（partition）操作。

問題

若給定一個無序數組 [8, 5, 6, 4, 3, 1, 7, 2]，並指定一個數為基准，拆分數組使得左側的數都小於等於它，右側的數都大於它。

基准的選取最優的情況是基准值剛好取在無序區數值的中位數，這樣能夠最大效率地讓兩邊排序，同時最大地減少遞歸划分的次數，但是一般很難做到最優。基准的選取一般有三種方式：

選取數組的第一個元素
選取數組的最后一個元素
以及選取第一個、最后一個以及中間的元素的中位數（如4 5 6 7, 第一個4, 最后一個7, 中間的為5, 這三個數的中位數為５, 所以選擇5作為基准）。

思路

隨機選擇數組的一個元素，比如 6 為基准，拆分數組同時引入一個初始指針，也叫分區指示器，初始指針指向 -1
將數組中的元素和基准數遍歷比較
若當前元素大於基准數，不做任何變化
若當前元素小於等於基准數時，分割指示器右移一位，同時
- 當前元素下標小於等於分區指示器時，當前元素保持不動
- 當前元素下標大於分區指示器時，當前元素和分區指示器所指元素交換

快速排序

荷蘭國旗問題

荷蘭的國旗是由紅白藍三種顏色構成，如圖：

若現在給一個隨機的圖形，如下：

把這些條紋按照顏色排好，紅色的在上半部分，白色的在中間部分，藍色的在下半部分，這類問題稱作荷蘭國旗問題。

對應leetcode：顏色分類

給定一個包含紅色、白色和藍色，一共 n 個元素的數組，原地對它們進行排序，使得相同顏色的元素相鄰，並按照紅色、白色、藍色順序排列。

分析：

假如給定一個數組[8, 3, 6, 2, 5, 1, 7, 5]，做如下操作：

隨機選擇數組的一個元素，比如 5 為基准，拆分數組同時引入一個左分區指示器，指向 -1，右分區指示器指向基准數（注：此時的基准數為尾元素）
若當前元素大於基准數，右分區指示器左移一位，當前元素和右分區指示器所指元素交換，

索引保持不變
若當前元素小於等於基准數時，左分區指示器右移一位，索引右移
- 當前元素大於等於左分區指示器所指元素，當前元素保持不動
- 當前元素小於左分區指示器所指元素，交換

簡單來說就是，左分區指示器向右移動的過程中，如果遇到大於或等於基准數時，則停止移動，右分區指示器向左移動的過程中，如果遇到小於或等於主元的元素則停止移動。這種操作也叫雙向快速排序。

345345

代碼實現

public class QuickSort {

    public static final int[] ARRAY = {8, 5, 6, 4, 3, 1, 7, 2};

    public static final int[] ARRAY2 = {8, 3, 6, 2, 5, 1, 7, 5};

    private static int[] sort(int[] array, int left, int right) {
        if (array.length < 1 || left > right) return null;
        //拆分
        int partitionIndex = partition(array, left, right);
        //遞歸
        if (partitionIndex > left) {
            sort(array, left, partitionIndex - 1);
        }
        if (partitionIndex < right) {
            sort(array, partitionIndex + 1, right);
        }
        return array;
    }

    /**
     * 分區快排操作
     *
     * @param array 原數組
     * @param left  左側頭索引
     * @param right 右側尾索引
     * @return 分區指示器  最后指向基准數
     */
    public static int partition(int[] array, int left, int right) {
        //基准數下標---隨機方式取值，也就是數組的長度隨機1-8之間
        int pivot = (int) (left + Math.random() * (right - left + 1));
        //分區指示器索引
        int partitionIndex = left - 1;
        //基准數和尾部元素交換
        swap(array, pivot, right);
        //按照規定，如果當前元素大於基准數不做任何操作；
        //小於基准數，分區指示器右移，且當前元素的索引大於分區指示器，交換
        for (int i = left; i <= right; i++) {
            if (array[i] <= array[right]) {//當前元素小於等於基准數
                partitionIndex++;
                if (i > partitionIndex) {//當前元素的索引大於分區指示器
                    //交換
                    swap(array, i, partitionIndex);
                }
            }
        }
        return partitionIndex;
    }

    /**
     * 雙向掃描排序
     */
    public static int partitionTwoWay(int[] array, int left, int right) {
        //基准數
        int pivot = array[right];
        //左分區指示器索引
        int leftIndex = left - 1;
        //右分區指示器索引
        int rightIndex = right;
        //索引
        int index = left;
        while (index < rightIndex) {
            //若當前元素大於基准數，右分區指示器左移一位，當前元素和右分區指示器所指元素交換，索引保持不變
            if (array[index] > pivot) {
                swap(array, index, --rightIndex);
            } else if (array[index] <= pivot) {//當前元素小於等於基准數時，左分割指示器右移一位，索引右移
                leftIndex++;
                index++;
                //當前元素小於等於左分區指示器所指元素，交換
                if (array[index] < array[leftIndex]) {
                    swap(array, index, leftIndex);
                }
            }
        }
        //索引和 L 指向同一個元素
        swap(array, right, rightIndex);
        return 1;
    }

    //交換
    private static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }


    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY, 0, ARRAY.length - 1));
        System.out.println("====================雙向排序==================");
        print(ARRAY2);
        System.out.println("============================================");
        print(sort(ARRAY2, 0, ARRAY2.length - 1));
    }
}

時間復雜度

在拆分數組的時候可能會出現一種極端的情況，每次拆分的時候，基准數左邊的元素個數都為0，而右邊都為n-1個。這個時候，就需要拆分n次了。而每次拆分整理的時間復雜度為O(n)，所以最壞的時間復雜度為O(n²)。什么意思？舉個簡單例子：

在不知道初始序列已經有序的情況下進行排序，第1趟排序經過n-1次比較后，將第1個元素仍然定在原來的位置上，並得到一個長度為n-1的子序列；第2趟排序經過n-2次比較后，將第2個元素確定在它原來的位置上，又得到一個長度為n-2的子序列；以此類推，最終總的比較次數：

C(n) = (n-1) + (n-2) + ... + 1 = n(n-1)/2

所以最壞的情況下，快速排序的時間復雜度為O(n^2)

而最好的情況就是每次拆分都能夠從數組的中間拆分，這樣拆分logn次就行了，此時的時間復雜度為O(nlogn)。

而平均時間復雜度，則是假設每次基准數隨機，最后算出來的時間復雜度為O(nlogn)

參考：快速排序的時間復雜度與空間復雜度

算法穩定性

通過上面的分析可以知道，在隨機取基准數的時候，數據是可能會發生變化的，所以快速排序有不是穩定的情況。

堆排序

這里的堆並不是JVM中堆棧的堆，而是一種特殊的二叉樹，通常也叫作二叉堆。它具有以下特點：

它是完全二叉樹
堆中某個結點的值總是不大於或不小於其父結點的值

知識補充

二叉樹

樹中節點的子節點不超過2的有序樹

滿二叉樹

二叉樹中除了葉子節點，每個節點的子節點都為2，則此二叉樹為滿二叉樹。

完全二叉樹

如果對滿二叉樹的結點進行編號，約定編號從根結點起，自上而下，自左而右。則深度為k的，有n個結點的二叉樹，當且僅當其每一個結點都與深度為k的滿二叉樹中編號從1至n的結點一一對應時，稱之為完全二叉樹。

特點：葉子結點只能出現在最下層和次下層，且最下層的葉子結點集中在樹的左部。需要注意的是，滿二叉樹肯定是完全二叉樹，而完全二叉樹不一定是滿二叉樹。

二叉堆

二叉堆是一種特殊的堆，可以被看做一棵完全二叉樹的數組對象，而根據其性質又可以分為下面兩種：

大根堆：每一個根節點都大於等於它的左右孩子節點，也叫最大堆
小根堆：每一個根節點都小於等於它的左右孩子節點，也叫最小堆

如果把一個數組通過大根堆的方式來表示（數組元素的值是可變的），如下：

由此可以推出：

對於位置為 k 的節點，其子節點的位置分別為，左子節點 = 2k + 1，右子節點 = 2(k + 1)

如：對於 k = 1，其節點的對應數組為 5

左子節點的位置為 3，對應數組的值為 3

右子節點的位置為 4，對應數組的值為 2
最后一個非葉子節點的位置為 (n/2) - 1，n為數組長度

如：數組長度為6，則 (6/2) - 1 = 2，即位置 2 為最后一個非葉子節點

給定一個隨機數組[35,63,48,9,86,24,53,11]，將該數組視為一個完全二叉樹：

從上圖很明顯的可以看出，這個二叉樹不符合大根堆的定義，但是可以通過調整，使它變為最大堆。如果從最后一個非葉子節點開始，從下到上，從右往左調整，則：

通過上面的調整，該二叉樹為最大堆，這個時候開始排序，排序規則：

將堆頂元素和尾元素交換
交換后重新調整元素的位置，使之重新變成二叉堆

代碼實現

public class HeapSort {

    public static final int[] ARRAY = {35, 63, 48, 9, 86, 24, 53, 11};

    public static int[] sort(int[] array) {
        //數組的長度
        int length = array.length;
        if (length < 2) return array;
        //首先構建一個最大堆
        buildMaxHeap(array);
        //調整為最大堆之后，頂元素為最大元素並與微元素交換
        while (length > 0) {//當lenth <= 0時，說明已經到堆頂
            //交換
            swap(array, 0, length - 1);
            length--;//交換之后相當於把樹中的最大值彈出去了，所以要--
            //交換之后從上往下調整使之成為最大堆
            adjustHeap(array, 0, length);
        }
        return array;
    }

    //對元素組構建為一個對應數組的最大堆
    private static void buildMaxHeap(int[] array) {
        //在之前的分析可知，最大堆的構建是從最后一個非葉子節點開始，從下往上，從右往左調整
        //最后一個非葉子節點的位置為：array.length/2 - 1
        for (int i = array.length / 2 - 1; i >= 0; i--) {
            //調整使之成為最大堆
            adjustHeap(array, i, array.length);
        }
    }

    /**
     * 調整
     * @param parent 最后一個非葉子節點
     * @param length 數組的長度
     */
    private static void adjustHeap(int[] array, int parent, int length) {
        //定義最大值的索引
        int maxIndex = parent;
        //parent為對應元素的位置（數組的索引）
        int left = 2 * parent + 1;//左子節點對應元素的位置
        int right = 2 * (parent + 1);//右子節點對應元素的位置
        //判斷是否有子節點，再比較父節點和左右子節點的大小
        //因為parent最后一個非葉子節點，所以如果有左右子節點則節點的位置都小於數組的長度
        if (left < length && array[left] > array[maxIndex]) {//左子節點如果比父節點大
            maxIndex = left;
        }
        if (right < length && array[right] > array[maxIndex]) {//右子節點如果比父節點大
            maxIndex = right;
        }
        //maxIndex為父節點，若發生改變則說明不是最大節點，需要交換
        if (maxIndex != parent) {
            swap(array, maxIndex, parent);
            //交換之后遞歸再次調整比較
            adjustHeap(array, maxIndex, length);
        }
    }

    //交換
    private static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

堆的時間復雜度是 O(nlogn)

參考：堆排序的時間復雜度分析

算法穩定性

堆的結構為，對於位置為 k 的節點，其子節點的位置分別為，左子節點 = 2k + 1，右子節點 = 2(k + 1)，最大堆要求父節點大於等於其2個子節點，最小堆要求父節點小於等於其2個子節點。

在一個長為n的序列，堆排序的過程是從第n/2開始和其子節點共3個值選擇最大(最大堆)或者最小(最大堆)，這3個元素之間的選擇當然不會破壞穩定性。但當為n/2-1，n/2-2，... 1 這些個父節點選擇元素時，就會破壞穩定性。有可能第n/2個父節點交換把后面一個元素交換過去了，而第n/2-1個父節點把后面一個相同的元素沒有交換，那么這2個相同的元素之間的穩定性就被破壞了。所以，堆排序不是穩定的排序算法。

參考：排序的穩定性

思考

對於快速排序來說，其平均復雜度為O(nlogn)，堆排序也是O(nlogn)，怎么選擇？如下題：

leetcode：數組中的第K個最大元素

此題的意思是對於一個無序數組，經過排序后的第 k 個最大的元素。

我們知道快速排序是需要對整個數組進行排序，這樣才能取出第 k 個最大的元素。

如果使用堆排序，且是最大堆的方式，則第k次循環即可找出第 k 個最大的元素，並不需要吧整個數組排序。

所以對於怎么選擇的問題，要看具體的場景，或者是兩者都可。

計數排序

一種非比較排序。計數排序對一定范圍內的整數排序時候的速度非常快，一般快於其他排序算法。但計數排序局限性比較大，只限於對整數進行排序，而且待排序元素值分布較連續、跨度小的情況。

如果一個數組里所有元素都是整數，而且都在0-k以內。對於數組里每個元素來說，如果能知道數組里有多少項小於或等於該元素，就能准確地給出該元素在排序后的數組的位置。

如給定一個0~5范圍內的數組[2,5,3,0,2,3,0,3]，對於元素5為其中最大的元素，創建一個大小為（5-0+1 = 6）的計數數組，如果原數組中的值對應計數數組的下標，則下標對應計數數組的值加1。

問題

上面是通過數組的最大值來確定計數數組的長度的，但如果需要對學生的成績進行排序，如學生成績為：[95,93,92,94,92,93,95,90]，如果按照上面的方法來處理，則需要一個大小為100的數組，但是可以看到其中的最小值為90，那也就是說前面 0~89 的位置都沒有數據存放，造成了資源浪費。

如果我們知道了數組的最大值和最小值，則計數數組的大小為（最大值 - 最小值 + 1），如上面數組的最大值為99，最小值為90，則定義計數數組的大小為（95 - 90 + 1 = 6）。並且索引分別對應原數組90_{95的值。我們把0}90的范圍用一個偏移量來表示，即最小值90就是這個偏移量。

代碼實現

public class CountSort {

    public static final int[] ARRAY = {2, 5, 3, 0, 2, 3, 0, 3};
    public static final int[] ARRAY2 = {95,93,92,94,92,93,95,90};

    //優化前
    private static int[] sort(int[] array) {
        if (array.length < 2) return array;
        //找出數組的最大值
        int max = array[0];
        for (int i : array) {
            if (i > max) {
                max = i;
            }
        }
        //初始化一個計數數組且值為0
        int[] countArray = new int[max + 1];
        for (int i = 0; i < countArray.length; i++) {
            countArray[i] = 0;
        }
        //填充計數數組
        for (int temp : array) {
            countArray[temp]++;
        }
        int o_index = 0;//原數組下標
        int n_index = 0;//計數數組下標
        while (o_index < array.length) {
            //只要計數數組的下標不為0，就將計數數組的值從新寫回原數組
            if (countArray[n_index] != 0) {
                array[o_index] = n_index;//計數數組下標對應元素組的值
                countArray[n_index]--;//計數數組的值要-1
                o_index++;
            } else {
                n_index++;//上一個索引的值為0后開始下一個
            }
        }
        return array;
    }

    //優化后
    private static int[] sort2(int[] array) {
        if (array.length < 2) return array;
        //找出數組中的最大值和最小值
        int min = array[0], max = array[0];
        for (int i : array) {
            if (i > max) {
                max = i;
            }
            if (i < min) {
                min = i;
            }
        }
        //定義一個偏移量,即最小值前面0~min的范圍,這里直接用一個負數來表示
        int bias = 0 - min;
        //初始化一個計數數組且值為0
        int[] countArray = new int[max - min + 1];
        for (int i = 0; i < countArray.length; i++) {
            countArray[i] = 0;
        }
        for (int temp : array) {
            countArray[temp + bias]++;
        }
        //填充計數數組
        int o_index = 0;//原數組下標
        int n_index = 0;//計數數組下標
        while (o_index < array.length) {
            if (countArray[n_index] != 0) {
                array[o_index] = n_index - bias;
                countArray[n_index]--;
                o_index++;
            } else {
                n_index++;
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
        System.out.println("=================優化排序====================");
        print(ARRAY2);
        System.out.println("============================================");
        print(sort2(ARRAY2));
    }
}

時間復雜度

很明顯，在排序過程中，我們至少遍歷了三次原始數組，一次計數數組，所以它的復雜度為Ο(n+m)。因此，計數排序比任何排序都要塊，這是一種犧牲空間換取時間的做法，因為排序過程中需要用一個計數數組來存元素組的出現次數。

算法穩定性

在新建的計數數組中記錄原始數組中每個元素的數量，如果原始數組有相同的元素，則在輸出時，無法保證元素原來的排序，是一種不穩定的排序算法。

桶排序

桶排序是計數排序的升級，計數排序可以看成每個桶只存儲相同元素，而桶排序每個桶存儲一定范圍的元素，通過函數的某種映射關系，將待排序數組中的元素映射到各個對應的桶中，對每個桶中的元素進行排序（有可能再使用別的排序算法或是以遞歸方式繼續使用桶排序），最后將非空桶中的元素逐個放入原序列中。

桶排序需要盡量保證元素分散均勻，否則當所有數據集中在同一個桶中時，桶排序失效。

代碼實現

找出數組中的最大值max和最小值min，可以確定出數組所在范圍min~max
根據數據范圍確定桶的數量
- 若桶的數量太少，則桶排序失效
- 若桶的數量太多，則有的桶可能，沒有數據造成空間浪費
所以桶的數量由我們自己來確定，但盡量讓元素平均分布到每一個桶里，這里提供一個方式

(最大值 - 最小值)/每個桶所能放置多少個不同數值+1
確定桶的區間，一般是按照(最大值 - 最小值)/桶的數量來划分的，且左閉右開

public class BucketSort {

    public static final int[] ARRAY = {35, 23, 48, 9, 16, 24, 5, 11, 32, 17};

    /**
     * @param bucketSize 作為每個桶所能放置多少個不同數值,即數值的類型
     *                   例如當BucketSize==5時，該桶可以存放｛1,2,3,4,5｝這幾種數字，
     *                   但是容量不限，即可以存放100個3
     */
    public static List<Integer> sort(List<Integer> array, int bucketSize) {
        if (array == null || array.size() < 2)
            return array;
        int max = array.get(0), min = array.get(0);
        // 找到最大值最小值
        for (int i = 0; i < array.size(); i++) {
            if (array.get(i) > max)
                max = array.get(i);
            if (array.get(i) < min)
                min = array.get(i);
        }
        //獲取桶的數量
        int bucketCount = (max - min) / bucketSize + 1;
        //構建桶，初始化
        List<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketCount);
        List<Integer> resultArr = new ArrayList<>();
        for (int i = 0; i < bucketCount; i++) {
            bucketArr.add(new ArrayList<>());
        }
        //將原數組的數據分配到桶中
        for (int i = 0; i < array.size(); i++) {
            //區間范圍
            bucketArr.get((array.get(i) - min) / bucketSize).add(array.get(i));
        }

        for (int i = 0; i < bucketCount; i++) {
            if (bucketSize == 1) {
                for (int j = 0; j < bucketArr.get(i).size(); j++)
                    resultArr.add(bucketArr.get(i).get(j));
            } else {
                if (bucketCount == 1)
                    bucketSize--;
                //對桶中的數據再次用桶進行排序
                List<Integer> temp = sort(bucketArr.get(i), bucketSize);
                for (int j = 0; j < temp.size(); j++)
                    resultArr.add(temp.get(j));
            }
        }
        return resultArr;
    }

    public static void print(List<Integer> array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(Arrays.stream(ARRAY).boxed().collect(Collectors.toList()));
        System.out.println("============================================");
        print(sort(Arrays.stream(ARRAY).boxed().collect(Collectors.toList()), 2));
    }
}

時間復雜度

桶排序算法遍歷了2次原始數組，運算量為2N，最后，遍歷桶輸出排序結果的運算量為N，初始化桶的運算量為M。

對桶進行排序，不同的排序算法算法復雜度不同，冒泡排序算法復雜度為O(N^2)，堆排序、歸並排序算法復雜度為O(NlogN)，我們以排序算法復雜度為O(NlogN)進行計算，運算量為N/M * log(N/M) * M

最終的運算量為3N+M+N/M * log(N/M) * M，即3N+M+N(logN-logM)，去掉系數，時間復雜度為O(N+M+N(logN-logM))

參考：桶排序算法詳解

算法穩定性

桶排序算法在對每個桶進行排序時，若選擇穩定的排序算法，則排序后，相同元素的位置不會發生改變，所以桶排序算法是一種穩定的排序算法。

基數排序

常見的數據元素一般是由若干位組成的，比如字符串由若干字符組成，整數由若干位0~9數字組成。

基數排序按照從右往左的順序，依次將每一位都當做一次關鍵字，然后按照該關鍵字對數組排序，同時每一輪排序都基於上輪排序后的結果；當我們將所有的位排序后，整個數組就達到有序狀態。基數排序不是基於比較的算法。

基數是什么意思？對於十進制整數，每一位都只可能是0~9中的某一個，總共10種可能。那10就是它的基，同理二進制數字的基為2；對於字符串，如果它使用的是8位的擴展ASCII字符集，那么它的基就是256。

基數排序有兩種方法：

MSD 從高位開始進行排序
LSD 從低位開始進行排序

對於大小范圍為0~9的數的組合（若是兩位數，就是個位數和十位數的組合），於是可以准備十個桶，然后放到對應的桶里，然后再把桶里的數按照0號桶到9號桶的順序取出來即可。

代碼實現

public class RadixSort {

    public static final int[] ARRAY = {82, 50, 21, 5, 66, 48, 43, 79, 14, 37, 25};

    public static int[] sort(int[] array) {
        if (array.length < 2) return array;
        //根據最大值算出位數
        int max = array[0];
        for (int temp : array) {
            if (temp > max) {
                max = temp;
            }
        }
        //算出位數digit
        int maxDigit = 0;
        while (max != 0) {
            max /= 10;
            maxDigit++;
        }
        //創建桶並初始化
        ArrayList<ArrayList<Integer>> bucket = new ArrayList<>();
        for (int i = 0; i < 10; i++) {
            bucket.add(new ArrayList<>());
        }
        //按照從右往左的順序，依次將每一位都當做一次關鍵字，然后按照該關鍵字對數組排序，每一輪排序都基於上輪排序后的結果
        int mold = 10;//取模運算
        int div = 1;//獲取對應位數的值
        for (int i = 0; i < maxDigit; i++, mold *= 10, div *= 10) {
            for (int j = 0; j < array.length; j++) {
                //獲取個位/十位/百位......
                int num = (array[j] % mold) / div;
                //把數據放入到對應的桶里
                bucket.get(num).add(array[j]);
            }
            //把桶中的數據重新寫回去，並把桶的元素清空，開始第二輪排序
            int index = 0;
            for (int k = 0; k < bucket.size(); k++) {
                //桶中對應的數據
                ArrayList<Integer> list = bucket.get(k);
                for (int m = 0; m < list.size(); m++) {
                    array[index++] = list.get(m);
                }
                //清除桶
                bucket.get(k).clear();
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

計數排序算法的時間復雜度是O(N+M)，基數排序算法執行了k次計數排序，所以基數排序算法的時間復雜度為O(K(N+M))。

算法穩定性

從上面的分析可以看出，相同元素會按照順序放進固定的桶內，取出的時候也是按照順序取出來的，所以基數排序算法是一種穩定的排序算法。

基數排序 vs 桶排序 vs 計數排序

這三種排序算法都利用了桶的概念，但對桶的使用方法上有明顯差異

基數排序：根據每一位的關鍵字來分配桶
桶排序：存儲一定范圍的值
計數排序：每個桶只存儲一個類型值，但是數量不限

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 十大排序算法 js十大排序算法十大排序算法的分析 js十大排序算法詳解十大排序算法（超詳細） Java十大排序算法 C++ 實現十大排序算法十大排序算法和七大查找算法總結（原理講解和代碼實現）-------（一）排序算法篇十大排序算法時間復雜度 All In One 「干貨總結」程序員必知必會的十大排序算法