十大排序算法


冒泡排序

  1. 從數組頭開始,比較相鄰的元素。如果第一個比第二個大(小),就交換它們兩個
  2. 對每一對相鄰元素作同樣的工作,從開始第一對到尾部的最后一對,這樣在最后的元素應該會是最大(小)的數
  3. 重復步驟1~2,重復次數等於數組的長度,直到排序完成

image-20210728113340011

代碼實現

對下面數組實現排序:{24, 7, 43, 78, 62, 98, 82, 18, 54, 37, 73, 9}

代碼實現

public class BubbleSort {

    public static final int[] ARRAY = {24, 7, 43, 78, 62, 98, 82, 18, 54, 37, 73, 9};

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        for (int i = 0; i < array.length; i++) {
            //array.length - 1 -i 已經冒泡到合適位置無需在進行排序,減少比較次數
            for (int j = 0; j < array.length - 1 -i; j++) {
                //前面的數大於后面的數交換
                if (array[j + 1] < array[j]) {
                    int temp = array[j + 1];
                    array[j + 1] = array[j];
                    array[j] = temp;
                }
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }
}

時間復雜度

對於上面12個數據項,從第一個元素開始,第一趟比較了11次,第二趟比較了10次,依次類推,一直到最后一趟,就是:

11 + 10 + 9 + 8 + 7 + 6 + 5  + 4 + 3  + 2 + 1  =  66次

若有n個元素,則第一趟比較為(n-1)次,第二趟比較為(n-2)次,依次類推:

(n-1) + (n-2) + (n-3) + ...+ 2 + 1 = n * (n-1)/2

在大O表示法中,去掉常數系數和低階項,該排序方式的時間復雜度為:O(n2)

算法穩定性

假定在待排序的記錄序列中,存在多個具有相同的關鍵字的記錄,若經過排序,這些記錄的相對次序保持不變,即在原序列中,r[i]=r[j],且r[i]在r[j]之前,而在排序后的序列中,r[i]仍在r[j]之前,則稱這種排序算法是穩定的;否則稱為不穩定的。——百度百科

在代碼中可以看到,array[j + 1] = array[j]的時候,我們可以不移動array[i]array[j],所以冒泡排序是穩定的

選擇排序

  1. 找到數組中最大(或最小)的元素
  2. 將它和數組的第一個元素交換位置(如果第一個元素就是最大(小)元素那么它就和自己交換)
  3. 在剩下的元素中找到最大(小)的元素,將它與數組的第二個元素交換位置。如此往復,直到將整個數組排序。

image-20210728144443166

代碼實現

對下面數組實現排序:{87, 23, 7, 43, 78, 62, 98, 81, 18, 53, 73, 9}

動圖演示

選擇排序

代碼實現

public class SelectionSort {

    public static final int[] ARRAY = {87, 23, 7, 43, 78, 62, 98, 81, 18, 53, 73, 9};

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        for (int i = 0; i < array.length; i++) {
            //最小數的下標,每個循環開始總是假設第一個數最小
            int minIndex = i;
            for (int j = i; j < array.length; j++) {
                //找到最小索引
                if (array[j] < array[minIndex]) {
                    //保存最小索引
                    minIndex = j;
                }
            }
            //最小索引的值
            int temp = array[minIndex];
            array[minIndex] = array[i];
            array[i] = temp;
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

很明顯,和冒泡排序相比,在查找最小(或最大)元素的索引,比較次數仍然保持為O(n2)

,但元素交換次數為O(n)

算法穩定性

選擇排序是給每個位置選擇當前元素最小的,比如給第一個位置選擇最小的,在剩余元素里面給第二個元素選擇第二小的,依次類推,直到第n-1個元素,第n個元素不用選擇了,因為只剩下它一個最大的元素了。那么,在一趟選擇,如果一個元素比當前元素小,而該小的元素又出現在一個和當前元素相等的元素后面,那么交換后穩定性就被破壞了。舉個例子,數組5,8,5,2,9,我們知道第一遍選擇第1個元素5會和2交換,那么原序列中兩個5的相對前后順序就被破壞了,所以選擇排序是一個不穩定的排序算法

image-20210728144637093

插入排序

當我們在玩撲克牌的時候,總是在牌堆里面抽取最頂部的一張然后按順序在手中排列。

插入排序是指在待排序的元素中,假設前面n-1(其中n>=2)個數已經是排好順序的,現將第n個數插到前面已經排好的序列中,然后找到合適自己的位置,使得插入第n個數的這個序列也是排好順序的。

  1. 對於未排序數據(一般取數組的二個元素,把第一個元素當做有序數組),在已排序序列中從左往右掃描,找到相應位置並插入。
  2. 為了給要插入的元素騰出空間,需要將插入位置之后的已排序元素在都向后移動一位。

image-20210728162127494

代碼實現

對下面數組實現排序:{15, 51, 86, 70, 6, 42, 26, 61, 45, 81, 17, 1}

動圖演示

插入排序

代碼實現

public class InsertionSort {

    public static final int[] ARRAY = {15, 51, 86, 70, 6, 42, 26, 61, 45, 81, 17, 1};

    public static int[] sort(int[] array) {
        if (array.length == 0) {
            return array;
        }
        //待排序數據,改數據之前的已被排序
        int current;
        for (int i = 0; i < array.length - 1; i++) {
            //已被排序數據的索引
            int index = i;
            current = array[index + 1];
            //將當前元素后移一位
            while (index >= 0 && current < array[index]) {
                array[index + 1] = array[index];
                index--;
            }
            //插入
            array[index + 1] = current;
        }
        return array;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

在上面圖示中,第一趟循環比較一次,第二趟循環兩次,依次類推,則最后一趟比較n-1次:

1 + 2 + 3 +… + n-1 = n*(n-1)/2

也就是說,在最壞的情況下(逆序),比較的時間復雜度為O(n2)

在最優的情況下,即while循壞總是假的,只需當前數跟前一個數比較一下就可以了,這時一共需要比較n-1次,時間復雜度為O(n)

算法穩定性

在比較的時候,過兩個數相等的話,不會進行移動,前后兩個數的次序不會發生改變,所以插入排序是穩定的

希爾排序

一種基於插入排序的快速的排序算法。簡單插入排序對於大規模亂序數組很慢,因為元素只能一點一點地從數組的一端移動到另一端。例如,如果主鍵最小的元素正好在數組的盡頭,要將它挪到正確的位置就需要n-1次移動。

希爾排序為了加快速度簡單地改進了插入排序,也稱為縮小增量排序。

希爾排序是把待排序數組按一定的數量分組,對每組使用直接插入排序算法排序;然后縮小數量繼續分組排序,隨着數量逐漸減少,每組包含的元素越來越多,當數量減至 1 時,整個數組恰被分成一組,排序便完成了。這個不斷縮小的數量,就構成了一個增量序列,這里的數量稱為增量。

image-20210729135834646

代碼實現

public class ShellSort {

    public static final int[] ARRAY = {12, 9, 6, 11, 5, 1, 14, 2, 10, 4, 8, 7, 13, 3};

    public static int[] sort(int[] array) {
        int len = array.length;
        if (len < 2) {
            return array;
        }
        //當前待排序數據,該數據之前的已被排序
        int current;
        //增量
        int gap = len / 2;
        while (gap > 0) {
            for (int i = gap; i < len; i++) {
                current = array[i];
                //前面有序序列的索引
                int index = i - gap;
                while (index >= 0 && current < array[index]) {
                    array[index + gap] = array[index];
                    //有序序列的下一個
                    index -= gap;
                }
                //插入
                array[index + gap] = current;
            }
            //int相除取整
            gap = gap / 2;
        }
        return array;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

希爾排序的復雜度和增量序列有關。

在先前較大的增量下每個子序列的規模都不大,用直接插入排序效率都較高,盡管在隨后的增量遞減分組中子序列越來越大,由於整個序列的有序性也越來越明顯,則排序效率依然較高。

從理論上說,只要一個數組是遞減的,並且最后一個值是1,都可以作為增量序列使用。有沒有一個步長序列,使得排序過程中所需的比較和移動次數相對較少,並且無論待排序列記錄數有多少,算法的時間復雜度都能漸近最佳呢?但是目前從數學上來說,無法證明某個序列是最好的。

常用的增量序列:

  • 希爾增量序列 :{n/2, (n / 2)/2, ..., 1},其中N為原始數組的長度,這是最常用的序列,但卻不是最好的
  • Hibbard序列:{2k-1, ..., 3,1}
  • Sedgewick序列:{... , 109 , 41 , 19 , 5,1} 表達式為9 * 4i- 9 * 2i + 1,i = 0,1,2,3,4...

算法穩定性

由於多次插入排序,我們知道一次插入排序是穩定的,不會改變相同元素的相對順序,但在不同的插入排序過程中,相同的元素可能在各自的插入排序中移動,如數組5,2,2,1,第一次排序第一個元素5會和第三個元素2交換,第二個元素2會和第四個元素1交換,原序列中兩個2的相對前后順序就被破壞了,所以希爾排序是一個不穩定的排序算法

image-20210729165300142

歸並排序

歸並,指合並,合在一起。歸並排序(Merge Sort)是建立在歸並操作上的一種排序算法。其主要思想是分而治之。什么是分而治之?分而治之就是將一個復雜的計算,按照設定的閾值進行分解成多個計算,然后將各個計算結果進行匯總。即“分”就是把一個大的通過遞歸成若干個小的,“治”就是將分后的結果在在一起。

若將兩個有序集合並成一個有序表,稱為2-路歸並,與之對應的還有多路歸並。

image-20210730115340519

怎么分

  • 對於排序最好的情況來講,就是只有兩個元素,這時候比較大小就很簡單,但是還是需要比較
  • 如果拆分為左右各一個,無需比較即是有序的。

怎么治

借助一個輔助空數組,把左右兩邊的數組按照大小比較,按順序放入輔助數組中即可。

以下面兩個有序數組為例:

歸並排序

代碼實現

public class MergeSort {
    public static final int[] ARRAY = {8, 5, 6, 4, 3, 1, 7, 2};

    public static int[] sort(int[] array) {
        if (array.length < 2) return array;
        int mid = array.length / 2;
        //分成2組
        int[] left = Arrays.copyOfRange(array, 0, mid);
        int[] right = Arrays.copyOfRange(array, mid, array.length);
        //遞歸拆分
        return merge(sort(left), sort(right));
    }

    //治---合並
    public static int[] merge(int[] left, int[] right) {
        int[] result = new int[left.length + right.length];
        //i代表左邊數組的索引,j代表右邊
        for (int index = 0, i = 0, j = 0; index < result.length; index++) {
            if (i >= left.length) {//說明左側的數據已經全部取完,取右邊的數據
                result[index] = right[j++];
            } else if (j >= right.length) {//說明右側的數據已經全部取完,取左邊的數據
                result[index] = left[i++];
            } else if (left[i] > right[j]) {//左邊大於右邊,取右邊的
                int a = right[j++];
                result[index] = a;
            } else {//右邊大於左邊,取左邊的
                result[index] = left[i++];
            }
        }
        return result;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

歸並排序方法就是把一組n個數的序列,折半分為兩個序列,然后再將這兩個序列再分,一直分下去,直到分為n個長度為1的序列。然后兩兩按大小歸並。如此反復,直到最后形成包含n個數的一個數組。

歸並排序總時間 = 分解時間 + 子序列排好序時間 + 合並時間

無論每個序列有多少數都是折中分解,所以分解時間是個常數,可以忽略不計,則:

歸並排序總時間 = 子序列排好序時間 + 合並時間

假設處理的數據規模大小為 n,運行時間設為:T(n),則T(n) = n,當 n = 1時,T(1) = 1

由於在合並時,兩個子序列已經排好序,所以在合並的時候只需要 if 判斷即可,所以n個數比較,合並的時間復雜度為 n。

  • 將 n 個數的序列,分為兩個 n/2 的序列,則:T(n) = 2T(n/2) + n
  • 將 n/2 個數的序列,分為四個 n/4 的序列,則:T(n) = 4T(n/4) + 2n
  • 將 n/4 個數的序列,分為八個 n/8 的序列,則:T(n) = 8T(n/8) + 3n
  • ......
  • 將 n/2k 個數的序列,分為2k個 n/2k 的序列,則:T(n) = 2kT(n/2k) + kn

當 T(n/2k) = T(1)時, 即n/2k = 1(此時也是把n分解到只有1個數據的時候),轉換為以2為底n的對數:k = log2n,把k帶入到T(n)中,得:T(n) = n + nlog2n

使用大O表示法,去掉常數項 n,省略底數 2,則歸並排序的時間復雜度為:O(nlogn)

算法穩定性

從原理分析和代碼可以看出,為在合並的時候,如果相等,選擇前面的元素到輔助數組,所以歸並排序是穩定的。

快速排序

快速排序是對冒泡排序的一種改進,也是采用分治法的一個典型的應用。JDK中Arrays的sort()方法,具體的排序細節就是使用快速排序實現的。

從數組中任意選取一個數據(比如數組的第一個數或最后一個數)作為關鍵數據,我們稱為基准數(pivot,或中軸數),然后將所有比它小的數都放到它前面,所有比它大的數都放到它后面,這個過程稱為一趟快速排序,也稱為分區(partition)操作。

問題

若給定一個無序數組 [8, 5, 6, 4, 3, 1, 7, 2],並指定一個數為基准,拆分數組使得左側的數都小於等於它 ,右側的數都大於它。

基准的選取最優的情況是基准值剛好取在無序區數值的中位數,這樣能夠最大效率地讓兩邊排序,同時最大地減少遞歸划分的次數,但是一般很難做到最優。基准的選取一般有三種方式:

  • 選取數組的第一個元素
  • 選取數組的最后一個元素
  • 以及選取第一個、最后一個以及中間的元素的中位數(如4 5 6 7, 第一個4, 最后一個7, 中間的為5, 這三個數的中位數為5, 所以選擇5作為基准)。

思路

  1. 隨機選擇數組的一個元素,比如 6 為基准,拆分數組同時引入一個初始指針,也叫分區指示器,初始指針指向 -1
  2. 將數組中的元素和基准數遍歷比較
  3. 若當前元素大於基准數,不做任何變化
  4. 若當前元素小於等於基准數時,分割指示器右移一位,同時
    • 當前元素下標小於等於分區指示器時,當前元素保持不動
    • 當前元素下標大於分區指示器時,當前元素和分區指示器所指元素交換

快速排序

荷蘭國旗問題

荷蘭的國旗是由紅白藍三種顏色構成,如圖:

若現在給一個隨機的圖形,如下:

image-20210803151023780

把這些條紋按照顏色排好,紅色的在上半部分,白色的在中間部分,藍色的在下半部分,這類問題稱作荷蘭國旗問題。

對應leetcode:顏色分類

給定一個包含紅色、白色和藍色,一共 n 個元素的數組,原地對它們進行排序,使得相同顏色的元素相鄰,並按照紅色、白色、藍色順序排列。

分析:

假如給定一個數組[8, 3, 6, 2, 5, 1, 7, 5],做如下操作:

  1. 隨機選擇數組的一個元素,比如 5 為基准,拆分數組同時引入一個左分區指示器,指向 -1,右分區指示器指向基准數(注:此時的基准數為尾元素)

  2. 若當前元素大於基准數,右分區指示器左移一位,當前元素和右分區指示器所指元素交換,

    索引保持不變

  3. 若當前元素小於等於基准數時,左分區指示器右移一位,索引右移

    • 當前元素大於等於左分區指示器所指元素,當前元素保持不動
    • 當前元素小於左分區指示器所指元素,交換

簡單來說就是,左分區指示器向右移動的過程中,如果遇到大於或等於基准數時,則停止移動,右分區指示器向左移動的過程中,如果遇到小於或等於主元的元素則停止移動。這種操作也叫雙向快速排序

345345

代碼實現

public class QuickSort {

    public static final int[] ARRAY = {8, 5, 6, 4, 3, 1, 7, 2};

    public static final int[] ARRAY2 = {8, 3, 6, 2, 5, 1, 7, 5};

    private static int[] sort(int[] array, int left, int right) {
        if (array.length < 1 || left > right) return null;
        //拆分
        int partitionIndex = partition(array, left, right);
        //遞歸
        if (partitionIndex > left) {
            sort(array, left, partitionIndex - 1);
        }
        if (partitionIndex < right) {
            sort(array, partitionIndex + 1, right);
        }
        return array;
    }

    /**
     * 分區快排操作
     *
     * @param array 原數組
     * @param left  左側頭索引
     * @param right 右側尾索引
     * @return 分區指示器  最后指向基准數
     */
    public static int partition(int[] array, int left, int right) {
        //基准數下標---隨機方式取值,也就是數組的長度隨機1-8之間
        int pivot = (int) (left + Math.random() * (right - left + 1));
        //分區指示器索引
        int partitionIndex = left - 1;
        //基准數和尾部元素交換
        swap(array, pivot, right);
        //按照規定,如果當前元素大於基准數不做任何操作;
        //小於基准數,分區指示器右移,且當前元素的索引大於分區指示器,交換
        for (int i = left; i <= right; i++) {
            if (array[i] <= array[right]) {//當前元素小於等於基准數
                partitionIndex++;
                if (i > partitionIndex) {//當前元素的索引大於分區指示器
                    //交換
                    swap(array, i, partitionIndex);
                }
            }
        }
        return partitionIndex;
    }

    /**
     * 雙向掃描排序
     */
    public static int partitionTwoWay(int[] array, int left, int right) {
        //基准數
        int pivot = array[right];
        //左分區指示器索引
        int leftIndex = left - 1;
        //右分區指示器索引
        int rightIndex = right;
        //索引
        int index = left;
        while (index < rightIndex) {
            //若當前元素大於基准數,右分區指示器左移一位,當前元素和右分區指示器所指元素交換,索引保持不變
            if (array[index] > pivot) {
                swap(array, index, --rightIndex);
            } else if (array[index] <= pivot) {//當前元素小於等於基准數時,左分割指示器右移一位,索引右移
                leftIndex++;
                index++;
                //當前元素小於等於左分區指示器所指元素,交換
                if (array[index] < array[leftIndex]) {
                    swap(array, index, leftIndex);
                }
            }
        }
        //索引和 L 指向同一個元素
        swap(array, right, rightIndex);
        return 1;
    }

    //交換
    private static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }


    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }


    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY, 0, ARRAY.length - 1));
        System.out.println("====================雙向排序==================");
        print(ARRAY2);
        System.out.println("============================================");
        print(sort(ARRAY2, 0, ARRAY2.length - 1));
    }
}

時間復雜度

在拆分數組的時候可能會出現一種極端的情況,每次拆分的時候,基准數左邊的元素個數都為0,而右邊都為n-1個。這個時候,就需要拆分n次了。而每次拆分整理的時間復雜度為O(n),所以最壞的時間復雜度為O(n2)。什么意思?舉個簡單例子:

在不知道初始序列已經有序的情況下進行排序,第1趟排序經過n-1次比較后,將第1個元素仍然定在原來的位置上,並得到一個長度為n-1的子序列;第2趟排序經過n-2次比較后,將第2個元素確定在它原來的位置上,又得到一個長度為n-2的子序列;以此類推,最終總的比較次數:

C(n) = (n-1) + (n-2) + ... + 1 = n(n-1)/2

所以最壞的情況下,快速排序的時間復雜度為O(n^2)

而最好的情況就是每次拆分都能夠從數組的中間拆分,這樣拆分logn次就行了,此時的時間復雜度為O(nlogn)。

而平均時間復雜度,則是假設每次基准數隨機,最后算出來的時間復雜度為O(nlogn)

參考:快速排序的時間復雜度與空間復雜度

算法穩定性

通過上面的分析可以知道,在隨機取基准數的時候,數據是可能會發生變化的,所以快速排序有不是穩定的情況。

堆排序

這里的堆並不是JVM中堆棧的堆,而是一種特殊的二叉樹,通常也叫作二叉堆。它具有以下特點:

  • 它是完全二叉樹
  • 堆中某個結點的值總是不大於或不小於其父結點的值

知識補充

二叉樹

樹中節點的子節點不超過2的有序樹

image-20210804135913978

滿二叉樹

二叉樹中除了葉子節點,每個節點的子節點都為2,則此二叉樹為滿二叉樹。

image-20210804140132004

完全二叉樹

如果對滿二叉樹的結點進行編號,約定編號從根結點起,自上而下,自左而右。則深度為k的,有n個結點的二叉樹,當且僅當其每一個結點都與深度為k的滿二叉樹中編號從1至n的結點一一對應時,稱之為完全二叉樹。

特點葉子結點只能出現在最下層和次下層,且最下層的葉子結點集中在樹的左部。需要注意的是,滿二叉樹肯定是完全二叉樹,而完全二叉樹不一定是滿二叉樹。

image-20210804144904950

二叉堆

二叉堆是一種特殊的堆,可以被看做一棵完全二叉樹的數組對象,而根據其性質又可以分為下面兩種:

  • 大根堆:每一個根節點都大於等於它的左右孩子節點,也叫最大堆
  • 小根堆:每一個根節點都小於等於它的左右孩子節點,也叫最小堆

如果把一個數組通過大根堆的方式來表示(數組元素的值是可變的),如下:

image-20210804180209118

由此可以推出:

  • 對於位置為 k 的節點,其子節點的位置分別為,左子節點 = 2k + 1右子節點 = 2(k + 1)

    如:對於 k = 1,其節點的對應數組為 5

    左子節點的位置為 3,對應數組的值為 3

    右子節點的位置為 4,對應數組的值為 2

  • 最后一個非葉子節點的位置為 (n/2) - 1,n為數組長度

    如:數組長度為6,則 (6/2) - 1 = 2,即位置 2 為最后一個非葉子節點

給定一個隨機數組[35,63,48,9,86,24,53,11],將該數組視為一個完全二叉樹:

image-20210804190655494

從上圖很明顯的可以看出,這個二叉樹不符合大根堆的定義,但是可以通過調整,使它變為最大堆。如果從最后一個非葉子節點開始,從下到上,從右往左調整,則:

image-20210804224254053

通過上面的調整,該二叉樹為最大堆,這個時候開始排序,排序規則:

  • 將堆頂元素和尾元素交換
  • 交換后重新調整元素的位置,使之重新變成二叉堆

image-20210804234843626

代碼實現

public class HeapSort {

    public static final int[] ARRAY = {35, 63, 48, 9, 86, 24, 53, 11};

    public static int[] sort(int[] array) {
        //數組的長度
        int length = array.length;
        if (length < 2) return array;
        //首先構建一個最大堆
        buildMaxHeap(array);
        //調整為最大堆之后,頂元素為最大元素並與微元素交換
        while (length > 0) {//當lenth <= 0時,說明已經到堆頂
            //交換
            swap(array, 0, length - 1);
            length--;//交換之后相當於把樹中的最大值彈出去了,所以要--
            //交換之后從上往下調整使之成為最大堆
            adjustHeap(array, 0, length);
        }
        return array;
    }

    //對元素組構建為一個對應數組的最大堆
    private static void buildMaxHeap(int[] array) {
        //在之前的分析可知,最大堆的構建是從最后一個非葉子節點開始,從下往上,從右往左調整
        //最后一個非葉子節點的位置為:array.length/2 - 1
        for (int i = array.length / 2 - 1; i >= 0; i--) {
            //調整使之成為最大堆
            adjustHeap(array, i, array.length);
        }
    }

    /**
     * 調整
     * @param parent 最后一個非葉子節點
     * @param length 數組的長度
     */
    private static void adjustHeap(int[] array, int parent, int length) {
        //定義最大值的索引
        int maxIndex = parent;
        //parent為對應元素的位置(數組的索引)
        int left = 2 * parent + 1;//左子節點對應元素的位置
        int right = 2 * (parent + 1);//右子節點對應元素的位置
        //判斷是否有子節點,再比較父節點和左右子節點的大小
        //因為parent最后一個非葉子節點,所以如果有左右子節點則節點的位置都小於數組的長度
        if (left < length && array[left] > array[maxIndex]) {//左子節點如果比父節點大
            maxIndex = left;
        }
        if (right < length && array[right] > array[maxIndex]) {//右子節點如果比父節點大
            maxIndex = right;
        }
        //maxIndex為父節點,若發生改變則說明不是最大節點,需要交換
        if (maxIndex != parent) {
            swap(array, maxIndex, parent);
            //交換之后遞歸再次調整比較
            adjustHeap(array, maxIndex, length);
        }
    }

    //交換
    private static void swap(int[] array, int i, int j) {
        int temp = array[i];
        array[i] = array[j];
        array[j] = temp;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

堆的時間復雜度是 O(nlogn)

參考:堆排序的時間復雜度分析

算法穩定性

堆的結構為,對於位置為 k 的節點,其子節點的位置分別為,左子節點 = 2k + 1右子節點 = 2(k + 1),最大堆要求父節點大於等於其2個子節點,最小堆要求父節點小於等於其2個子節點。

在一個長為n的序列,堆排序的過程是從第n/2開始和其子節點共3個值選擇最大(最大堆)或者最小(最大堆),這3個元素之間的選擇當然不會破壞穩定性。但當為n/2-1,n/2-2,... 1 這些個父節點選擇元素時,就會破壞穩定性。有可能第n/2個父節點交換把后面一個元素交換過去了,而第n/2-1個父節點把后面一個相同的元素沒有交換,那么這2個相同的元素之間的穩定性就被破壞了。所以,堆排序不是穩定的排序算法。

參考:排序的穩定性

思考

對於快速排序來說,其平均復雜度為O(nlogn),堆排序也是O(nlogn),怎么選擇?如下題:

leetcode:數組中的第K個最大元素

此題的意思是對於一個無序數組,經過排序后的第 k 個最大的元素。

我們知道快速排序是需要對整個數組進行排序,這樣才能取出第 k 個最大的元素。

如果使用堆排序,且是最大堆的方式,則第k次循環即可找出第 k 個最大的元素,並不需要吧整個數組排序。

所以對於怎么選擇的問題,要看具體的場景,或者是兩者都可。

計數排序

一種非比較排序。計數排序對一定范圍內的整數排序時候的速度非常快,一般快於其他排序算法。但計數排序局限性比較大,只限於對整數進行排序,而且待排序元素值分布較連續、跨度小的情況。

如果一個數組里所有元素都是整數,而且都在0-k以內。對於數組里每個元素來說,如果能知道數組里有多少項小於或等於該元素,就能准確地給出該元素在排序后的數組的位置。

如給定一個0~5范圍內的數組[2,5,3,0,2,3,0,3],對於元素5為其中最大的元素,創建一個大小為(5-0+1 = 6)的計數數組,如果原數組中的值對應計數數組的下標,則下標對應計數數組的值加1。

image-20210806112939098

問題

上面是通過數組的最大值來確定計數數組的長度的,但如果需要對學生的成績進行排序,如學生成績為:[95,93,92,94,92,93,95,90],如果按照上面的方法來處理,則需要一個大小為100的數組,但是可以看到其中的最小值為90,那也就是說前面 0~89 的位置都沒有數據存放,造成了資源浪費。

如果我們知道了數組的最大值和最小值,則計數數組的大小為(最大值 - 最小值 + 1),如上面數組的最大值為99,最小值為90,則定義計數數組的大小為(95 - 90 + 1 = 6)。並且索引分別對應原數組9095的值。我們把090的范圍用一個偏移量來表示,即最小值90就是這個偏移量。

image-20210806121018728

代碼實現

public class CountSort {

    public static final int[] ARRAY = {2, 5, 3, 0, 2, 3, 0, 3};
    public static final int[] ARRAY2 = {95,93,92,94,92,93,95,90};

    //優化前
    private static int[] sort(int[] array) {
        if (array.length < 2) return array;
        //找出數組的最大值
        int max = array[0];
        for (int i : array) {
            if (i > max) {
                max = i;
            }
        }
        //初始化一個計數數組且值為0
        int[] countArray = new int[max + 1];
        for (int i = 0; i < countArray.length; i++) {
            countArray[i] = 0;
        }
        //填充計數數組
        for (int temp : array) {
            countArray[temp]++;
        }
        int o_index = 0;//原數組下標
        int n_index = 0;//計數數組下標
        while (o_index < array.length) {
            //只要計數數組的下標不為0,就將計數數組的值從新寫回原數組
            if (countArray[n_index] != 0) {
                array[o_index] = n_index;//計數數組下標對應元素組的值
                countArray[n_index]--;//計數數組的值要-1
                o_index++;
            } else {
                n_index++;//上一個索引的值為0后開始下一個
            }
        }
        return array;
    }

    //優化后
    private static int[] sort2(int[] array) {
        if (array.length < 2) return array;
        //找出數組中的最大值和最小值
        int min = array[0], max = array[0];
        for (int i : array) {
            if (i > max) {
                max = i;
            }
            if (i < min) {
                min = i;
            }
        }
        //定義一個偏移量,即最小值前面0~min的范圍,這里直接用一個負數來表示
        int bias = 0 - min;
        //初始化一個計數數組且值為0
        int[] countArray = new int[max - min + 1];
        for (int i = 0; i < countArray.length; i++) {
            countArray[i] = 0;
        }
        for (int temp : array) {
            countArray[temp + bias]++;
        }
        //填充計數數組
        int o_index = 0;//原數組下標
        int n_index = 0;//計數數組下標
        while (o_index < array.length) {
            if (countArray[n_index] != 0) {
                array[o_index] = n_index - bias;
                countArray[n_index]--;
                o_index++;
            } else {
                n_index++;
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
        System.out.println("=================優化排序====================");
        print(ARRAY2);
        System.out.println("============================================");
        print(sort2(ARRAY2));
    }
}

時間復雜度

很明顯,在排序過程中,我們至少遍歷了三次原始數組,一次計數數組,所以它的復雜度為Ο(n+m)。因此,計數排序比任何排序都要塊,這是一種犧牲空間換取時間的做法,因為排序過程中需要用一個計數數組來存元素組的出現次數。

算法穩定性

在新建的計數數組中記錄原始數組中每個元素的數量,如果原始數組有相同的元素,則在輸出時,無法保證元素原來的排序,是一種不穩定的排序算法。

桶排序

桶排序是計數排序的升級,計數排序可以看成每個桶只存儲相同元素,而桶排序每個桶存儲一定范圍的元素,通過函數的某種映射關系,將待排序數組中的元素映射到各個對應的桶中,對每個桶中的元素進行排序(有可能再使用別的排序算法或是以遞歸方式繼續使用桶排序),最后將非空桶中的元素逐個放入原序列中。

桶排序需要盡量保證元素分散均勻,否則當所有數據集中在同一個桶中時,桶排序失效。

image-20210808133137559

代碼實現

  1. 找出數組中的最大值max和最小值min,可以確定出數組所在范圍min~max

  2. 根據數據范圍確定桶的數量

    • 若桶的數量太少,則桶排序失效
    • 若桶的數量太多,則有的桶可能,沒有數據造成空間浪費

    所以桶的數量由我們自己來確定,但盡量讓元素平均分布到每一個桶里,這里提供一個方式

    (最大值 - 最小值)/每個桶所能放置多少個不同數值+1

  3. 確定桶的區間,一般是按照(最大值 - 最小值)/桶的數量來划分的,且左閉右開

public class BucketSort {

    public static final int[] ARRAY = {35, 23, 48, 9, 16, 24, 5, 11, 32, 17};

    /**
     * @param bucketSize 作為每個桶所能放置多少個不同數值,即數值的類型
     *                   例如當BucketSize==5時,該桶可以存放{1,2,3,4,5}這幾種數字,
     *                   但是容量不限,即可以存放100個3
     */
    public static List<Integer> sort(List<Integer> array, int bucketSize) {
        if (array == null || array.size() < 2)
            return array;
        int max = array.get(0), min = array.get(0);
        // 找到最大值最小值
        for (int i = 0; i < array.size(); i++) {
            if (array.get(i) > max)
                max = array.get(i);
            if (array.get(i) < min)
                min = array.get(i);
        }
        //獲取桶的數量
        int bucketCount = (max - min) / bucketSize + 1;
        //構建桶,初始化
        List<ArrayList<Integer>> bucketArr = new ArrayList<>(bucketCount);
        List<Integer> resultArr = new ArrayList<>();
        for (int i = 0; i < bucketCount; i++) {
            bucketArr.add(new ArrayList<>());
        }
        //將原數組的數據分配到桶中
        for (int i = 0; i < array.size(); i++) {
            //區間范圍
            bucketArr.get((array.get(i) - min) / bucketSize).add(array.get(i));
        }

        for (int i = 0; i < bucketCount; i++) {
            if (bucketSize == 1) {
                for (int j = 0; j < bucketArr.get(i).size(); j++)
                    resultArr.add(bucketArr.get(i).get(j));
            } else {
                if (bucketCount == 1)
                    bucketSize--;
                //對桶中的數據再次用桶進行排序
                List<Integer> temp = sort(bucketArr.get(i), bucketSize);
                for (int j = 0; j < temp.size(); j++)
                    resultArr.add(temp.get(j));
            }
        }
        return resultArr;
    }

    public static void print(List<Integer> array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(Arrays.stream(ARRAY).boxed().collect(Collectors.toList()));
        System.out.println("============================================");
        print(sort(Arrays.stream(ARRAY).boxed().collect(Collectors.toList()), 2));
    }
}

時間復雜度

桶排序算法遍歷了2次原始數組,運算量為2N,最后,遍歷桶輸出排序結果的運算量為N,初始化桶的運算量為M。

對桶進行排序,不同的排序算法算法復雜度不同,冒泡排序算法復雜度為O(N^2),堆排序、歸並排序算法復雜度為O(NlogN),我們以排序算法復雜度為O(NlogN)進行計算,運算量為N/M * log(N/M) * M

最終的運算量為3N+M+N/M * log(N/M) * M,即3N+M+N(logN-logM),去掉系數,時間復雜度為O(N+M+N(logN-logM))

參考:桶排序算法詳解

算法穩定性

桶排序算法在對每個桶進行排序時,若選擇穩定的排序算法,則排序后,相同元素的位置不會發生改變,所以桶排序算法是一種穩定的排序算法。

基數排序

常見的數據元素一般是由若干位組成的,比如字符串由若干字符組成,整數由若干位0~9數字組成。

基數排序按照從右往左的順序,依次將每一位都當做一次關鍵字,然后按照該關鍵字對數組排序,同時每一輪排序都基於上輪排序后的結果;當我們將所有的位排序后,整個數組就達到有序狀態。基數排序不是基於比較的算法。

基數是什么意思?對於十進制整數,每一位都只可能是0~9中的某一個,總共10種可能。那10就是它的基,同理二進制數字的基為2;對於字符串,如果它使用的是8位的擴展ASCII字符集,那么它的基就是256。

基數排序有兩種方法:

  • MSD 從高位開始進行排序
  • LSD 從低位開始進行排序

對於大小范圍為0~9的數的組合(若是兩位數,就是個位數和十位數的組合),於是可以准備十個桶,然后放到對應的桶里,然后再把桶里的數按照0號桶到9號桶的順序取出來即可。

image-20210809173152835

代碼實現

public class RadixSort {

    public static final int[] ARRAY = {82, 50, 21, 5, 66, 48, 43, 79, 14, 37, 25};

    public static int[] sort(int[] array) {
        if (array.length < 2) return array;
        //根據最大值算出位數
        int max = array[0];
        for (int temp : array) {
            if (temp > max) {
                max = temp;
            }
        }
        //算出位數digit
        int maxDigit = 0;
        while (max != 0) {
            max /= 10;
            maxDigit++;
        }
        //創建桶並初始化
        ArrayList<ArrayList<Integer>> bucket = new ArrayList<>();
        for (int i = 0; i < 10; i++) {
            bucket.add(new ArrayList<>());
        }
        //按照從右往左的順序,依次將每一位都當做一次關鍵字,然后按照該關鍵字對數組排序,每一輪排序都基於上輪排序后的結果
        int mold = 10;//取模運算
        int div = 1;//獲取對應位數的值
        for (int i = 0; i < maxDigit; i++, mold *= 10, div *= 10) {
            for (int j = 0; j < array.length; j++) {
                //獲取個位/十位/百位......
                int num = (array[j] % mold) / div;
                //把數據放入到對應的桶里
                bucket.get(num).add(array[j]);
            }
            //把桶中的數據重新寫回去,並把桶的元素清空,開始第二輪排序
            int index = 0;
            for (int k = 0; k < bucket.size(); k++) {
                //桶中對應的數據
                ArrayList<Integer> list = bucket.get(k);
                for (int m = 0; m < list.size(); m++) {
                    array[index++] = list.get(m);
                }
                //清除桶
                bucket.get(k).clear();
            }
        }
        return array;
    }

    public static void print(int[] array) {
        for (int i : array) {
            System.out.print(i + "  ");
        }
        System.out.println("");
    }

    public static void main(String[] args) {
        print(ARRAY);
        System.out.println("============================================");
        print(sort(ARRAY));
    }
}

時間復雜度

計數排序算法的時間復雜度是O(N+M),基數排序算法執行了k次計數排序,所以基數排序算法的時間復雜度為O(K(N+M))。

算法穩定性

從上面的分析可以看出,相同元素會按照順序放進固定的桶內,取出的時候也是按照順序取出來的,所以基數排序算法是一種穩定的排序算法。

基數排序 vs 桶排序 vs 計數排序

這三種排序算法都利用了桶的概念,但對桶的使用方法上有明顯差異

  • 基數排序:根據每一位的關鍵字來分配桶
  • 桶排序:存儲一定范圍的值
  • 計數排序:每個桶只存儲一個類型值,但是數量不限

image-20210810001026742


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM