線性時間的排序算法

本文轉載自查看原文 2014-06-22 14:19 4590

前面已經介紹了幾種排序算法，像插入排序（直接插入排序，折半插入排序，希爾排序）、交換排序（冒泡排序，快速排序）、選擇排序（簡單選擇排序，堆排序）、2-路歸並排序（見我的另一篇文章：各種內部排序算法的實現）等，這些排序算法都有一個共同的特點，就是基於比較。本文將介紹三種非比較的排序算法：計數排序，基數排序，桶排序。它們將突破比較排序的Ω(nlgn)下界，以線性時間運行。

一、比較排序算法的時間下界

所謂的比較排序是指通過比較來決定元素間的相對次序。

“定理：對於含n個元素的一個輸入序列，任何比較排序算法在最壞情況下，都需要做Ω(nlgn)次比較。”

也就是說，比較排序算法的運行速度不會快於nlgn，這就是基於比較的排序算法的時間下界。

通過決策樹（Decision-Tree）可以證明這個定理，關於決策樹的定義以及證明過程在這里就不贅述了。你可以自己去查找資料，推薦觀看《MIT公開課：線性時間排序》。

根據上面的定理，我們知道任何比較排序算法的運行時間不會快於nlgn。那么我們是否可以突破這個限制呢？當然可以，接下來我們將介紹三種線性時間的排序算法，它們都不是通過比較來排序的，因此，下界Ω(nlgn)對它們不適用。

二、計數排序（Counting Sort）

計數排序的基本思想就是對每一個輸入元素x，確定小於x的元素的個數，這樣就可以把x直接放在它在最終輸出數組的位置上，例如：

算法的步驟大致如下：

找出待排序的數組中最大和最小的元素
統計數組中每個值為i的元素出現的次數，存入數組C的第i項
對所有的計數累加（從C中的第一個元素開始，每一項和前一項相加）
反向填充目標數組：將每個元素i放在新數組的第C(i)項，每放一個元素就將C(i)減去1

C++代碼：

/*************************************************************************
    > File Name: CountingSort.cpp
    > Author: SongLee
    > E-mail: lisong.shine@qq.com
    > Created Time: 2014年06月11日 星期三 00時08分55秒
    > Personal Blog: http://songlee24.github.io
 ************************************************************************/
#include<iostream>
using namespace std;

/*
 *計數排序：A和B為待排和目標數組，k為數組中最大值,len為數組長度
 */
void CountingSort(int A[], int B[], int k, int len)
{
    int C[k+1];
    for(int i=0; i<k+1; ++i)
        C[i] = 0;
    for(int i=0; i<len; ++i)
        C[A[i]] += 1;
    for(int i=1; i<k+1; ++i)
        C[i] = C[i] + C[i-1];
    for(int i=len-1; i>=0; --i)
    {
        B[C[A[i]]-1] = A[i];
        C[A[i]] -= 1;
    }
}

/* 輸出數組 */
void print(int arr[], int len)
{
    for(int i=0; i<len; ++i)
        cout << arr[i] << " ";
    cout << endl;
}

/* 測試 */
int main()
{
    int origin[8] = {4,5,3,0,2,1,15,6};
    int result[8];
    print(origin, 8);
    CountingSort(origin, result, 15, 8);
    print(result, 8);
    return 0;
}

當輸入的元素是0到k之間的整數時，時間復雜度是O(n+k)，空間復雜度也是O(n+k)。當k不是很大並且序列比較集中時，計數排序是一個很有效的排序算法。計數排序是一個穩定的排序算法。

可能你會發現，計數排序似乎饒了點彎子，比如當我們剛剛統計出C，C[i]可以表示A中值為i的元素的個數，此時我們直接順序地掃描C，就可以求出排序后的結果。的確是這樣，不過這種方法不再是計數排序，而是桶排序，確切地說，是桶排序的一種特殊情況。

三、桶排序（Bucket Sort）

桶排序（Bucket Sort）的思想是將數組分到有限數量的桶子里。每個桶子再個別排序（有可能再使用別的排序算法）。當要被排序的數組內的數值是均勻分配的時候，桶排序可以以線性時間運行。桶排序過程動畫演示：Bucket Sort，桶排序原理圖如下：

C++代碼：

/*************************************************************************
    > File Name: BucketSort.cpp
    > Author: SongLee
    > E-mail: lisong.shine@qq.com
    > Created Time: 2014年06月11日 星期三 09時17分32秒
    > Personal Blog: http://songlee24.github.io
 ************************************************************************/
#include<iostream>
using namespace std;

/* 節點 */
struct node
{
    int value;
    node* next;
};

/* 桶排序 */
void BucketSort(int A[], int max, int len)
{
    node bucket[len];
    int count=0;
    for(int i=0; i<len; ++i)
    {
        bucket[i].value = 0;
        bucket[i].next = NULL;
    }
    
    for(int i=0; i<len; ++i)
    {
        node *ist = new node();
        ist->value = A[i];
        ist->next = NULL;
        int idx = A[i]*len/(max+1); // 計算索引
        if(bucket[idx].next == NULL)
        {
            bucket[idx].next = ist;
        }
        else /* 按大小順序插入鏈表相應位置 */
        {
            node *p = &bucket[idx];
            node *q = p->next;
            while(q!=NULL && q->value <= A[i])
            {
                p = q;
                q = p->next;
            }
            ist->next = q;
            p->next = ist;
        }
    }

    for(int i=0; i<len; ++i)
    {
        node *p = bucket[i].next;
        if(p == NULL)
            continue;
        while(p!= NULL)
        {
            A[count++] = p->value;
            p = p->next;
        }
    }
}

/* 輸出數組 */
void print(int A[], int len)
{
    for(int i=0; i<len; ++i)
        cout << A[i] << " ";
    cout << endl;
}

/* 測試 */
int main()
{
    int row[11] = {24,37,44,12,89,93,77,61,58,3,100};
    print(row, 11);
    BucketSort(row, 235, 11);
    print(row, 11);
    return 0;
}

四、基數排序（Radix Sort）

基數排序（Radix Sort）是一種非比較型排序算法，它將整數按位數切割成不同的數字，然后按每個位分別進行排序。基數排序的方式可以采用MSD（Most significant digital）或LSD（Least significant digital），MSD是從最高有效位開始排序，而LSD是從最低有效位開始排序。

當然我們可以采用MSD方式排序，按最高有效位進行排序，將最高有效位相同的放到一堆，然后再按下一個有效位對每個堆中的數遞歸地排序，最后再將結果合並起來。但是，這樣會產生很多中間堆。所以，通常基數排序采用的是LSD方式。

LSD基數排序實現的基本思路是將所有待比較數值（正整數）統一為同樣的數位長度，數位較短的數前面補零。然后，從最低位開始，依次進行一次排序。這樣從最低位排序一直到最高位排序完成以后, 數列就變成一個有序序列。需要注意的是，對每一個數位進行排序的算法必須是穩定的，否則就會取消前一次排序的結果。通常我們使用計數排序或者桶排序作為基數排序的輔助算法。基數排序過程動畫演示：Radix Sort

C++實現（使用計數排序）：

/*************************************************************************
    > File Name: RadixSort.cpp
    > Author: SongLee
    > E-mail: lisong.shine@qq.com
    > Created Time: 2014年06月22日 星期日 12時04分37秒
    > Personal Blog: http://songlee24.github.io
 ************************************************************************/
#include<iostream>
using namespace std;

// 找出整數num第n位的數字
int findIt(int num, int n)
{
    int power = 1;
    for (int i = 0; i < n; i++)
    {
        power *= 10;
    }
    return (num % power) * 10 / power;
}

// 基數排序（使用計數排序作為輔助）
void RadixSort(int A[], int len, int k)
{
    for(int i=1; i<=k; ++i)
    {
        int C[10] = {0};   // 計數數組
        int B[len];        // 結果數組

        for(int j=0; j<len; ++j)
        {
            int d = findIt(A[j], i);
            C[d] += 1;
        }

        for(int j=1; j<10; ++j)
            C[j] = C[j] + C[j-1];

        for(int j=len-1; j>=0; --j)
        {
            int d = findIt(A[j], i);
            C[d] -= 1;
            B[C[d]] = A[j];
        }
        
        // 將B中排好序的拷貝到A中
        for(int j=0; j<len; ++j)
            A[j] = B[j];
    }
}

// 輸出數組
void print(int A[], int len)
{
    for(int i=0; i<len; ++i)
        cout << A[i] << " ";
    cout << endl;
}

// 測試
int main()
{
    int A[8] = {332, 653, 632, 5, 755, 433, 722, 48};
    print(A, 8);
    RadixSort(A, 8, 3);
    print(A, 8);
    return 0;
}

基數排序的時間復雜度是 O(k·n)，其中n是排序元素個數，k是數字位數。注意這不是說這個時間復雜度一定優於O(nlgn)，因為n可能具有比較大的系數k。

另外，基數排序不僅可以對整數排序，也可以對有多個關鍵字域的記錄進行排序。例如，根據三個關鍵字年、月、日來對日期進行排序。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 線性時間排序算法算法導論第8章線性時間排序課后習題各種排序算法時間復雜度各種排序算法時間復雜度排序算法的時間復雜度算法之線性時間選擇（最壞情況下）平均時間復雜度為O(nlogn)的排序算法各種排序算法時間復雜度及穩定性常用排序算法之--時間復雜度計算在 n 個數當中找第k小元素 (BFPRT算法，最壞情況為線性時間的選擇問題)