桶排序


一,介紹

①什么是桶排序?

桶排序是在已經數據的范圍的條件下,創建若干個桶,根據相應的比較規則將待排數據落入各個對應的桶中,最后掃描 桶 來實現排序。

②桶排序需要的附加條件

數據的范圍已知。

比如,輸入整數數據 A(1)  A(2)......A(n-1)  A(n),它們都是由小於M的整數組成,此時,就可以創建 M 個桶進行桶排序了

再比如,固定長度的字母字符串數據: S(1) S(2) .....S(n-1) S(n),任意的字符串S(i),都由26個小寫字母組成,在桶排序過程中,就可以創建26個桶來保存這些字符串

 

二,桶排序的示例

①將10萬個人的年齡進行桶排序

假設有10萬個人的年齡數據,年齡范圍默認是0-99,如何對這10萬個數據進行排序?

如果用快排啊、歸並排序啊...這樣的排序算法是可以。但是這樣的排序問題更適合桶排序。采用桶排序的方法如下:

建立100個桶,這可以用一個 一維數組來表示。a[0...99],依次掃描10萬條數據,根據每條數據的值,記錄到桶中。比如,第10個人的年齡是18歲,則a[18]++ (這是將出現的頻率記錄在桶中,是計數,它是將待排序的元素本身進行比較,而不是將“待排序的元素的組成部分”進行比較)

然后,掃描這100個桶,即可得到有序的數組。

如:一個簡單的示例:    所有的數據都在0-5范圍內:

4,5,2,3,1,4,3,2,1,5,2,2,4,5,1,3,4,1,3,2,2

排序后.....

1,1,1,1,2,2,2,2,2,2,3,3,3,3,4,4,4,4,5,5,5

 

②將20個范圍為0-999的整數進行排序

如果按照①中的思路,則需要創建999個桶,然后進行一趟桶排序即可。

但是還有另外一種方式,只創建10個桶,但是要進行3趟桶排序。

10個桶對應0-9 一共10個不同的數字,說白了就是一個長度為10的整型數組。3趟桶排序是因為:0-999范圍內的數由3個位組成:個位、十位、百位

第一趟對個位數進行桶排序,根據個位數的值,將該數放入對應的桶中,比如425,個位數為5,則將425放到a[5]中---(這是將元素本身放到桶中,不是計數,這種方式待排序的元素個數不能超過桶的個數!!!)

第二趟對十位數進行桶排序,根據十位數.....

第三趟對百位數進行桶排序,根據百位數.....

具體的實現可以這樣:

在第一趟桶排序時,將待排的20個數依次放到桶中。然后,再把這20個數拷貝回原數組,然后再根據 十位 數排序:根據十位數的大小 將這20個數 按順序放到桶中,然后再把十位數有序的桶中的數據復制回原數組......百位數....

最終,原數組中的數據就是 已經排好序的數據了。

(注意:可能一個桶里面存儲了多個 數,比如: 425, 685 在第一趟桶排序時會被放入到同一個桶中

 

③將100個長度固定(比如5)的字符串進行排序

有100個字符串,每個字符串的長度為5,字符串只由小寫字母表中的字母組成。

小寫字母表共有26個,故需要26個桶。每個字符串的長度為5,需要進行5趟桶排序。

第一趟桶排序對所有字符串中最后一個字符進行比較,並將該字符串放到相應的桶中(是將元素本身放到桶中

然后,再把桶中的數據拷貝回原數組,以便進行第二趟比較。(因為,在下一趟桶排序中又需要將字符串根據下一個比較字符復制到桶中)

第二趟桶排序對所有字符串中的倒數第二個字符比較,並將該字符串放到相應的桶中

....

....

可以看出,這種類型的桶排序,並不是比較元素本身記錄出現的次數,而是比較元素的組成部分並將元素本身放到桶中。因此,需要根據實際問題,采用何種記錄方式。

比如,字符串 "china" ,所謂比較元素的組成部分是指,依次比較 "china" 中的各個字符 'a' 'n' 'i' 'h' 'c'。然后將字符串 "china" 存儲到桶中。

 

三,上面字符串桶排序的實現分析

final int BUCKETS = 26;
ArrayList<ArrayList<String>> buckets = new ArrayList<>();

定義桶的大小,並用一個buckets來保存所有的桶

 

for(int i = 0; i < BUCKETS; i++)
    buckets.add(new ArrayList<String>());

桶的初始化,每個桶都可以保存若干個字符串(比如,在第一趟排序中,若 “bcrd” 和 “cmed” 的最后一個字符相同,故它們會被放到同一個bucket中)

 

        for (int pos = stringLen - 1; pos >= 0; pos--)// 一共進行stringLen趟排序
        {
            for (String s : arr)
                buckets.get(s.charAt(pos) - 'a').add(s);// 根據比較的字符將 字符串放到相應的桶中

            int idx = 0;
            for (ArrayList<String> listStr : buckets){ 
                for (String str : listStr) 
                        arr[idx++] = str;//將桶中的數據放回到原數組中
                listStr.clear();//清空桶中的數據,以便下一趟排序做准備
            }
        }

桶排序的核心代碼,第一個for循環的次數是 字符串的長度,它表示的是進行多少趟桶排序

第二個for循環實現的功能是:對於待排序的每個字符串,根據該字符串的第 pos 位置的字符,來決定將該字符串放到哪個桶中去

第三個for循環則是:把桶中的每個字符串,依次按順序取出,放回到原數組中。這里的按順序表明:此時,字符串是按照 charAt(pos)這個字符串有序的。

比如,"bcao", "bcrd", "cmed", "glpq" 這四個字符串,在第一趟桶排序后,順序是:"bcrd","cmed","bcao","glpq"。即,根據最后一個字符來排序。

放回到原數組后,需要清空桶中的數據,這樣,在下一趟桶排序時,將根據 字符串的 第 pos-1 個字符 來決定將該字符串放到哪個桶中去

這里待排序的字符串數目arr.length 可以大於26,因為,每個桶中(ArrayList<String>)可存儲多個字符串!

 

四,桶排序復雜度分析

桶排序可以做到線性時間復雜度,比如上面的10萬個人的年齡排序。將10萬條年齡數據輸入,復雜度是O(N),輸出排序結果時遍歷每個桶復雜度是O(M),故總時間復雜度是O(M+N)。而這種情況下桶的個數遠遠小於數據條數。

對於使用多趟桶排序的情形,時間復雜度是O(p(N+b)),其中N是輸入的數據量,b是桶的個數,p是桶排序的趟數。比如上面提到的字符串排序,p是字符串的長度,N是字符串個數,b則是桶的數目(也即字符串中字符的種類(a-z),26種)

 

五,整個完整代碼實現

 1 public class BuckSort {
 2 
 3     /**
 4      * Radix sort an array of string. Assume all char are a-z (alph table)
 5      * @param arr
 6      * @param stringLen
 7      *            All have same length
 8      */
 9     public static void raidxSort(String[] arr, int stringLen) {
10         final int BUCKETS = 26;
11         ArrayList<ArrayList<String>> buckets = new ArrayList<>();
12         
13         
14         for(int i = 0; i < BUCKETS; i++)
15             buckets.add(new ArrayList<String>());
16 
17         for (int pos = stringLen - 1; pos >= 0; pos--)// 一共進行stringLen趟排序
18         {
19             for (String s : arr)
20                 buckets.get(s.charAt(pos) - 'a').add(s);// 根據比較的字符將 字符串放到相應的桶中
21 
22             int idx = 0;
23             for (ArrayList<String> listStr : buckets){ 
24                 for (String str : listStr) 
25                         arr[idx++] = str;//將桶中的數據放回到原數組中
26                 listStr.clear();//清空桶中的數據,以便下一趟排序做准備
27             }
28         }
29     }
30 
31     public static void main(String[] args) {
32         String[] arr = { "bcao", "bcrd", "cmed", "glpq" };
33         raidxSort(arr, 4);
34         for (String str : arr) {
35             System.out.println(str);
36         }
37     }
38 }

 
對年齡進行桶排序代碼實現如下:

public class AgeBuckSort {
    public static void buckSort(int[] ages){
        int[] buck = new int[100];//create buck
        //buck sort
        for (int age : ages)
            buck[age] ++;
        
        //print sorted result
        print(buck);
    }
    
    private static void print(int[] arr){
        int val;
        for(int i = 0; i < arr.length; i++){
            val = arr[i];
            for(int j = 1; j <= val; j++)
                System.out.print(i + " ");
        }
    }
    //for test purpose
    public static void main(String[] args) {
        Random rand = new Random();
        
        int[] ages = new int[1000];
        for(int i = 0; i < ages.length; i++)
            ages[i] = rand.nextInt(100);
        buckSort(ages);
    }
}

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM