Trie樹遍歷的加速

本文轉載自查看原文 2012-09-25 02:28 2443 算法與數據結構

　　Trie樹用來給字符串排序的時候有一個好處：邊讀邊排序，但是讀完之后要輸出的時候麻煩來了。經過測試，用26W個word建立的Trie中，空白位是使用位的20倍左右，那么在Trie比較大的時候當然也就比較慢了。這篇文章討論的優化主要是去避免訪問這些空白位，實現方式無關（數組或指針？）。

　　首先想到的一個方法是：在insert的時候順便標記這個節點有哪些子節點。因為總共只有26種可能性，那么自然也就想到了用一個int作為flag，如果0位置1則表示有‘a’這個子節點。

　　第一步（記錄）完成了，下面我們來看如何來使用該記錄？熟悉位移的同學可能已經想到：可以使用x&-x來計算出最低位為1的數。但是遺憾的是這個並不是我們想要的結果，因為得到的是2^N，我們想要的是這個N。好的，最笨的一種方法出來了：

　　int t[] = new int[1<<26];

　　t[1<<0] = 0.....

非常遺憾的是我們申請不了這么大的空間。那么，問題就是將一些離散的數通過數組建立映射關系，很自然地就會聯想到Hash。怎么使用Hash呢？我嘗試了一下，從2^0到2^26對29取余數為：

　　1.2.4.8.16.3.6.12.24.19.9.18.7.14.28.27.25.21.13.26.23.17.5.10.20.11

沒有看錯，沒有一個是相同的！這樣的話就可以僅僅使用一個大小不到30的數組就可以搞定。同樣遺憾的時候，這里用到了取余數的操作，要知道這個還算比較大的，可能一不小心就把我們辛辛苦苦省下來的時間又葬送掉了。那么有沒有其他的方法呢？還是回到最笨的方法的思路上：

　　如果我們申請不了int[1<<26]，那申請int[1<<13]總是可以的吧？

為什么這么做呢？因為申請不了這么大的空間！這時候就把這個問題換成兩半了，比如在節點I出的標志位flag：

　　int lowHalf = flag&((1<<14)-1);

　　int highHalf = (flag>>13)&((1<<14)-1);

　　while(lowHalf > 0){

　　　　int i = lowHalf&-lowHalf;

　　　　int j = t[i];

　　　　// do someting

　　}

　　while(highHalf > 0){

　　　　int i = highHalf&-highHalf;

　　　　int j = t[i]+13;

　　　　// do someting

　　}

和最笨的那種方法相比，只是多了一次操作而已。

　　好了現在來看最后一種方法，就不多寫了：

　　switch(flag&-flag){

　　case 1<<0:

　　case 1<<1:

　　case 1<<2:

　　.....

　　}

------------------------------------------------

歡迎拍磚。

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 trie樹（前綴樹）字典樹（trie 樹） trie樹-前綴樹從Trie樹到雙數組Trie樹 Trie樹的java實現字典樹(Trie)詳解淺談 trie樹及其實現 Trie（字典樹）字典樹(Trie Tree) 字典樹 (Trie Tree)