如何在數據庫中存儲一棵樹

本文轉載自查看原文 2017-08-23 19:36 1083 樹/ 數據庫/ 數據結構

樹形結構的數據在項目開發中比較常見，比如比較典型的是論壇主題留言。

每一個主題（節點）可以有n個留言（子節點）。這些留言又可以有自己的留言。因此這種結構就是一顆樹。本文討論的是數據庫中如何存儲這種樹形結構。

假設有如下一棵樹：

方法一

注意：本例中的數據庫是SQLite，因此SQL語句只對SQLite有效，其他數據庫可以參考該寫法。

要存儲於數據庫中，最簡單直接的方法，就是存儲每個元素的父節點ID。

暫且把這種方法命名依賴父節點法，因此表結構設計如下：

存儲的數據如下格式：

這種結構下，如果查詢某一個節點的直接子節點，十分容易，比如要查詢D節點的子節點。

 
                select  
                *  
                from  
                tree1  
                where  
                parentid=4

如果要插入某個節點，比如在D節點下，再次插入一個M節點。

只需要如下SQL：

 
                INSERT  
                INTO  
                tree1 (value,parentid)  
                VALUES 
                ( 
                'M' 
                ,4);

這種結構在查找某個節點的所有子節點，就稍顯復雜，無論是SELECT還是DELETE都可能涉及到獲取所有子節點的問題。比如要刪除一個節點並且該節點的子節點也要全部刪除，那么首先要獲得所有子節點的ID，因為子節點並不只是直接子節點，還可能包含子節點的子節點。比如刪除D節點及其子節點，必須先查出D節點下的所有子節點，然后再做刪除，SQL如下：

 
           
            
              
              
                select  
                nodeid  
                from  
                tree1  
                where  
                parentid=4  
                --返回8,9 
               
 
                select  
                nodeid  
                from  
                tree1  
                where  
                parentid  
                in  
                (8,9)  
                --返回10,11,12 
               
 
                select  
                nodeid  
                from  
                tree1  
                where  
                parentid  
                in  
                (10,11,12)  
                --返回空 
               
 
                delete  
                from  
                tree1  
                where  
                nodeid  
                in  
                (4,8,9,10,11,12) 
               
 
            
 
           
         

如果是只刪除D節點，對於其它節點不做刪除而是做提升，那么必須先修改子節點的parentid，然后才能刪除D節點。

正如上面演示的，對於這種依賴父節點法，最大的缺點就是無法直接獲得某個節點的所有子節點。因此如果要select所有的子節點，需要繁瑣的步驟，這不利於做聚合操作。

對於某些數據庫產品，支持遞歸查詢語句的，比如微軟的SQL Server，可以使用CTE技術實現遞歸查詢。比如，要查詢D節點的所有子節點。只需要如下語句：

 
                WITH  
                tmp  
                AS 
                ( 
               
                SELECT  
                *  
                FROM  
                Tree1  
                WHERE  
                nodeid = 4 
               
                UNION  
                ALL 
               
                SELECT  
                a.*  
                FROM  
                Tree1  
                AS  
                a,tmp  
                AS  
                b  
                WHERE  
                a.parentid = b. nodeid 
               
                ) 
               
                SELECT  
                *  
                FROM  
                tmp

但是對於那些不支持遞歸查詢的數據庫來說，實現起來就比較復雜了。

方法二

還有一種比較土的方法，就是存儲路徑。暫且命名為路徑枚舉法。

這種方法，將存儲根結點到每個節點的路徑。

這種數據結構，可以一眼就看出子節點的深度。

如果要查詢某個節點下的子節點，只需要根據path的路徑去匹配，比如要查詢D節點下的所有子節點。

或者出於效率考慮，直接寫成

如果要做聚合操作，也很容易，比如查詢D節點下一共有多少個節點。

select count(*) from tree2 where path like '1/4/%';

要插入一個節點，則稍微麻煩點。要插入自己，然后查出父節點的Path，並且把自己生成的ID更新到path中去。比如，要在L節點后面插入M節點。

首先插入自己M，然后得到一個nodeid比如nodeid=13，然后M要插入到L后面，因此，查出L的path為1/4/8/12/,因此update M的path為1/4/8/12/13

 
                update  
                tree2  
                set 
               
                path=( 
                select  
                path  
                from  
                tree2  
                where  
                nodeid=12)  
                --此處開始拼接 
               
                ||last_insert_rowid()|| 
                '/' 
               
                where 
               
                nodeid= last_insert_rowid();

這種方法有一個明顯的缺點就是path字段的長度是有限的，這意味着，不能無限制的增加節點深度。因此這種方法適用於存儲小型的樹結構。

方法三

下面介紹一種方法，稱之為閉包表。

該方法記錄了樹中所有節點的關系，不僅僅只是直接父子關系，它需要使用2張表，除了節點表本身之外，還需要使用1張表來存儲節祖先點和后代節點之間的關系（同時增加一行節點指向自身）,並且根據需要，可以增加一個字段，表示深度。因此這種方法數據量很多。設計的表結構如下：

Tree3表：

NodeRelation表：

如例子中的樹，插入的數據如下：

Tree3表的數據

NodeRelation表的數據

可以看到，NodeRelation表的數據量很多。但是查詢非常方便。比如，要查詢D節點的子元素

只需要

 
                select  
                *  
                from  
                NodeRelation  
                where  
                ancestor=4;

要查詢節點D的直接子節點，則加上depth=1

 
                select  
                *  
                from  
                NodeRelation  
                where  
                ancestor=4  
                and  
                depth=1;

要查詢節點J的所有父節點，SQL：

 
                select  
                *  
                from  
                NodeRelation  
                where  
                descendant=10;

如果是插入一個新的節點，比如在L節點后添加子節點M,則插入的節點除了M自身外，還有對應的節點關系。即還有哪些節點和新插入的M節點有后代關系。這個其實很簡單，只要和L節點有后代關系的，和M節點必定會有后代關系，並且和L節點深度為X的和M節點的深度必定為X+1。因此，在插入M節點后，找出L節點為后代的那些節點作為和M節點之間有后代關系，插入到數據表。

 
                INSERT  
                INTO  
                tree3 (value)  
                VALUES 
                ( 
                'M' 
                ); 
                --插入節點 
               
                INSERT  
                INTO   
                NodeRelation(ancestor,descendant,depth) 
               
                select  
                n.ancestor,last_insert_rowid(),n.depth+1 
                --此處深度+1作為和M節點的深度 
               
                from  
                NodeRelation n 
               
                where  
                n.descendant=12 
               
                Union  
                ALL 
               
                select   
                last_insert_rowid() ,last_insert_rowid(),0  
                --加上自身

在某些並不需要使用深度的情況下，甚至可以不需要depth字段。

如果要刪除某個節點也很容易，比如，要刪除節點D，這種情況下，除了刪除tree3表中的D節點外，還需要刪除NodeRelation表中的關系。

首先以D節點為后代的關系要刪除，同時以D節點的后代為后代的這些關系也要刪除：

 
                delete  
                from  
                NodeRelation  
                where  
                descendant  
                in 
               
                ( 
                select  
                descendant  
                from  
                NodeRelation  
                where  
                ancestor=4 )； 
                --查詢以D節點為祖先的那些節點，即D節點的后代。

這種刪除方法，雖然徹底，但是它也刪除了D節點和它原本的子節點的關系。

如果只是想割裂D節點和A節點的關系，而對於它原有的子節點的關系予以保留，則需要加入限定條件。

限制要刪除的關系的祖先不以D為祖先，即如果這個關系以D為祖先的，則不用刪除。因此把上面的SQL加上條件。

 
           
            
              
              
                delete  
                from  
                NodeRelation  
                where  
                descendant  
                in 
               
 
                ( 
                select  
                descendant  
                from  
                NodeRelation  
                where  
                ancestor=4 )； 
                --查詢以D節點為祖先的那些節點，即D節點的后代。 
               
 
                and  
                ancestor  
                not  
                in  
                ( 
                select  
                descendant  
                from  
                NodeRelation   
                where  
                ancestor =4 ) 
               
 
            
 
           
         

上面的SQL用文字描述就是，查詢出D節點的后代，如果一個關系的祖先不屬於D節點的后代，並且這個關系的后代屬於D節點的后代，就刪除它。

這樣的刪除，保留了D節點自身子節點的關系，如上面的例子，實際上刪除的節點關系為：

如果要刪除節點H，則為

總結：

上面主要講了3種方式，各有優點缺點。可以根據實際需要，選擇合適的數據模型。

本文出自 “一只博客” 博客，請務必保留此出處http://cnn237111.blog.51cto.com/2359144/1226911

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 【python】用turtle庫畫一棵樹如何打印一棵樹（Java）遞歸法創建一棵樹 python：打印一棵樹 js畫一棵樹判斷一棵樹是否是另一棵樹的子樹樹的c++實現--建立一棵樹 Java遞歸的方式構造一棵樹 3、如何判斷一棵樹是否是紅黑樹？已知一棵樹的中序和先序，如何畫出該二叉樹