Oracle 樹操作、遞歸查詢(select…start with…connect by…prior)


一、Oracle中start with…connect by prior子句用法

connect by 是結構化查詢中用到的,其基本語法是:
select … from tablename
start with 條件1
connect by 條件2
where 條件3;

例:
select * from table
start with org_id = ‘HBHqfWGWPy’
connect by prior org_id = parent_id;

         簡單說來是將一個樹狀結構存儲在一張表里,比如一個表中存在兩個字段:
org_id,parent_id那么通過表示每一條記錄的parent是誰,就可以形成一個樹狀結構。
        用上述語法的查詢可以取得這棵樹的所有記錄。
        其中:
        條件1 是根結點的限定語句,當然可以放寬限定條件,以取得多個根結點,實際就是多棵樹。
        條件2 是連接條件,其中用 PRIOR表示上一條記錄,比如  CONNECT BY  PRIOR org_id = parent_id;就是說 上一條記錄的org_id 是本條記錄的parent_id,即本記錄的父親是上一條記錄。
         條件3 是過濾條件,用於對返回的所有記錄進行過濾。

        簡單介紹如下:
        在掃描樹結構表時,需要依此訪問樹結構的每個節點,一個節點只能訪問一次,其訪問的步驟如下:
        第一步:從根節點開始;
        第二步:訪問該節點;
        第三步:判斷該節點有無未被訪問的子節點,若有,則轉向它最左側的未被訪問的子節,並執行第二步,否則執行第四步;
        第四步:若該節點為根節點,則訪問完畢,否則執行第五步;
        第五步:返回到該節點的父節點,並執行第三步驟。
        總之:掃描整個樹結構的過程也即是 中序遍歷樹的過程。

 1.樹結構的描述
        樹結構的數據存放在表中,數據之間的層次關系即父子關系,通過表中的列與列間的關系來描述,如EMP表中的EMPNO和MGR。EMPNO表示該雇員的編號,MGR表示領導該雇員的人的編號,即子節點的MGR值等於父節點的EMPNO值。在表的每一行中都有一個表示父節點的MGR(除根節點外),通過每個節點的父節點,就可以確定整個樹結構。
         在SELECT命令中使用CONNECT BY 和START WITH 子句可以查詢表中的樹型結構關系。其命令格式如下:
SELECT . . .
CONNECT BY {PRIOR 列名1=列名2|列名1=PRIOR 裂名2}
[START WITH];

       其中:CONNECT BY子句說明每行數據將是按層次順序檢索,並規定將表中的數據連入樹型結構的關系中。PRIOR運算符必須放置在連接關系的兩列中某一個的前面。對於節點間的父子關系, PRIOR運算符在一側表示父節點,在另一側表示子節點,從而確定查找樹結構是的順序是自頂向下還是自底向上
         在連接關系中,除了可以使用列名外,還允許使用列表達式。START WITH 子句為可選項,用來標識哪個節點作為查找樹型結構的根節點。若該子句被省略,則表示所有滿足查詢條件的行作為根節點。
         START WITH:不但可以指定一個根節點,還可以指定多個根節點。

2.關於PRIOR
        運算符PRIOR被放置於等號前后的位置,決定着查詢時的檢索順序。
        PRIOR被置於CONNECT BY子句中等號的前面時,則強制從根節點到葉節點的順序檢索,即由父節點向子節點方向通過樹結構,我們稱之為自頂向下的方式。如:
         CONNECT BY PRIOR EMPNO=MGR
         PIROR運算符被置於CONNECT BY 子句中等號的后面時,則強制從葉節點到根節點的順序檢索,即由子節點向父節點方向通過樹結構,我們稱之為自底向上的方式。例如:
         CONNECT BY EMPNO=PRIOR MGR
         在這種方式中也應指定一個開始的節點。

3.定義查找起始節點
        在自頂向下查詢樹結構時,不但可以從根節點開始,還可以定義任何節點為起始節點,以此開始向下查找。這樣查找的結果就是以該節點為開始的結構樹的一枝。

4.使用LEVEL
        在具有樹結構的表中,每一行數據都是樹結構中的一個節點,由於節點所處的層次位置不同,所以每行記錄都可以有一個層號。層號根據節點與根節點的距離確定。不論從哪個節點開始,該起始根節點的層號始終為1,根節點的子節點為2, 依此類推。圖1.2就表示了樹結構的層次。

5.節點和分支的裁剪
         在對樹結構進行查詢時,可以去掉表中的某些行,也可以剪掉樹中的一個分支,使用WHERE子句來限定樹型結構中的單個節點,以去掉樹中的單個節點,但它卻不影響其后代節點(自頂向下檢索時)或前輩節點(自底向頂檢索時)。

6.排序顯示
         象在其它查詢中一樣,在樹結構查詢中也可以使用ORDER BY 子句,改變查詢結果的顯示順序,而不必按照遍歷樹結構的順序。
 
二、例子
 

1、准備測試表和測試數據

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
61
62
63
64
--菜單目錄結構表
create  table  tb_menu(
   id     number(10) not  null , --主鍵id
   title  varchar2(50), --標題
   parent number(10) --parent id
)
 
--父菜單
insert  into  tb_menu(id, title, parent) values (1, '父菜單1' , null );
insert  into  tb_menu(id, title, parent) values (2, '父菜單2' , null );
insert  into  tb_menu(id, title, parent) values (3, '父菜單3' , null );
insert  into  tb_menu(id, title, parent) values (4, '父菜單4' , null );
insert  into  tb_menu(id, title, parent) values (5, '父菜單5' , null );
--一級菜單
insert  into  tb_menu(id, title, parent) values (6, '一級菜單6' ,1);
insert  into  tb_menu(id, title, parent) values (7, '一級菜單7' ,1);
insert  into  tb_menu(id, title, parent) values (8, '一級菜單8' ,1);
insert  into  tb_menu(id, title, parent) values (9, '一級菜單9' ,2);
insert  into  tb_menu(id, title, parent) values (10, '一級菜單10' ,2);
insert  into  tb_menu(id, title, parent) values (11, '一級菜單11' ,2);
insert  into  tb_menu(id, title, parent) values (12, '一級菜單12' ,3);
insert  into  tb_menu(id, title, parent) values (13, '一級菜單13' ,3);
insert  into  tb_menu(id, title, parent) values (14, '一級菜單14' ,3);
insert  into  tb_menu(id, title, parent) values (15, '一級菜單15' ,4);
insert  into  tb_menu(id, title, parent) values (16, '一級菜單16' ,4);
insert  into  tb_menu(id, title, parent) values (17, '一級菜單17' ,4);
insert  into  tb_menu(id, title, parent) values (18, '一級菜單18' ,5);
insert  into  tb_menu(id, title, parent) values (19, '一級菜單19' ,5);
insert  into  tb_menu(id, title, parent) values (20, '一級菜單20' ,5);
--二級菜單
insert  into  tb_menu(id, title, parent) values (21, '二級菜單21' ,6);
insert  into  tb_menu(id, title, parent) values (22, '二級菜單22' ,6);
insert  into  tb_menu(id, title, parent) values (23, '二級菜單23' ,7);
insert  into  tb_menu(id, title, parent) values (24, '二級菜單24' ,7);
insert  into  tb_menu(id, title, parent) values (25, '二級菜單25' ,8);
insert  into  tb_menu(id, title, parent) values (26, '二級菜單26' ,9);
insert  into  tb_menu(id, title, parent) values (27, '二級菜單27' ,10);
insert  into  tb_menu(id, title, parent) values (28, '二級菜單28' ,11);
insert  into  tb_menu(id, title, parent) values (29, '二級菜單29' ,12);
insert  into  tb_menu(id, title, parent) values (30, '二級菜單30' ,13);
insert  into  tb_menu(id, title, parent) values (31, '二級菜單31' ,14);
insert  into  tb_menu(id, title, parent) values (32, '二級菜單32' ,15);
insert  into  tb_menu(id, title, parent) values (33, '二級菜單33' ,16);
insert  into  tb_menu(id, title, parent) values (34, '二級菜單34' ,17);
insert  into  tb_menu(id, title, parent) values (35, '二級菜單35' ,18);
insert  into  tb_menu(id, title, parent) values (36, '二級菜單36' ,19);
insert  into  tb_menu(id, title, parent) values (37, '二級菜單37' ,20);
--三級菜單
insert  into  tb_menu(id, title, parent) values (38, '三級菜單38' ,21);
insert  into  tb_menu(id, title, parent) values (39, '三級菜單39' ,22);
insert  into  tb_menu(id, title, parent) values (40, '三級菜單40' ,23);
insert  into  tb_menu(id, title, parent) values (41, '三級菜單41' ,24);
insert  into  tb_menu(id, title, parent) values (42, '三級菜單42' ,25);
insert  into  tb_menu(id, title, parent) values (43, '三級菜單43' ,26);
insert  into  tb_menu(id, title, parent) values (44, '三級菜單44' ,27);
insert  into  tb_menu(id, title, parent) values (45, '三級菜單45' ,28);
insert  into  tb_menu(id, title, parent) values (46, '三級菜單46' ,28);
insert  into  tb_menu(id, title, parent) values (47, '三級菜單47' ,29);
insert  into  tb_menu(id, title, parent) values (48, '三級菜單48' ,30);
insert  into  tb_menu(id, title, parent) values (49, '三級菜單49' ,31);
insert  into  tb_menu(id, title, parent) values (50, '三級菜單50' ,31);
commit ;
 
select  * from  tb_menu;

parent字段存儲的是上級id,如果是頂級父節點,該parent為null(得補充一句,當初的確是這樣設計的,不過現在知道,表中最好別有null記錄,這會引起全文掃描,建議改成0代替)。

2、樹操作
我們從最基本的操作,逐步列出樹查詢中常見的操作,所有查詢出來的節點以家族中的輩份作比方。

1)、查找樹中的所有頂級父節點(輩份最長的人)。 假設這個樹是個目錄結構,那么第一個操作總是找出所有的頂級節點,再根據該節點找到其下屬節點。

1
select * from tb_menu m where m.parent is null ;

2)、查找一個節點的直屬子節點(所有兒子)。 如果查找的是直屬子類節點,也是不用用到樹型查詢的。

1
select * from tb_menu m where m.parent= 1 ;

3)、查找一個節點的所有直屬子節點(所有后代)。

1
select * from tb_menu m start with m.id= 1  connect by m.parent=prior m.id;

這個查找的是id為1的節點下的所有直屬子類節點,包括子輩的和孫子輩的所有直屬節點。

4)、查找一個節點的直屬父節點(父親)。 如果查找的是節點的直屬父節點,也是不用用到樹型查詢的。

1
2
3
4
--c-->child, p->parent
select c.id, c.title, p.id parent_id, p.title parent_title
from tb_menu c, tb_menu p
where c.parent=p.id and c.id= 6

5)、查找一個節點的所有直屬父節點(祖宗)。

1
select * from tb_menu m start with m.id= 38  connect by prior m.parent=m.id;

這里查找的就是id為1的所有直屬父節點,打個比方就是找到一個人的父親、祖父等。但是值得注意的是這個查詢出來的結果的順序是先列出子類節點再列出父類節點,姑且認為是個倒序吧。

上面列出兩個樹型查詢方式,第3條語句和第5條語句,這兩條語句之間的區別在於prior關鍵字的位置不同,所以決定了查詢的方式不同。 當parent = prior id時,數據庫會根據當前的id迭代出parent與該id相同的記錄,所以查詢的結果是迭代出了所有的子類記錄;而prior parent = id時,數據庫會跟據當前的parent來迭代出與當前的parent相同的id的記錄,所以查詢出來的結果就是所有的父類結果。

以下是一系列針對樹結構的更深層次的查詢,這里的查詢不一定是最優的查詢方式,或許只是其中的一種實現而已。

6)、查詢一個節點的兄弟節點(親兄弟)。

1
2
3
--m.parent=m2.parent-->同一個父親
select * from tb_menu m
where exists (select * from tb_menu m2 where m.parent=m2.parent and m2.id= 6 )

7)、查詢與一個節點同級的節點(族兄弟)。 如果在表中設置了級別的字段,那么在做這類查詢時會很輕松,同一級別的就是與那個節點同級的,在這里列出不使用該字段時的實現!

1
2
3
4
5
6
7
8
with tmp as(
       select a.*, level leaf       
       from tb_menu a               
       start with a.parent is null     
       connect by a.parent = prior a.id)
select *                              
from tmp                            
where leaf = (select leaf from tmp where id = 50 );

這里使用兩個技巧,一個是使用了level來標識每個節點在表中的級別,還有就是使用with語法模擬出了一張帶有級別的臨時表。

8)、查詢一個節點的父節點的的兄弟節點(伯父與叔父)。          

1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
with tmp as(
     select tb_menu.*, level lev
     from tb_menu
     start with parent is null
     connect by parent = prior id)
    
select b.*
from tmp b,(select *
             from tmp
             where id = 21  and lev = 2 ) a
where b.lev = 1
 
union all
 
select *
from tmp
where parent = (select distinct x.id
                 from tmp x, --祖父
                      tmp y, --父親
                      (select *
                       from tmp
                       where id = 21  and lev > 2 ) z --兒子
                 where y.id = z.parent and x.id = y.parent);

這里查詢分成以下幾步。
首先,將第7個一樣,將全表都使用臨時表加上級別;
其次,根據級別來判斷有幾種類型,以上文中舉的例子來說,有三種情況:
(1)當前節點為頂級節點,即查詢出來的lev值為1,那么它沒有上級節點,不予考慮。
(2)當前節點為2級節點,查詢出來的lev值為2,那么就只要保證lev級別為1的就是其上級節點的兄弟節點。
(3)其它情況就是3以及以上級別,那么就要選查詢出來其上級的上級節點(祖父),再來判斷祖父的下級節點都是屬於該節點的上級節點的兄弟節點。
最后,就是使用union將查詢出來的結果進行結合起來,形成結果集。

9)、查詢一個節點的父節點的同級節點(族叔)。
這個其實跟第7種情況是相同的。

1
2
3
4
5
6
7
8
with tmp as(
       select a.*, level leaf       
       from tb_menu a               
       start with a.parent is null     
       connect by a.parent = prior a.id)
select *                              
from tmp                            
where leaf = (select leaf from tmp where id = 6 ) - 1 ;

基本上,常見的查詢在里面了,不常見的也有部分了。其中,查詢的內容都是節點的基本信息,都是數據表中的基本字段,但是在樹查詢中還有些特殊需求,是對查詢數據進行了處理的,常見的包括列出樹路徑等。

補充一個概念,對於數據庫來說,根節點並不一定是在數據庫中設計的頂級節點,對於數據庫來說,根節點就是start with開始的地方。

下面列出的是一些與樹相關的特殊需求。

10)、名稱要列出名稱全部路徑。
這里常見的有兩種情況,一種是從頂級列出,直到當前節點的名稱(或者其它屬性);一種是從當前節點列出,直到頂級節點的名稱(或其它屬性)。舉地址為例:國內的習慣是從省開始、到市、到縣、到居委會的,而國外的習慣正好相反(老師說的,還沒接過國外的郵件,誰能寄個瞅瞅  )。
從頂部開始:

1
2
3
4
5
select sys_connect_by_path (title, '/' )
from tb_menu
where id = 50
start with parent is null
connect by parent = prior id;

從當前節點開始:

1
2
3
4
select sys_connect_by_path (title, '/' )
from tb_menu
start with id = 50
connect by prior parent = id;

在這里我又不得不放個牢騷了。oracle只提供了一個sys_connect_by_path函數,卻忘了字符串的連接的順序。在上面的例子中,第一個sql是從根節點開始遍歷,而第二個sql是直接找到當前節點,從效率上來說已經是千差萬別,更關鍵的是第一個sql只能選擇一個節點,而第二個sql卻是遍歷出了一顆樹來。再次ps一下。

sys_connect_by_path函數就是從start with開始的地方開始遍歷,並記下其遍歷到的節點,start with開始的地方被視為根節點,將遍歷到的路徑根據函數中的分隔符,組成一個新的字符串,這個功能還是很強大的。

11)、列出當前節點的根節點。
在前面說過,根節點就是start with開始的地方。

1
2
3
4
select connect_by_root title, tb_menu.*
from tb_menu
start with id = 50
connect by prior parent = id;

connect_by_root函數用來列的前面,記錄的是當前節點的根節點的內容。

12)、列出當前節點是否為葉子。
這個比較常見,尤其在動態目錄中,在查出的內容是否還有下級節點時,這個函數是很適用的。

1
2
3
4
select connect_by_isleaf, tb_menu.*
from tb_menu
start with parent is null
connect by parent = prior id;

connect_by_isleaf函數用來判斷當前節點是否包含下級節點,如果包含的話,說明不是葉子節點,這里返回0;反之,如果不包含下級節點,這里返回1。

至此,oracle樹型查詢基本上講完了,以上的例子中的數據是使用到做過的項目中的數據,因為里面的內容可能不好理解,所以就全部用一些新的例子來進行闡述。以上所有sql都在本機上測試通過,也都能實現相應的功能,但是並不能保證是解決這類問題的最優方案(如第8條明顯寫成存儲過程會更好).


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM