order_by_、group_by_、having的用法區別


寫於 2012-11-20 22:14  doc文檔上。

 

 

Having

這個是用在聚合函數的用法。當我們在用聚合函數的時候,一般都要用到GROUP BY 先進行分組,然后再進行聚合函數的運算。運算完后就要用到HAVING 的用法了,就是進行判斷了,例如說判斷聚合函數的值是否大於某一個值等等。

select customer_name,sum(balance)

from balance

group by customer_name

having balance>200; yc_rpt_getnew

 

order by group by having的用法區別

order by 從英文里理解就是行的排序方式,默認的為升序。 order by 后面必須列出排序的字段名,可以是多個字段名。

group by 從英文里理解就是分組。必須有“聚合函數”來配合才能使用,使用時至少需要一個分組標志字段。

什么是“聚合函數”?
像sum()、count()、avg()等都是“聚合函數”
使用group by 的目的就是要將數據分類匯總。

一般如:
select 單位名稱,count(職工id),sum(職工工資) form [某表]
group by 單位名稱
這樣的運行結果就是以“單位名稱”為分類標志統計各單位的職工人數和工資總額。

在sql命令格式使用的先后順序上,group by 先於 order by。

select 命令的標准格式如下:

SELECT select_list
[ INTO new_table ]
FROM table_source
[ WHERE search_condition ]
[ GROUP BY group_by_expression ]
[ HAVING search_condition ]

1. GROUP BY 是分組查詢, 一般 GROUP BY 是和聚合函數配合使用

group by 有一個原則,就是 select 后面的所有列中,沒有使用聚合函數的列,必須出現在 group by 后面(重要)

例如,有如下數據庫表:

A    B
1    abc
1    bcd

1    asdfg

如果有如下查詢語句(該語句是錯誤的,原因見前面的原則)

select A,B from table group by A

該查詢語句的意圖是想得到如下結果(當然只是一相情願)

A     B
       abc
1     bcd

       asdfg

右邊3條如何變成一條,所以需要用到聚合函數,如下(下面是正確的寫法):

select A,count(B) as 數量 from table group by A
這樣的結果就是
A 數量
1    3

2. Having

where 子句的作用是在對查詢結果進行分組前,將不符合where條件的行去掉,即在分組之前過濾數據,條件中不能包含聚組函數,使用where條件顯示特定的行。

having 子句的作用是篩選滿足條件的組,即在分組之后過濾數據,條件中經常包含聚組函數,使用having 條件顯示特定的組,也可以使用多個分組標准進行分組。

having 子句被限制子已經在SELECT語句中定義的列和聚合表達式上。通常,你需要通過在HAVING子句中重復聚合函數表達式來引用聚合值,就如你在SELECT語句中做的那樣。例如:

SELECT A COUNT(B) FROM TABLE GROUP BY A HAVING COUNT(B)>2

 

Grouping 的用法:

指示是否聚合 group by 列表中的指定表達式。在結果集中,如果 Grouping 返回 1 ,表示聚合;如果 Grouping 返回 0 ,表示非聚合。如果指定了 Group by ,那么只能用在 Select , Having , Order by 中。

注釋:

GROUPING 用於區分標准空值和由 ROLLUP 、 CUBE 或 GROUPING SETS 返回的空值。作為 ROLLUP 、 CUBE 或 GROUPING SETS 操作結果返回的 NULL 是 NULL 的特殊應用。它在結果集內作為列的占位符,表示全體。

舉例:

CREATE TABLE tt ( 產地 CHAR ( 8), 水果 CHAR ( 8), 重量 INT   )

INSERT tt VALUES ( ' 北方 ' , ' 香蕉 ' , 3)

INSERT tt VALUES ( ' 北方 ' , ' 水蜜桃 ' , 2)

INSERT tt VALUES ( ' 南方 ' , ' 桔子 ' , 3)

INSERT tt VALUES ( ' 北方 ' , ' 水蜜桃 ' , 5)

INSERT tt VALUES ( ' 南方 ' , ' 香蕉 ' , 3)

INSERT tt VALUES ( ' 南方 ' , ' 水蜜桃 ' , 6)

INSERT tt VALUES ( ' 北方 ' , ' 桔子 ' , 8)

select

CASE WHEN ( GROUPING ( 產地 ) = 1) THEN ' 總計 '

    ELSE ISNULL ( 產地 , 'UNKNOWN' )

END AS 產地 ,

CASE WHEN ( GROUPING ( 水果 ) = 1) THEN ' 小計 '

    ELSE ISNULL ( 水果 , 'UNKNOWN' )

END AS 產地 ,

SUM ( 重量 ) 總重量

FROM TT

GROUP BY 產地 , 水果

WITH ROLLUP

結果:

/************************

北方      桔子      8

北方      水蜜桃    7

北方      香蕉      3

北方      小計      18

南方      桔子      3

南方      水蜜桃    6

南方      香蕉      3

南方      小計      12

總計     小計       30

*************************/

 

GROUPING(字段)=1的是對應字段匯總的
GROUPING(字段)=0的是對應字段原來的明細的信息 

 

 

 

 

 

 

 

 

oracle Rollup 和 Cube用法

Oracle的GROUP BY語句除了最基本的語法外,還支持ROLLUP和CUBE語句。如果是ROLLUP(A, B, C)的話,首先會對(A、B、C)進行GROUP BY,然后對(A、B)進行GROUP BY,然后是(A)進行GROUP BY,最后對全表進行GROUP BY操作。如果是GROUP BY CUBE(A, B, C),則首先會對(A、B、C)進行GROUP BY,然后依次是(A、B),(A、C),(A),(B、C),(B),(C),最后對全表進行GROUP BY操作。 grouping_id()可以美化效果:

Oracle的GROUP BY語句除了最基本的語法外,還支持ROLLUP和CUBE語句。
除本文內容外,你還可參考:
    分析函數參考手冊: http://xsb.itpub.net/post/419/33028
    分析函數使用例子介紹:http://xsb.itpub.net/post/419/44634

SQL> create table t as select * from dba_indexes; 表已創建。
SQL> select index_type, status, count(*) from t group by index_type, status;


INDEX_TYPE STATUS COUNT(*)
--------------------------- -------- ----------
LOB VALID 51
NORMAL N/A 25
NORMAL VALID 479
CLUSTER VALID 11

下面來看看ROLLUP和CUBE語句的執行結果。
SQL> select index_type, status, count(*) from t group by rollup(index_type, status);


INDEX_TYPE STATUS COUNT(*)
--------------------------- -------- ----------
LOB VALID 51
LOB 51
NORMAL N/A 25
NORMAL VALID 479
NORMAL 504
CLUSTER VALID 11
CLUSTER 11
566
已選擇8行。
SQL> select index_type, status, count(*) from t group by cube(index_type, status);
INDEX_TYPE STATUS COUNT(*)
--------------------------- -------- ----------
566
N/A 25
VALID 541
LOB 51
LOB VALID 51
NORMAL 504
NORMAL N/A 25
NORMAL VALID 479
CLUSTER 11
CLUSTER VALID 11

已選擇10行。
查詢結果不是很一目了然,下面通過Oracle提供的函數GROUPING來整理一下查詢結果。
SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*)
2 from t group by rollup(index_type, status) order by 1, 2;
G_IND G_ST INDEX_TYPE STATUS COUNT(*)
---------- ---------- --------------------------- -------- ----------
0 0 LOB VALID 51
0 0 NORMAL N/A 25
0 0 NORMAL VALID 479
0 0 CLUSTER VALID 11
0 1 LOB 51
0 1 NORMAL 504
0 1 CLUSTER 11
1 1 566

已選擇8行。
這個查詢結果就直觀多了,和不帶ROLLUP語句的GROUP BY相比,ROLLUP增加了對INDEX_TYPE的GROUP BY統計和對所有記錄的GROUP BY統計。
就是說,如果是ROLLUP(A, B, C)的話,首先會對(A、B、C)進行GROUP BY,然后對(A、B)進行GROUP BY,然后是(A)進行GROUP BY,最后對全表進行GROUP BY操作。

下面看看CUBE語句。

SQL> select grouping(index_type) g_ind, grouping(status) g_st, index_type, status, count(*)
2 from t group by cube(index_type, status) order by 1, 2;

G_IND G_ST INDEX_TYPE STATUS COUNT(*)
---------- ---------- --------------------------- -------- ----------
0 0 LOB VALID 51
0 0 NORMAL N/A 25
0 0 NORMAL VALID 479
0 0 CLUSTER VALID 11
0 1 LOB 51
0 1 NORMAL 504
0 1 CLUSTER 11
1 0 N/A 25
1 0 VALID 541
1 1 566
已選擇10行。
和ROLLUP相比,CUBE又增加了對STATUS列的GROUP BY統計。
如果是GROUP BY CUBE(A, B, C),則首先會對(A、B、C)進行GROUP BY,然后依次是(A、B),(A、C),(A),(B、C),(B),(C),最后對全表進行GROUP BY操作。
除了使用GROUPING函數,還可以使用GROUPING_ID來標識GROUP BY結果。

SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*)
2 from t group by rollup(index_type, status) order by 1;

G_IND INDEX_TYPE STATUS COUNT(*)
---------- --------------------------- -------- ----------
0 LOB VALID 51
0 NORMAL N/A 25
0 NORMAL VALID 479
0 CLUSTER VALID 11
1 LOB 51
1 NORMAL 504
1 CLUSTER 11
3 566

已選擇8行。

SQL> select grouping_id(index_type, status) g_ind, index_type, status, count(*)
2 from t group by cube(index_type, status) order by 1;

G_IND INDEX_TYPE STATUS COUNT(*)
---------- --------------------------- -------- ----------
0 LOB VALID 51
0 NORMAL N/A 25
0 NORMAL VALID 479
0 CLUSTER VALID 11
1 LOB 51
1 NORMAL 504
1 CLUSTER 11
2 N/A 25
2 VALID 541
3 566
已選擇10行。
grouping_id()可以美化效果:
select DECODE(GROUPING_ID(C1), 1, '合計', C1) D1,
DECODE(GROUPING_ID(C1, C2), 1, '小計', C2) D2,
DECODE(GROUPING_ID(C1, C2, C1 + C2), 1, '小計', C1 + C2) D3,
count(*),
GROUPING_ID(C1, C2, C1 + C2, C1 + 1, C2 + 1),
GROUPING_ID(C1)
from T2
group by rollup(C1, C2, C1 + C2, C1 + 1, C2 + 1);
===========================================================
1.報表合計專用的Rollup函數
銷售報表
廣州 1月 2000元
廣州 2月 2500元
廣州 4500元
深圳 1月 1000元
深圳 2月 2000元
深圳 3000元
所有地區 7500元
以往的查詢SQL:
Select area,month,sum(money) from SaleOrder group by area,month
然后廣州,深圳的合計和所有地區合計都需要在程序里自行累計
1.其實可以使用如下SQL:
Select area,month,sum(total_sale) from SaleOrder group by rollup(area,month)
就能產生和報表一模一樣的紀錄
2.如果year不想累加,可以寫成
Select year,month,area,sum(total_sale) from SaleOrder group by year, rollup(month,area)
另外Oracle 9i還支持如下語法:
Select year,month,area,sum(total_sale) from SaleOrder group by rollup((year,month),area)
3.如果使用Cube(area,month)而不是RollUp(area,month),除了獲得每個地區的合計之外,還將獲得每個月份的合計,在報表最后顯示。
4.Grouping讓合計列更好讀
RollUp在顯示廣州合計時,月份列為NULL,但更好的做法應該是顯示為"所有月份" Grouping就是用來判斷當前Column是否是一個合計列,1為yes,然后用Decode把它轉為"所有月份"
Select Decode(Grouping(area),1,'所有地區',area) area, Decode(Grouping(month),1,'所有月份',month), sum(money) From SaleOrder Group by RollUp(area,month);
2.對多級層次查詢的start with.....connect by
比如人員組織,產品類別,Oracle提供了很經典的方法
SELECT LEVEL, name, emp_id,manager_emp_id FROM employee START WITH manager_emp_id is null CONNECT BY PRIOR emp_id = manager_emp_id;
上面的語句demo了全部的應用,start with指明從哪里開始遍歷樹,如果從根開始,那么它的manager應該是Null,如果從某個職員開始,可以寫成emp_id='11'
CONNECT BY 就是指明父子關系,注意PRIOR位置
另外還有一個LEVEL列,顯示節點的層次
3.更多報表/分析決策功能
3.1 分析功能的基本結構
分析功能() over( partion子句,order by子句,窗口子句)
概念上很難講清楚,還是用例子說話比較好.
3.2 Row_Number 和 Rank, DENSE_Rank
用於選出Top 3 sales這樣的報表
當兩個業務員可能有相同業績時,就要使用Rank和Dense_Rank
比如
金額 RowNum Rank Dense_Rank
張三 4000元 1 1 1
李四 3000元 2 2 2
錢五 2000元 3 3 3
孫六 2000元 4 3 3
丁七 1000元 5 5 4
這時,應該把並列第三的錢五和孫六都選進去,所以用Ranking功能比RowNumber保險.至於Desnse還是Ranking就看具體情況了。
SELECT salesperson_id, SUM(tot_sales) sp_sales, RANK( ) OVER (ORDER BY SUM(tot_sales) DESC) sales_rank FROM orders GROUP BY salesperson_id
3.3 NTILE 把紀錄平分成甲乙丙丁四等
比如我想取得前25%的紀錄,或者把25%的紀錄當作同一個level平等對待,把另25%當作另一個Level平等對待
SELECT cust_nbr, SUM(tot_sales) cust_sales, NTILE(4) OVER (ORDER BY SUM(tot_sales) DESC) sales_quartile FROM orders GROUP BY cust_nbr ORDER BY 3,2 DESC;
NTITLE(4)把紀錄以 SUM(tot_sales)排序分成4份.
3.4 輔助分析列和Windows Function
報表除了基本事實數據外,總希望旁邊多些全年總銷量,到目前為止的累計銷量,前后三個月的平均銷量這樣的列來參考.
這種前后三個月的平均和到目前為止的累計銷量就叫windows function, 見下例
SELECT month, SUM(tot_sales) monthly_sales, SUM(SUM(tot_sales)) OVER (ORDER BY month ROWS BETWEEN UNBOUNDED PRECEDING AND CURRENT ROW) max_preceeding FROM orders GROUP BY month ORDER BY month;
SELECT month, SUM(tot_sales) monthly_sales, AVG(SUM(tot_sales)) OVER (ORDER BY month ROWS BETWEEN 1 PRECEDING AND 1 FOLLOWING) rolling_avg FROM orders GROUP BY month ORDER BY month;
Windows Function的關鍵就是Windows子句的幾個取值
1 PRECEDING 之前的一條記錄
1 FOLLOWING 之后的一條記錄
UNBOUNDED PRECEDING 之前的所有記錄
CURRENT ROW 當前紀錄
4.SubQuery總結
SubQuery天天用了,理論上總結一下.SubQuery 分三種
1.Noncorrelated 子查詢 最普通的樣式.
2.Correlated Subqueries 把父查詢的列拉到子查詢里面去,頭一回cyt教我的時候理解了半天.
3.Inline View 也被當成最普通的樣式用了.
然后Noncorrelated 子查詢又有三種情況
1.返回一行一列 where price < (select max(price) from goods )
2.返回多行一列 where price>= ALL (select price from goods where type=2)
or where NOT price< ANY(select price from goods where type=2)
最常用的IN其實就是=ANY()
3.返回多行多列 一次返回多列當然就節省了查詢時間
UPDATE monthly_orders SET (tot_orders, max_order_amt) = (SELECT COUNT(*), MAX(sale_price) FROM cust_order) DELETE FROM line_item WHERE (order_nbr, part_nbr) IN (SELECT order_nbr, part_nbr FROM cust_order c)
========================================
/*--------理解grouping sets
select a, b, c, sum( d ) from t
group by grouping sets ( a, b, c )
等效於
select * from (
select a, null, null, sum( d ) from t group by a
union all
select null, b, null, sum( d ) from t group by b
union all
select null, null, c, sum( d ) from t group by c
)
*/

 


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM