GROUP BY我們可以先從字面上來理解,GROUP表示分組,BY后面寫字段名,就表示根據哪個字段進行分組,如果有用Excel比較多的話,GROUP BY比較類似Excel里面的透視表。
GROUP BY必須得配合聚合函數來用,分組之后你可以計數(COUNT),求和(SUM),求平均數(AVG)等。
在介紹GROUP BY 和 HAVING 子句前,我們必需先講講sql語言中一種特殊的函數:聚合函數, 例如SUM, COUNT, MAX, AVG等。這些函數和其它函數的根本區別就是它們一般作用在多條記錄上。
分析:學校評選先進學生,要求平均成績大於90分的學生都有資格,並且語文課必須在95分以上,請列出有資格的學生
select SNO,avg(grade) from sc where SNO in (select SNO from sc where PNO ="YW" and grade > 90) group by SNO having avg(grade) >90
第一步是把所有是語文成績 在95分以上的編號,group by 是分組 會生產一條數據
然后根據分組,求having平均值 大於90的 having是在組里面在過濾,進行選擇組
SELECT SUM(population) FROM bbc 這里的SUM作用在所有返回記錄的population字段上,結果就是該查詢只返回一個結果,即所有 國家的總人口數。 having是分組(group by)后的篩選條件,分組后的數據組內再篩選 where則是在分組前篩選 通過使用GROUP BY 子句,可以讓SUM 和 COUNT 這些函數對屬於一組的數據起作用。 當你指定 GROUP BY region 時, 屬於同一個region(地區)的一組數據將只能返回一行值. 也就是說,表中所有除region(地區)外的字段,只能通過 SUM, COUNT等聚合函數運算后返回一個值. HAVING子句可以讓我們篩選成組后的各組數據. WHERE子句在聚合前先篩選記錄.也就是說作用在GROUP BY 子句和HAVING子句前. 而 HAVING子句在聚合后對組記錄進行篩選。 讓我們還是通過具體的實例來理解GROUP BY 和 HAVING 子句,還采用第三節介紹的bbc表。 SQL實例: 一、顯示每個地區的總人口數和總面積. 1 2 3 SELECT region, SUM(population), SUM(area) FROM bbc GROUP BY region 先以region把返回記錄分成多個組,這就是GROUP BY的字面含義。分完組后,然后用聚合函數對每組中的不同字段(一或多條記錄)作運算。 二、 顯示每個地區的總人口數和總面積.僅顯示那些面積超過1000000的地區。 1 2 3 4 5 SELECT region, SUM(population), SUM(area) FROM bbc8 F4 w2 v( P- f GROUP BY region HAVING SUM(area)>1000000# 在這里,我們不能用where來篩選超過1000000的地區,因為表中不存在這樣一條記錄。 相反,HAVING子句可以讓我們篩選成組后的各組數據 三、查詢CUSTOMER 和ORDER表中用戶的訂單數 1 select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id; 1 2 3 4 5 6 7 8 +--------+-------+ | name | count | +--------+-------+ | d | 9 | | cc | 6 | | 菩提子 | 1 | | cccccc | 2 | +--------+-------+ 增加HAVING過濾 1 select c.name, count(order_number) as count from orders o,customer c where c.id=o.customer_id group by customer_id having count(order_number)>5; 1 2 3 4 5 6 +------+-------+ | name | count | +------+-------+ | d | 9 | | cc | 6 | +------+-------+ 四、我在多舉一些例子 1 2 3 4 5 6 7 8 9 10 11 12 13 14 15 16 17 18 19 SQL> select * from sc; SNO PNO GRADE ---------- ----- ---------- 1 YW 95 1 SX 98 1 YY 90 2 YW 89 2 SX 91 2 YY 92 3 YW 85 3 SX 88 3 YY 96 4 YW 95 4 SX 89 SNO PNO GRADE ---------- ----- ---------- 4 YY 88 這個表所描述的是4個學生對應每科學習成績的記錄,其中SNO(學生號)、PNO(課程名)、GRADE(成績)。 1、顯示90分以上學生的課程名和成績 //這是一個簡單的查詢,並沒有使用分組查詢 1 SQL> select sno,pno,grade from sc where grade>=90; 1 2 3 4 5 6 7 8 9 SNO PNO GRADE ---------- ----- ---------- 1 YW 95 1 SX 98 1 YY 90 2 SX 91 2 YY 92 3 YY 96 4 YW 95 已選擇7行。 2、顯示每個學生的成績在90分以上的各有多少門 1 2 3 //進行分組顯示,並且按照where條件之后計數 SQL> select sno,count(*) from sc where grade>=90 group by sno; 1 2 3 4 5 6 SNO COUNT(*) ---------- ---------- 1 3 2 2 4 1 3 1 3、這里我們並沒有使用having語句,接下來如果我們要評選三好學生,條件是至少有兩門課程在90分以上才能有資格,列出有資格的學生號及90分以上的課程數。 1 2 3 //進行分組顯示,並且按照where條件之后計數,在根據having子句篩選分組 SQL> select sno,count(*) from sc where grade>=90 group by sno having count(*)>=2; 1 2 3 4 SNO COUNT(*) ---------- ---------- 1 3 2 2 這個結果是我們想要的,它列出了具有評選三好學生資格的學生號,跟上一個例子比較之后,發現這是在分組后進行的子查詢。 4、學校評選先進學生,要求平均成績大於90分的學生都有資格,並且語文課必須在95分以上,請列出有資格的學生 1 2 3 //實際上,這個查詢先把語文大於95分的學生號提取出來,之后求平均值,分組顯示后根據having語句選出平均成績大於90的 SQL> select sno,avg(grade) from sc where SNO IN (SELECT SNO FROM SC WHERE GRADE>=95 AND PNO='YW') group by sno having avg(grade)>=90; 1 2 3 4 SNO AVG(GRADE) ---------- ---------- 1 94.3333333 4 90.6666667 5、查詢比平均成績至少比學號是3的平均成績高的學生學號以及平均分數 1 2 3 4 5 //having子句中可進行比較和子查詢 SQL> select sno,avg(grade) from sc group by sno having avg(grade) > (select avg(grade) from sc where sno=3);