group by 和聚合函數

本文轉載自查看原文 2015-09-07 14:12 5336 關系型數據庫

group by 的基本用法

　　group by做為分組來使用，后面為條件，可以有多個條件，條件相同的為一組，配合聚合函數進行相關統計。在不同數據庫中用法稍有不同，這里只測試mysql和oracle。

1.准備好一張數據表：

mysql oracle

2.首先以name為分組條件：

1 SELECT * FROM person 
2 GROUP BY `name`;

在mysql中執行結果如下：

分析：

　　在mysql中沒有強調select指定的字段必須屬於group by后的條件。若符合條件的字段有多個，則只顯示第一次出現的字段。比如：以name為dd分組，id為1,2,3,4,5，但只顯示1.同理，age也只顯示1.

然后，雖然這種查詢在語法上通過了，但結果並沒有什么意義，因為其他字段並非需要的准確值。這在oracle中就行不通了。

在oracle中執行結果如下：

分析：

　　oracle指出，select查詢字段未包含在group by 的條件中。推測，首先通過select * from person可以看到oracle中id並不是升序，或者說沒有默認升序。也就是查詢的結果是不確定的，hash?這可能涉及到在磁盤的存儲等等，這里不去深究。因此，並不能確認第一次查出來的字段的值，而且分組后不是條件的值被合並后沒有意義。

結論：

　　group by語句中select指定的字段必須是“分組依據字段”。

因此，只能這樣查詢：

SELECT name FROM person 
GROUP BY name;

結果一致：。

3.以name,age為查詢依據，多條件分組

1 SELECT name,age FROM person 
2 GROUP BY name,age;

結果：

　　　　mysql oracle

顯然，兩組的查詢策略是不同的。但最終結果是相同的。都是以條件組合的笛卡爾積。也就是每個條件都一一對應。

分組依據為多條件組合成一個條件，當組合條件相同時為一組。因此，dd:1和dd:2分為兩組。

4.添加聚合函數

聚合函數有如下幾種：

函數	作用	支持性
sum(列名)	求和
max(列名)	最大值
min(列名)	最小值
avg(列名)	平均值
first(列名)	第一條記錄	僅Access支持
last(列名)	最后一條記錄	僅Access支持
count(列名)	統計記錄數	注意和count(*)的區別

首先，要明白聚合函數的用法。比如，count(列字段值),統計該字段值出現的次數：

1 SELECT name,COUNT(*) 
2 from person
3 GROUP BY name;

結果為：。

分析：

　　首先進行分組工作，group by name,這時8條數據被分成兩組：dd和mm；然后count的作用就是統計每組里面的個數，分別是5和3.

更直觀的例子：

SELECT * FROM person;

1 SELECT count(name) from person;

，count(name)為統計所有的name數量，同樣的結果為count(1),count(*).

5.where 和 having

where 子句的作用是在對查詢結果進行分組前，將不符合where條件的行去掉，即在分組之前過濾數據，where條件中不能包含聚組函數，使用where條件過濾出特定的行。
having 子句的作用是篩選滿足條件的組，即在分組之后過濾數據，條件中經常包含聚組函數，使用having 條件過濾出特定的組，也可以使用多個分組標准進行分組。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 group by 和聚合函數 group by 和聚合函數使用 group by 和聚合函數的使用 group by和聚合函數關於GROUP BY和聚合函數可以這樣去理解group by和聚合函數 Spark：group by和聚合函數使用 hive group by聚合函數增強 sql group by和聚合函數的用法 SQL中Group by和聚合函數