詳解MySQL中count函數的正確使用方法

本文轉載自查看原文 2021-06-15 16:09 361 學習心得記錄

詳解MySQL中count函數的正確使用方法。

1. 描述

在MySQL中，當我們需要獲取某張表中的總行數時，一般會選擇使用下面的語句

select count(*) from table;

其實count函數中除了*還可以放其他參數，比如常數、主鍵id、字段，那么它們有什么區別？各自效率如何？我們應該使用哪種方式來獲取表的行數呢？

當搞清楚count函數的運行原理后，相信上面幾個問題的答案就會了然於胸。

2. 表結構

為了解決上述的問題，我創建了一張 user 表，它有兩個字段：主鍵id和name，后者可以為null，建表語句如下。

CREATE TABLE `user` (
 `id` int(11) NOT NULL AUTO_INCREMENT COMMENT '主鍵',
 `name` varchar(255) DEFAULT NULL COMMENT '姓名',
 PRIMARY KEY (`id`)
) ENGINE=InnoDB DEFAULT CHARSET=utf8;

在該表中共有6000000條數據，前1000000條數據行的name字段為空，其余數據行name=id，使用存儲過程造測試數據的代碼如下

-- 使用存儲過程造測試數據
delimiter;;
create procedure idata()
begin 
 declare i int; 
 set i=1; 
 while(i<=6000000)do 
  insert into user values(i, i);
  set i=i+1; 
 end while;
end;;
delimiter;
call idata();
-- 將前1000000條數據的name字段置為null
update user set name=null where id<1000000;

3. 執行 SQL 語句及結果

為了區分count函數不同參數的區別，主要從執行時間和掃描行數這兩方面來描述SQL的執行效率，同時還會從返回結果來描述`count函數的特性。

*符號 —— select count(*) from user;
常數—— select count(1) from user;
非空字段—— select count(id) from user;
可為空的字段—— select count(name) from user;

3.1 *符號

mysql> select count(*) from user;
+----------+
| count(*) |
+----------+
| 6000000 |
+----------+
1 row in set (0.76 sec)

遍歷全表，不取值（優化后，必定不是null，不取值），累加計數，最終返回結果。

3.2 常數

mysql> select count(1) from user;
+----------+
| count(1) |
+----------+
| 6000000 |
+----------+
1 row in set (0.76 sec)

遍歷全表，一行行取數據，將每一行賦值為1，判斷到該字段不可為空，累加計數，最終返回結果。

3.3 非空字段

mysql> select count(id) from user;
+-----------+
| count(id) |
+-----------+
|  6000000 |
+-----------+
1 row in set (0.85 sec)

遍歷全表，一行行取數據（會選擇最小的索引樹來遍歷，所以比相同情況下的count字段效率更高），取每行的主鍵id，判斷到該字段不可為空，累加計數，最終返回結果。

3.4 可為空的字段

mysql> select count(name) from user;
+-------------+
| count(name) |
+-------------+
|   5900001 |
+-------------+
1 row in set (0.93 sec)

若字段定義不為空：遍歷全表，一行行取數據，取每行的該字段，判斷到該字段不可為空，累加計數，最終返回結果。
若字段定義可為空：遍歷全表，一行行取數據，取每行的該字段，判斷到該字段可能是null，然后再判斷該字段的值是否為null，不為null才累加計數，最終返回結果。
若該字段沒有索引，將遍歷主鍵索引樹。

4. 執行結果分析

4.1 結果集

首先從結果集的角度來看，前三條 SQL 語句的目的是一樣的——返回的是所有行數，而 count 函數的參數是普通字段且字段默認為 null 的時候，它返回的是該字段不為 null 的行數。

4.2 執行時間

從執行時間上來看的話，效率大致是count(可為空的字段) < count(非空字段) < count(常數) < count(*)。

5. 總結

count是一個聚合函數，對於返回的結果集，一行行地判斷，如果count函數的參數不是NULL，累計值就加1，否則不加。最后返回累計值。

count(*)速度最快的原因是它不會在計數的時候去取每行數據值
count(1)比count(*)稍慢的原因是它會取每個數據行並賦值為1
count(非空字段)比count(1)稍慢的原因是它會從每個數據行中取出主鍵 id
count(可為空的字段)最慢的原因是它可能需要判斷每個數據行中的改字段是否為 null

所以，最好還是用count(*)。

免責聲明！

本站轉載的文章為個人學習借鑒使用，本站對版權不負任何法律責任。如果侵犯了您的隱私權益，請聯系本站郵箱yoyou2525@163.com刪除。

猜您在找 MySQL中count函數使用方法詳解 Mysql中Count函數的正確使用 count加表達式，Mysql中Count函數的正確使用！ MATLAB中fft函數的正確使用方法詳解MySQL中LIMIT的使用方法 mysql 聚集函數 count 使用詳解 mysql count()函數使用表達式的正確用法 MySQL字符串函數 locate() 使用方法詳解 mysql字符串函數：locate（）使用方法詳解關於mysql中的count()函數