count()聚合函數正確用法


count()聚合計算

  count()是聚合函數,對於返回的結果集,一行行地判斷,累計值加1,最后返回累計值,count(*)、count(主鍵ID)和count(1)表示返回滿足條件的結果集的總行數。

count()聚合函數統計非NULL與NULL值的區別:

  1、count(字段)不統計NULL記錄,即表示滿足條件的數據行里參數字段不為NULL的行

  2、count(1)和count(*)會記錄NULL值

count(主鍵ID)、count(字段)、count(1)、count(*)的區別和性能差異(分析性能差別的原則)
  1、server層要什么就給什么 
  2、InnoDB只給必要的值
  3、現在的優化器對count(*)的取行數做了優化,其他沒有做優化
 
count(主鍵ID)比count(1)慢的原因
  對於 count(主鍵 ID) 來說,InnoDB 引擎會遍歷主鍵索引樹,把每一行的ID值取出來,返回給server層,server層拿到ID后,判斷是不可能為空的,按行累加加1,最后返回累計值。
  對於count(1),InnoDB引擎會掃描主鍵索引樹,但不取值,server層對於返回的每一行,按行累計加1,判斷不可能為NULL,返回累計值。
  從InnoDB引擎層返回ID會涉及到解析數據行、拷貝字段值的操作,因此count(主鍵 ID)執行要比count(1)執行慢。
 
count(字段)
  1、如果這個字段定義為not null的話,一行行地從記錄里面讀出這個字段,判斷不能為null,按行累計加1
  2、如果這個字段定義允許為null,一行行地從記錄里面讀出這個字段,執行的時候還要判斷是否為null,不為null的按行累計加1,返回累加值
  
count(主鍵id)走主鍵索引的時候效率較count(*)差的原因?
  平時我們檢索一列的時候,基本上等值或范圍查詢,那么索引基數大的索引必然效率很高(符合走主鍵索引查找速度最快的原則)。
  但是在做count(*)的時候並沒有檢索具體的一行或者一個范圍,那么選擇基數小的索引對count操作效率會更高。在做count操作的時候,mysql會遍歷每個葉子節點,所以基數越小,效率越高。mysql非聚簇索引葉子節點保存指向主鍵ID的指針,所以需要檢索兩遍索引。但是這里相對於遍歷主鍵索引,即使檢索兩遍索引效率也比單純的檢索主鍵索引快。
  Innodb是索引組織表,主鍵索引樹的葉子節點是數據,而普通索引樹的葉子節點是主鍵值,索引普通索引樹小很多,索引長度越小樹的大小就越小。
 
MyISAM與InnoDB,正如在不同的存儲引擎中,count(*)函數的執行是不同的
  在MyISAM存儲引擎中,count()函數是直接讀取數據表保存的行記錄數並返回,效率很高,但是如果添加了where條件的話,MyISAM表也不能返回得很快。
  在InnoDB存儲引擎中,count(*)函數是先從內存中讀取表中的數據到內存緩沖區,然后掃描全表獲得行記錄數。在使用count函數中加上where條件時,在兩個存儲引擎中的效果是一樣的,都會掃描全表計算某字段有值項的次數。
count(*)中關於select count(*) from tab_name幾種不走索引和走那種索引情景分析
CREATE TABLE `t1` (
  `c1` varchar(30) NOT NULL,
  `c2` varchar(20) NOT NULL,
  `c3` varchar(40) NOT NULL,
  `c4` varchar(10) DEFAULT NULL)
ENGINE=InnoDB DEFAULT CHARSET=utf8 COMMENT='ceshi_count'
1、表中沒有任何索引(表也沒有主鍵)
mysql> explain select count(*) from t1;
+----+-------------+-------+------+---------------+------+---------+------+------+-------+
| id | select_type | table | type | possible_keys | key  | key_len | ref  | rows | Extra |
+----+-------------+-------+------+---------------+------+---------+------+------+-------+
|  1 | SIMPLE      | t1    | ALL  | NULL          | NULL | NULL    | NULL |    1 | NULL  |
+----+-------------+-------+------+---------------+------+---------+------+------+-------+
1 row in set (0.01 sec)
2、表有主鍵則執行主鍵索引全掃描
mysql> alter table t1 add primary key (c1);
Query OK, 0 rows affected (0.16 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> explain select count(*) from t1;
+----+-------------+-------+-------+---------------+---------+---------+------+------+-------------+
| id | select_type | table | type  | possible_keys | key    | key_len | ref  | rows | Extra      |
+----+-------------+-------+-------+---------------+---------+---------+------+------+-------------+
|  1 | SIMPLE      | t1    | index | NULL          | PRIMARY | 92      | NULL |    1 | Using index |
+----+-------------+-------+-------+---------------+---------+---------+------+------+-------------+
1 row in set (0.00 sec)
3、表有二級索引,則使用二級索引key_len最小的索引進行掃描,盡管這個二級索引的key_len的值大於主鍵,都使用二級索引
mysql> alter table t1 add index idx_c3(c3);
Query OK, 0 rows affected (0.04 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> explain select count(*) from t1;
+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+
| id | select_type | table | type  | possible_keys | key    | key_len | ref  | rows | Extra       |
+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+
|  1 | SIMPLE      | t1    | index | NULL          | idx_c3 | 122     | NULL |    1 | Using index |
+----+-------------+-------+-------+---------------+--------+---------+------+------+-------------+
1 row in set (0.00 sec)

4、表有多個二級索引,則使用key_len小的二級索引進行掃描

mysql> alter table t1 add index idx_t1_c4(c4);
Query OK, 0 rows affected (0.03 sec)
Records: 0  Duplicates: 0  Warnings: 0

mysql> explain select count(*) from t1;
+----+-------------+-------+-------+---------------+-----------+---------+------+------+-------------+
| id | select_type | table | type  | possible_keys | key      | key_len | ref  | rows | Extra      |
+----+-------------+-------+-------+---------------+-----------+---------+------+------+-------------+
|  1 | SIMPLE      | t1    | index | NULL          | idx_t1_c4 | 33      | NULL |    1 | Using index |
+----+-------------+-------+-------+---------------+-----------+---------+------+------+-------------+
1 row in set (0.00 sec)
取表行數的幾種方式
  1、count(*)取行數
  2、通過infomation_schema可以快速拿到表的count值,但不是一個准確的值,通過show table status like 'tab_name'查找到的table rows是通過采樣方式得到行數,它的誤差率達到了40到50%,
  3、MyISAM會存儲具體的行數(可能因為myISAM事務要加表鎖,才這樣設計),InnoDB則需要進行全表掃描


免責聲明!

本站轉載的文章為個人學習借鑒使用,本站對版權不負任何法律責任。如果侵犯了您的隱私權益,請聯系本站郵箱yoyou2525@163.com刪除。



 
粵ICP備18138465號   © 2018-2025 CODEPRJ.COM