聊聊MySQL的COUNT(*)的性能
前言
基本職場上的程序員用來統(tǒng)計數(shù)據(jù)庫表的行數(shù)都會使用count(*),count(1)或者count(主鍵),那么它們之間的區(qū)別和性能你又是否了解呢?
其實程序員在開發(fā)的過程中,在一張大表上統(tǒng)計總行數(shù)是非常耗時的一個操作,那么我們應(yīng)該用哪個方法統(tǒng)計會更快呢?
接下來我們就來聊一聊MySQL中統(tǒng)計總行數(shù)的方法和性能。
count(*),count(1),count(主鍵)哪個更快?
1、建表并且插入1000萬條數(shù)據(jù)進行實驗測試:
# 創(chuàng)建測試表 CREATE TABLE `t6` ( `id` int(11) NOT NULL AUTO_INCREMENT, `name` varchar(50) NOT NULL, `status` tinyint(4) NOT NULL, PRIMARY KEY (`id`), KEY `idx_status` (`status`) ) ENGINE=InnoDB DEFAULT CHARSET=utf8; # 創(chuàng)建存儲過程插入1000w數(shù)據(jù) CREATE PROCEDURE insert_1000w() BEGIN DECLARE i INT; SET i=1; WHILE i<=10000000 DO INSERT INTO t6(name,status) VALUES('god-jiang-666',1); SET i=i+1; END WHILE; END; #調(diào)用存儲過程,插入1000萬行數(shù)據(jù) call insert_1000w();
2、分析實驗結(jié)果
# 花了0.572秒 select count(*) from t6;
# 花了0.572秒 select count(1) from t6;
# 花了0.580秒 select count(id) from t6;
# 花了0.620秒 select count(*) from t6 force index (primary);
從上面的實驗我們可以得出,count(*)和count(1)是最快的,其次是count(id),最慢的是count使用了強制主鍵的情況。
下面我們繼續(xù)測試一下它們各自的執(zhí)行計劃:
explain select count(*) from t6; show warnings;
explain select count(1) from t6; show warnings;
explain select count(id) from t6; show warnings;
explain select count(*) from t6 force index (primary); show warnings;
從上面的實驗可以得出這三點:
- count(*)被MySQL查詢優(yōu)化器改寫成了count(0),并選擇了idx_status索引
- count(1)和count(id)都選擇了idx_statux索引
- 加了force index(primary)之后,走了強制索引
這個idx_status就是相當(dāng)于是二級輔助索引樹,目的就是為了說明: InnoDB在處理count(*)的時候,有輔助索引樹的情況下,會優(yōu)先選擇輔助索引樹來統(tǒng)計總行數(shù)。
為了驗證count(*)會優(yōu)先選擇輔助索引樹這個結(jié)論,我們繼續(xù)來看看下面的實驗:
# 刪除idx_status索引,繼續(xù)執(zhí)行count(*) alter table t6 drop index idx_status; explain select count(*) from t6;
從以上實驗可以得出,刪除了idx_status這個輔助索引樹,count(*)就會選擇走主鍵索引。所以結(jié)論:count(*)會優(yōu)先選擇輔助索引,假如沒有輔助索引的存在,就會走主鍵索引。
為什么count(*)會優(yōu)先選擇輔助索引?
在MySQL5.7.18之前,InnoDB通過掃描聚集索引來處理count(*)語句。
從MySQL5.7.18開始,InnoDB通過遍歷最小的可用二級索引來處理count(*)語句。如果不存在二級索引,則掃描聚集索引。
新版本為何會使用二級索引來處理count(*)呢?
因為InnoDB二級索引樹的葉子節(jié)點上存放的是主鍵,而主鍵索引樹的葉子節(jié)點存放的是整行數(shù)據(jù),所以二級索引樹比主鍵索引樹小。因此查詢優(yōu)化器基于成本考慮,優(yōu)先選擇的是二級索引。所以索引count(*)快于count(主鍵)。
總結(jié)
這篇文章的結(jié)論就是count(*)=count(1)>count(id)。
為什么count(id)走了主鍵索引還會更慢呢?因為count(id)需要取出主鍵,然后判斷不為空,再累加,代價更高。
count(*)是會總計出所有NOT NULL和NULL的字段,而count(id)是不會統(tǒng)計NULL字段的,所以我們在建表的盡量使用NOT NULL并且給它一個默認是空即可。
最后,在以后總計數(shù)據(jù)庫表的總行數(shù)的時候,可以大膽的使用count(*)或者count(1)。
參考資料
- 《高性能MySQL》(第三版)第六章優(yōu)化COUNT()查詢
- 《MySQL實戰(zhàn)45講》林曉斌
到此這篇關(guān)于聊聊MySQL的COUNT(*)的性能的文章就介紹到這了,更多相關(guān)MySQL COUNT(*)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Mysql中count(*)、count(1)、count(主鍵id)與count(字段)的區(qū)別
- MySQL中count(*)執(zhí)行慢的解決方案
- 一文搞清楚MySQL count(*)、count(1)、count(col)區(qū)別
- MySQL?中的count(*)?與?count(1)?誰更快一些?
- MySQL count(1)、count(*)、count(字段)的區(qū)別
- MySQL中count(*)、count(1)和count(col)的區(qū)別匯總
- MySQL中distinct和count(*)的使用方法比較
- MYSQL中統(tǒng)計查詢結(jié)果總行數(shù)的便捷方法省去count(*)
- 關(guān)于mysql innodb count(*)速度慢的解決辦法
- MySQL COUNT(*)性能原理詳解
相關(guān)文章
MySQL使用IF語句及用case語句對條件并結(jié)果進行判斷?
這篇文章主要介紹了MySQL使用IF語句及用case語句對條件并結(jié)果進行判斷,文章通過圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下2022-09-09Mysql刪除重復(fù)數(shù)據(jù)通用SQL的兩種方法
本文主要介紹了Mysql刪除重復(fù)數(shù)據(jù)通用SQL的兩種方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-08-08深入分析mysql為什么不推薦使用uuid或者雪花id作為主鍵
這篇文章主要介紹了深入分析mysql為什么不推薦使用uuid或者雪花id作為主鍵,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-09-09