淺談MySQL 統(tǒng)計行數的 count

更新時間：2020年07月15日 15:51:54 作者：以終為始

這篇文章主要介紹了MySQL 統(tǒng)計行數的 count的相關資料，文中講解非常細致，代碼幫助大家更好的理解和學習，感興趣的朋友可以了解下

MySQL count() 函數我們并不陌生，用來統(tǒng)計每張表的行數。但如果你的表越來越大，且是 InnoDB 引擎的話，會發(fā)現計算的速度會越來越慢。在這篇文章里，會先介紹 count() 實現的原理及原因，然后是 count 不同用法的性能分析，最后給出需要頻繁改變并需要統(tǒng)計表行數的解決方案。

Count() 的實現

InnoDB 和 MyISAM 是 MySQL 常用的數據引擎，由于兩者實現的不同，導致 count() 操作計算的效率也不同。

對于 MyISAM 來說，它把每個表的總行數都存在了磁盤上，因此使用 count(*) 計算時，效率很高直接返回結果。但如果加入了 where 條件，依然會進行搜索，所以效率是不高的。

對于 InnoDB 來說，在進行 count(*) 運算時，會把數據從引擎中一行行讀出來，然后累計計數，自然表大了之后，效率就變低了。

那么，為什么 InnoDB 不能像 MyISAM 在表中記錄呢？原因就在于 InnoDB 比 MyISAM 多了支持事務的特性，同時也需要一定的取舍。由于 MVCC 的控制，使得 MySQL 具有并發(fā)的能力，也就是說對于同一時刻，InnoDB 返回的表的行數是不一定的，事務看到的行數與開啟后的一致性視圖有關，換句話說，每個事務能看到的數據版本是不一樣的，只能一行行拿出來進行判斷。

像下面的事務，假設表 t 有 10000 條數據：

Session A	Session B	Session C
select count(*) from t;
		insert into t ();
	begin;
	insert into t();
select count(*) from t;	select count(*) from t;	select count(*) from t;
10000;	結果是 10002	結果是 10001

對于 Session A 來說，Session B 未提交不可見，Session C 提交了，但是在 Session A 啟動后提交的，也不可見。所以是 10000.

而對于 Session B 而言，Session C 在啟動之前提交，自己又插入了一條，所以結果是 10002.

其實 InnoDB 在進行 count(*) 操作時，還是做了優(yōu)化的，在進行 count(*) 操作時，由于普通索引會保存主鍵的 id 值，所以會找到最小的那顆普通索引樹進行查找，而不是去遍歷主鍵索引樹。

在保證邏輯正確的前提下，減少掃描的數據量，是數據庫系統(tǒng)設計的通用法則。

另外在使用 show table status 時，也可以查詢出行數，而且速度很快，但需要注意的是，該命令是通過索引統(tǒng)計的值來采樣估算的。官方文檔說誤差可以有 40%-50%.

但如果我們真的需要實時的獲取的某個表的行數，應該怎么辦呢？

手動保存表的數量

用緩存系統(tǒng)來保存計數

對于進行更新的表，可能會想到用緩存系統(tǒng)來支持。比如 Redis 里來保存某個表總行數。

每次插入數據庫時，Redis 計數加一，相反則減一，這樣看起來讀寫操作都很快，但會存在一些問題。

緩存系統(tǒng)會丟失更新：

對于 Redis 在內存中的數據，需要定期的同步到磁盤中，但對于 Redis 異常重啟，就沒有辦法了。比如在 Redis 中插入后，Redis 重啟，數據沒有持久化到硬盤。這時可以在重啟 Redis 后，從數據庫執(zhí)行下 count(*) 操作,然后更新到 Redis 中。一次全表掃描還是可行的。

邏輯不精確：

假設一個頁面中，需要顯示一張表的行數，以及每一條數據。在實現時，可以先從 Redis 取數量，然后從數據庫里取記錄。

但可能會出現這樣的情況：