MySQL性能之count* count1 count列對(duì)比示例
正文
最近的工作中,我聽到組內(nèi)兩名研發(fā)同學(xué)在交流數(shù)據(jù)統(tǒng)計(jì)性能的時(shí)候,聊到了以下內(nèi)容:
數(shù)據(jù)統(tǒng)計(jì)你怎么能用 count(*) 統(tǒng)計(jì)數(shù)據(jù)呢,count(*) 太慢了,要是把數(shù)據(jù)庫搞垮了那不就完了么,趕緊改用 count(1),這樣比較快......
有點(diǎn)兒好奇,難道 count(1) 的性能真的就比 count(*) 要好嗎?
印象中網(wǎng)上有很多的文章都有過類似問題的討論,那 MySQL 統(tǒng)計(jì)數(shù)據(jù)總數(shù) count(*) 、count(1)和count(列名) 哪個(gè)性能更優(yōu)呢?今天我們就來聊一聊這個(gè)問題。
count() 性能與啥相關(guān)?
在討論問題之前,我們需要先搞明白一件事:MySQL 中 count() 的性能到底與什么相關(guān)呢?
一件東西,我們知道如何取,必定需要提前知道如何存放才行,那我們可以初步判定,count() 性能應(yīng)該與存儲(chǔ)引擎相關(guān)!
我們都知道,MySQL 常見的存儲(chǔ)引擎有兩種:MyISAM 和 InnoDB。
在這兩種存儲(chǔ)引擎下,MySQL 對(duì)于使用 count() 返回結(jié)果的流程是不一樣的:
- **MyISAM引擎:**每張表的總行數(shù)是存儲(chǔ)在磁盤上,所以當(dāng)執(zhí)行 count() 時(shí),是直接從磁盤拿到這個(gè)值返回,能夠快速返回。
但要是在后面加了where查詢條件時(shí),統(tǒng)計(jì)總數(shù)也沒有像想象中那么快了。
- **InnoDB 引擎:**執(zhí)行 count(),需要將數(shù)據(jù)一行一行地讀,再統(tǒng)計(jì)總數(shù)。
看到這里,可能你會(huì)有這樣的疑問:
Q:為什么 InnoDB 引擎不像 MyISAM 引擎一樣,把表總記錄存儲(chǔ)起來呢?
這個(gè)問題非常好,在回答這個(gè)問題之前,我們先來了解一下 MVCC 是個(gè)什么東東。
MVCC 簡介
所謂MVCC,全稱:Multi-Version Concurrency Control,即多版本并發(fā)控制。
MVCC 是一種并發(fā)控制的方法,一般在數(shù)據(jù)庫管理系統(tǒng)中,實(shí)現(xiàn)對(duì)數(shù)據(jù)庫的并發(fā)訪問,在編程語言中實(shí)現(xiàn)事務(wù)內(nèi)存。
MVCC 在 MySQL InnoDB 中的實(shí)現(xiàn)主要是為了提高數(shù)據(jù)庫并發(fā)性能,用更好的方式去處理讀-寫沖突,做到即使有讀寫沖突時(shí),也能做到不加鎖,非阻塞并發(fā)讀。
就是因?yàn)橐獙?shí)現(xiàn)多版本并發(fā)控制,所以才導(dǎo)致 InnoDB 引擎不能直接存儲(chǔ)表總記錄數(shù)。因?yàn)槊總€(gè)事務(wù)獲取到的一致性視圖都是不一樣的,所以返回的數(shù)據(jù)總記錄也是不一致的。
到這里,相信你已經(jīng)知道 InnoDB 引擎為什么不像 MyISAM 引擎一樣把表總記錄存儲(chǔ)起來了,簡單理解原因就是:InnoDB 支持事務(wù),MyISAM 不支持事務(wù)。
MySQL 對(duì) count() 的優(yōu)化
我們知道了count() 性能與存儲(chǔ)引擎相關(guān),那 MySQL 在執(zhí)行 count() 操作的時(shí)候有沒有對(duì)其性能做些優(yōu)化呢?
答案是肯定有的!
InnoDB 是索引組織表,主鍵索引樹的葉子節(jié)點(diǎn)是數(shù)據(jù),而普通索引樹的葉子節(jié)點(diǎn)是主鍵值。因此,普通索引樹比主鍵索引樹小很多。對(duì)于count(*)這樣的操作,遍歷哪個(gè)索引樹得到的結(jié)果邏輯上都是一樣的。因此,MySQL優(yōu)化器會(huì)找到最小的那棵樹來遍歷。
如果你使用過 show table status 命令的話,就會(huì)發(fā)現(xiàn)這個(gè)命令的輸出結(jié)果里面也有一個(gè) rows 值用于顯示這個(gè)表當(dāng)前有多少行。
相信有人肯定會(huì)問,是不是這個(gè) rows 值就能代替 count() 了嗎?
其實(shí)不能,rows 這個(gè)是從從采樣估算得來的,因此它也是不是準(zhǔn)確。
官方文檔說是在40%到50%,所以此行數(shù) rows 是不能直接使用的,如下所示:
查詢性能 PK 大起底
基于 MySQL 的 Innodb 存儲(chǔ)引擎,統(tǒng)計(jì)表的總記錄數(shù)下面這幾種做法,到底哪種效率最高?
count(主鍵id)
InnoDB引擎會(huì)遍歷整張表,把每一行的 id 值都取出來,返回給 server 層。server 層拿到 id 后,判斷是不可能為空的,就按行累加。
count(1)
會(huì)統(tǒng)計(jì)表中的所有的記錄數(shù),包含字段為 null
的記錄。
同樣遍歷整張表,但不取值,server 層對(duì)返回的每一行,放一個(gè)數(shù)字1進(jìn)去,判斷是不可能為空的,按行累加。
count(字段)
分為兩種情況,字段定義為 not null 和 null:
1)為 not null 時(shí):逐行從記錄里面讀出這個(gè)字段,判斷不為 null,累加;
2)為 null 時(shí):執(zhí)行時(shí),判斷到有可能是 null,還要把值取出來再判斷一下,不是 null 才累加。
count(*)
需要注意的是,并不是帶了 * 就把所有值取出來,而是 MySQL 做了專門的優(yōu)化,count(*) 肯定不是null,按行累加。
count(1) 和 count(*) 對(duì)比
當(dāng)表的數(shù)據(jù)量大些時(shí),對(duì)表作分析之后,使用 count(1)
還要比使用 count(*)
用時(shí)多了!
從執(zhí)行計(jì)劃來看, count(1)
和 count(*)
的效果是一樣的。但是在表做過分析之后, count(1)
會(huì)比 count(*)
的用時(shí)少些(1w以內(nèi)數(shù)據(jù)量),不過差不了多少。
如果 count(1)
是聚索引,那肯定是 count(1)
快,但是差的很小。因?yàn)?count(*)
自動(dòng)會(huì)優(yōu)化指定到那一個(gè)字段,所以沒必要去 count(1)
,用 count(*)
sql會(huì)幫你完成優(yōu)化的,因此:count(1)
和 count(*)
基本沒有差別!
總結(jié)
基于 MySQL 的 InnoDB 存儲(chǔ)引擎,統(tǒng)計(jì)表的總記錄數(shù)按照效率排序:
count(字段) < count(主鍵id) < count(1)≈count(*)
效率最高是 count(*),并不是count(1),所以建議盡量使用 count(*)。
執(zhí)行效果上:
count(*)
包括了所有的列,相當(dāng)于行數(shù),在統(tǒng)計(jì)結(jié)果的時(shí)候,不會(huì)忽略列值為null
count(1)
包括了忽略所有列,用1代表代碼行,在統(tǒng)計(jì)結(jié)果的時(shí)候,不會(huì)忽略列值為null
count(列名)
只包括列名那一列,在統(tǒng)計(jì)結(jié)果的時(shí)候,會(huì)忽略列值為空(這里的空不是只空字符串或者0,而是表示null 的計(jì)數(shù),即某個(gè)字段值為null 時(shí),不統(tǒng)計(jì)。
執(zhí)行效率上:
- 列名為主鍵,
count(列名)
會(huì)比count(1)
快 - 列名不為主鍵,
count(1)
會(huì)比count(列名)
快 - 如果表多個(gè)列并且沒有主鍵,則
count(1)
的執(zhí)行效率優(yōu)于count(*)
- 如果有主鍵,則
select count(主鍵)
的執(zhí)行效率是最優(yōu)的 - 如果表只有一個(gè)字段,則
select count(*)
最優(yōu)。
希望今天的講解對(duì)大家有所幫助,謝謝!
更多關(guān)于MySQL count性能對(duì)比的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
MySQL8下忘記密碼后重置密碼的辦法(MySQL老方法不靈了)
這篇文章主要介紹了MySQL8下忘記密碼后重置密碼的辦法,MySQL的密碼是存放在user表里面的,修改密碼其實(shí)就是修改表中記錄,重置的思路是是想辦法不用密碼進(jìn)入系統(tǒng),然后用數(shù)據(jù)庫命令修改表user中的密碼記錄2018-08-08MySQL thread_stack連接線程的優(yōu)化
當(dāng)有新的連接請(qǐng)求時(shí),MySQL首先會(huì)檢查Thread Cache中是否存在空閑連接線程,如果存在則取出來直接使用,如果沒有空閑連接線程,才創(chuàng)建新的連接線程2017-04-04解決MySQL因不能創(chuàng)建 PID 導(dǎo)致無法啟動(dòng)的方法
這篇文章主要給大家介紹了關(guān)于解決MySQL因不能創(chuàng)建 PID 導(dǎo)致無法啟動(dòng)的方法,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面跟著小編一起來學(xué)習(xí)學(xué)習(xí)吧。2017-06-06MySQL清空數(shù)據(jù)表的方法實(shí)例與分析
這篇文章給大家詳細(xì)介紹了MySQL清空數(shù)據(jù)表的方法,文中給出了實(shí)例代碼,對(duì)大家學(xué)習(xí)使用MySQL具有一定的參考借鑒價(jià)值,有需要的可以參考借鑒,下面來一起看看吧。2016-10-10MYSQL使用inner join 進(jìn)行 查詢/刪除/修改示例
本文為大家介紹下使用inner join 進(jìn)行查詢/刪除/修改,具體實(shí)現(xiàn)如下,學(xué)習(xí)mysql的朋也可以學(xué)習(xí)下,希望對(duì)大家有所幫助2013-07-07為什么說MySQL單表數(shù)據(jù)不要超過500萬行
在本篇文章里小編給大家整理了一篇關(guān)于為什么說MySQL單表數(shù)據(jù)不要超過500萬行的相關(guān)內(nèi)容,有興趣的朋友們閱讀下吧。2019-06-06