腳本之家服務(wù)器常用軟件

快捷導(dǎo)航

MySQL中聚合函數(shù)count的使用和性能優(yōu)化技巧

更新時間：2018年06月15日 15:56:20 作者：lmy86263

這篇文章主要介紹了Windows 10，MySQL版本是5.7.12-log環(huán)境下mysql中聚合函數(shù)count的使用和性能優(yōu)化,需要的朋友可以參考下

本文的環(huán)境是Windows 10，MySQL版本是5.7.12-log

一、基本使用

count的基本作用是有兩個：

統(tǒng)計某個列的數(shù)據(jù)的數(shù)量；
統(tǒng)計結(jié)果集的行數(shù)；

用來獲取滿足條件的數(shù)據(jù)的數(shù)量。但是其中有一些與使用中印象不同的情況，比如當(dāng)count作用一列、多列、以及使用*來表達整行產(chǎn)生的效果是不同的。

示例表如下：

CREATE TABLE `NewTable` (
`id` int(11) NULL DEFAULT NULL ,
`name` varchar(30) NULL DEFAULT NULL ,
`country` varchar(50) NULL DEFAULT NULL ,
`province` varchar(30) NULL DEFAULT NULL ,
`city` varchar(30) NULL DEFAULT NULL 
)ENGINE=InnoDB

這里寫圖片描述

1.1 不計算NULL的值

如果有NULL值，在返回的結(jié)果中會被過濾掉

select count(country) from person;

返回結(jié)果如下：

這里寫圖片描述

如果滿足條件的數(shù)據(jù)項不存在，則結(jié)構(gòu)返回0，經(jīng)常通過這種方式判斷是否有滿足條件的數(shù)據(jù)存在；返回的數(shù)據(jù)類型是bigint。

1.2 對count(*)的處理

count(*)的處理是有點不同的，它會返回所有數(shù)據(jù)的數(shù)量，但是不會過濾其中的NULL值，它也并不是相當(dāng)于展開成所有的列，而是直接會忽略所有的列而直接統(tǒng)計所有的行數(shù)。語句如下：

select count(*) from person;

返回結(jié)果如下：

這里寫圖片描述

當(dāng)想要返回所有的數(shù)據(jù)的數(shù)量的時候，但是又不想包括全部是NULL的列，使用count(*)是不可能做到的，但是在1.1中說到count作用于列的時候會過濾NULL，那么直接這么寫是不是對？

select count(id, `name`, country, province, city) from person;

那就錯了，count只能作用于單列，不能作用于多列，所以上面的寫法是錯誤的。

另外針對count(*)語句，在MyISAM存儲引擎中做了優(yōu)化，每個表的數(shù)據(jù)行數(shù)都會存儲在存儲引擎中，可以很快拿到；但是在事務(wù)性的存儲引擎中，比如InnoDB中，因為會涉及到多個事務(wù)；

1.3 對count(distinct …)的處理

count(distinct …)會返回彼此不同但是非NULL的數(shù)據(jù)的行數(shù)。這一點和只使用distinct是有區(qū)別的，因為distinct是不過濾NULL值的，詳見MySQL中distinct的使用方法。

- 如果沒有符合條件的數(shù)據(jù)則返回0；
- 該語句可以作用于多列，是當(dāng)各個列之間有一個不同，就認為整行數(shù)據(jù)不同，與distinct作用于多列時效果相同；

select count(DISTINCT country) from person;

返回結(jié)果如下：

這里寫圖片描述

但是對于count(*)和count(distinct )兩者的結(jié)合，如下：

select count(DISTINCT *) from person;

該語句是錯誤的，無法執(zhí)行，因此與select count(DISTINCT *) from person 還是有區(qū)別的。

二、性能優(yōu)化

通常情況下，count(*)操作需要大量掃描數(shù)據(jù)表中的行，如果避免掃描大量的數(shù)據(jù)就成為優(yōu)化該語句的關(guān)鍵所在。針對這個問題可以從如下兩個角度考慮。

2.1 在數(shù)據(jù)庫的層次上優(yōu)化

2.1.1 針對count(*)

在MySQL內(nèi)部已經(jīng)針對count(*)進行了優(yōu)化，使用explain查詢?nèi)缦拢?/p>

EXPLAIN select count(*) from person;

這里寫圖片描述

從中可以看出該查詢沒有使用全表掃描也沒有使用索引，甚至不需要查詢數(shù)據(jù)表，在上面的示例數(shù)據(jù)庫中得知，該庫的存儲引擎是InnoDB ，而且其中既沒有主鍵也沒有索引。

2.2 針對單個列進行count

查詢?nèi)缦拢?/p>

EXPLAIN select count(country) from person where id > 2;

這里寫圖片描述

發(fā)現(xiàn)在沒有主鍵和索引的情況下，對全表進行了掃描。在數(shù)據(jù)中避免大量掃描數(shù)據(jù)行，一個最直接的方法使用索引：

當(dāng)對id設(shè)置為一般索引：INDEX abc (id) USING BTREE 。

執(zhí)行查詢?nèi)缦拢?/p>

EXPLAIN select count(country) from person where id > 2;

結(jié)果如下：

這里寫圖片描述

此時發(fā)現(xiàn)并沒有使用索引，仍然進行的是全表掃描，當(dāng)執(zhí)行如下時：

EXPLAIN select count(country) from person where id > 4;

結(jié)果如下：

這里寫圖片描述

這是使用了索引進行了范圍查詢，顯然比上面的要好。

但是問題來了，為什么有時候使用索引，有時候不用索引？在上面的第一次查詢中已經(jīng)能夠檢測出可能的key但是并沒有使用？如果有知道的大神給解讀一下！

對id設(shè)置為主鍵，執(zhí)行查詢?nèi)缦拢?/p>

EXPLAIN select count(country) from person where id > 2;

結(jié)果如下：

這里寫圖片描述

2.2 在應(yīng)用的層次上優(yōu)化

在應(yīng)用的層次上優(yōu)化，可以考慮在系統(tǒng)架構(gòu)中引入緩存子系統(tǒng)，比如在過去中常用的Memcached，或者現(xiàn)在非常流行的Redis，但是這樣會增加系統(tǒng)的復(fù)雜性。

mysql group by與聚合函數(shù)(sum,count等)實例

首先我們先來了解一下mysql聚合函數(shù)

mysql中一種特殊的函數(shù):聚合函數(shù)，SUM, COUNT, MAX, MIN, AVG等。這些函數(shù)和其它函數(shù)的根本區(qū)別就是它們一般作用在多條記錄上。例如：

SELECT SUM(score) FROM table

這個sql的意思是查詢表table里面所有score列的總和。

接著我們通過一個實例來講解group by語句中如何使用聚合函數(shù)。

book表如下：

id	first_name	last_name	city
1	Jason	Martin	Toronto
2	Alison	Mathews	Vancouver
3	James	Mathews	Vancouver
4	Celia	Rice	Vancouver
5	David	Larry	New York

現(xiàn)在我們要對city進行分組查詢，并獲取每個分組有多少條數(shù)據(jù)，我們需要count聚合函數(shù)。

SELECT *,count(*) FROM book GROUP BY city

結(jié)果為：

id	first_name	last_name	city	count(*)
1	Jason	Martin	Toronto	1
2	Alison	Mathews	Vancouver	3
5	David	Larry	New York	1

先以city把返回記錄分成多個組，這就是GROUP BY的字面含義。分完組后，然后用聚合函數(shù)對每組中的不同字段(一或多條記錄)作運算。

您可能感興趣的文章:

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

MySQL中聚合函數(shù)count的使用和性能優(yōu)化技巧

相關(guān)文章

最新評論

大家感興趣的內(nèi)容

最近更新的內(nèi)容

常用在線小工具