Mysql按條件計數(shù)多種實現(xiàn)方法詳解
最近在給某網(wǎng)站的后臺添加一系列的統(tǒng)計功能,遇到很多需要按條件計數(shù)的情況。嘗試了幾種方法,下面簡要記錄,供大家參考。
問題描述
為使討論簡單易懂,我將問題稍作簡化,去掉諸多的背景。
從前有一個皇帝,他有50個妃子,這些妃子很沒有天理的給他生了100,000個兒子,于是,皇帝很苦惱,海量的兒子很難管理,而且,他想知道每個妃子給他生了多少個兒子,從而論功行賞,這很難辦。于是,皇帝請了一個程序員幫他編了一個程序,用數(shù)據(jù)庫來存儲所有的兒子的信息,這樣就可以用程序來統(tǒng)計和管理啦。
數(shù)據(jù)庫的結(jié)構(gòu)如下:
id | 皇子的唯一編號 |
---|---|
mother | 皇子母親的唯一編號 |
皇帝把妃子分成了兩個等級,天宮娘娘(編號小于25)和地宮娘娘(編號大于等于25),他想知道天宮娘娘們和地宮娘娘們的生育能力孰強孰弱。于是,程序員開始寫SQL Query了。
方法1:使用GROUP BY
SQL Query
SELECT COUNT(*) FROM `prince` GROUP BY `mother` > 24;
執(zhí)行結(jié)果
count(*)
50029
49971
在100,000行數(shù)據(jù)上的運行時間:0.0335 秒
分析
這種GROUP BY方法的最大問題在于:無法區(qū)分所得到的結(jié)果。這兩個數(shù)字哪一個是天宮娘娘們所生的皇子數(shù),哪一個是地宮娘娘們所生的皇子數(shù)呢?不知道。所以,盡管它統(tǒng)計出了總數(shù),但是沒有什么意義。
因此,為了區(qū)分統(tǒng)計結(jié)果,必須要把條件 mother > 24 也作為一個字段在結(jié)果集中作為一個字段體現(xiàn)出來,修改后的sql如下:
SELECT COUNT(*) AS `number`, `mother` > 24 AS `type` FROM `prince` GROUP BY `mother` > 24;
執(zhí)行結(jié)果
number type
50029 0
49971 1
條件表達式作為字段時,該字段的值就是該條件表達式的值,因此,對應(yīng)我們的例子,type = 1 也就是表示 mother > 24 的值為1,因此,第二行中的數(shù)字代表地宮娘娘們所生的皇子數(shù)。
經(jīng)過修改后,我們看出,天宮娘娘們略勝一籌。
優(yōu)缺點
缺點是顯而易見的,由于使用了條件表達式作為分組依據(jù),它只能做二元的劃分,對于要分成多類進行統(tǒng)計的情況不能夠勝任。比如要分別統(tǒng)計1~10號、11~24號,25號~50號妃子的產(chǎn)子數(shù),就無法實現(xiàn)了。
另外,由于使用了GROUP BY,因此涉及到排序,執(zhí)行時間上要更長。
我暫時沒有發(fā)現(xiàn)這種方法的優(yōu)點。
方法2:使用嵌套的SELECT
使用嵌套的SELECT也可以達到目的,在每個SELECT子句中統(tǒng)計一個條件下的數(shù)據(jù),然后用一個主SELECT把這些統(tǒng)計數(shù)據(jù)整合起來。
SQL Query
SELECT ( SELECT COUNT( * ) FROM `prince` WHERE `mother` >24 ) AS `digong`, ( SELECT COUNT( * ) FROM `prince` WHERE `mother` <=24 ) AS `tiangong`
執(zhí)行結(jié)果
digong tiangong
49971 50029
在100,000行數(shù)據(jù)上的運行時間:0.0216 秒
分析
這種嵌套SELECT的方法非常直觀,就是分別統(tǒng)計各個條件下的數(shù)值,最后進行匯總,通俗易懂,跟自然語言沒啥區(qū)別了。
優(yōu)缺點
優(yōu)點就是直觀,而且速度也比GROUP BY要快。雖然是3條SELECT語句,看起來比GROUP BY的方案多了2條語句,但是它不涉及到排序,這就節(jié)省了很多時間。
缺點可能就是語句稍多,對語句數(shù)量有潔癖的同學(xué)可能會比較不舒服。
方法3:使用CASE WHEN
CASE WHEN語句的功能很強大,可以定義靈活的查詢條件,很適合進行分類統(tǒng)計。
SQL Query
SELECT COUNT( CASE WHEN `mother` >24 THEN 1 ELSE NULL END ) AS `digong`, COUNT( CASE WHEN `mother` <=24 THEN 1 ELSE NULL END ) AS `tiangong` FROM prince
執(zhí)行結(jié)果
digong tiangong
49971 50029
在100,000行數(shù)據(jù)上的運行時間:0.02365825 秒
分析
此方法的關(guān)鍵在于
COUNT( CASE WHEN `mother` >24 THEN 1 ELSE NULL END )
這里的COUNT和CASE WHEN聯(lián)合使用,做到了分類計數(shù)。先使用CASE WHEN,當(dāng)滿足條件時,將字段值設(shè)置為 1, 不滿足條件時,將字段值設(shè)置為NULL,接著COUNT函數(shù)僅對非NULL字段進行計數(shù),于是,問題解決。
優(yōu)缺點
優(yōu)點嘛,此方法也不涉及到排序,因此運行時間上與方法2相當(dāng),SELECT語句減少到了 1 條。
缺點就是語句比較長,對語句長度有潔癖的同學(xué)可能會比較不舒服。
總結(jié)
對于確定分類的按條件計數(shù),可以盡量不用GROUP BY,從而避免排序動作,加速Q(mào)uery的執(zhí)行。
如果需要根據(jù)某個字段的值進行分類,而該字段的值是可變的,比如皇帝要統(tǒng)計每一個妃子的產(chǎn)子數(shù),而他可能不停的再娶很多妃子,這種情況下,使用方法2和方法3就不太靈光了,還是使用一個GROUP BY來得簡單便捷。
以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
詳解 Mysql查詢結(jié)果順序按 in() 中ID 的順序排列
這篇文章主要介紹了詳解 Mysql查詢結(jié)果順序按 in() 中ID 的順序排列的相關(guān)資料,希望通過本文能幫助到大家,需要的朋友可以參考下2017-09-09MySQL優(yōu)化之對RAND()的優(yōu)化方法
這篇文章主要介紹了MySQL優(yōu)化之對RAND()的優(yōu)化方法,本文詳細分析了Mysql中對RAND()的幾種優(yōu)化方法,并最終得出一個結(jié)論,需要的朋友可以參考下2014-07-07linux 安裝 mysql 8.0.19 詳細步驟及問題解決方法
這篇文章主要介紹了linux 安裝 mysql 8.0.19 詳細步驟,本文給大家列出了常見問題及解決方法,通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友可以參考下2020-02-02MySql下關(guān)于時間范圍的between查詢方式
這篇文章主要介紹了MySql下關(guān)于時間范圍的between查詢方式,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2023-07-07CentOS下php使用127.0.0.1不能連接mysql的解決方法
這篇文章主要介紹了CentOS下php使用127.0.0.1不能連接mysql的解決方法,本文原因是SELINUX導(dǎo)致的連接失敗,需要的朋友可以參考下2015-01-01