解讀SQL中GROUP BY和HAVING子句中使用NULL條件問題
SQL中GROUP BY和HAVING子句中使用NULL條件
- SQL :
SELECT COUNT(1), tid, sap_do, batch, skucode,batch FROM lt WHERE IFNULL(sap_do, '') != '' AND created_time >= 1722441600 GROUP BY tid, sap_do, skucode HAVING COUNT(1) > 1 AND batch IS NULL;
查詢結果為空;實際數(shù)據(jù)庫存在batch IS NULL的
- 修改后:
SELECT COUNT(1), tid, sap_do, skucode, batch FROM lt WHERE IFNULL(sap_do, '') != '' AND created_time >= 1722441600 GROUP BY tid, sap_do, skucode HAVING COUNT(1) > 1 AND SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0;
問題的核心在于 GROUP BY 和 HAVING 子句的工作方式,以及 NULL 的處理規(guī)則
1. HAVING batch IS NULL 沒有數(shù)據(jù)的原因
當你使用 GROUP BY 并在 HAVING 子句中直接使用 batch IS NULL,SQL 會在分組后的結果中查找 batch 的值是否為 NULL。但是由于 GROUP BY 會對所有同一組內的數(shù)據(jù)進行聚合,batch 字段可能包含 NULL 和非 NULL 的混合值。
對于 GROUP BY 而言,它不會簡單地保留 batch 字段的某一個特定值,因此如果某個分組內的 batch 值既有 NULL 又有非 NULL 的情況,batch IS NULL 這個條件會失效,因為 SQL 無法確定這一組的 batch 值究竟是 NULL 還是非 NULL。
直接使用 HAVING batch IS NULL 通常只能在整個分組的 batch 全部是 NULL 的情況下才會生效。
簡而言之,當 batch 列在分組后不全是 NULL 時,HAVING batch IS NULL 無法篩選出結果。
2. HAVING SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0 結果正確的原因
SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) 的邏輯是通過 CASE 語句來計算某個分組內 batch 列為 NULL 的記錄數(shù)。
SUM 是對整個分組內的每一條記錄進行處理,因此即使該組內存在 batch 的非 NULL 值,只要有任何一條記錄的 batch 是 NULL,SUM 就能正確計算出這一組包含 NULL 值的數(shù)量。
解釋:
- SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0:通過這個 SUM,我們計算出當前分組內有多少條記錄的 batch 為 NULL,如果結果大于 0,說明這一組內存在 NULL 值的 batch。
- HAVING batch IS NULL:只能篩選出分組后 batch 的值完全為 NULL 的情況,無法處理那些包含 NULL 和非 NULL 值的分組。
總結
HAVING batch IS NULL 只能處理整個分組中的 batch 全為 NULL 的情況,這在有混合值的分組中會導致結果為空。
HAVING SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0 可以處理分組中包含 NULL 和非 NULL 的情況,因此它能正確返回包含 NULL 值的分組。
這種 SUM(CASE WHEN…) 邏輯提供了更細粒度的控制,可以確保即使在分組中存在多個不同的 batch 值,依然可以正確識別出那些包含 NULL 的分組。
補充
如果查詢id字段的話 上面的SQL結果會發(fā)現(xiàn),id結果不是我們想要的batch為null的行ID
可改造SQL為下面 執(zhí)行:
SELECT id, tid, sap_do, skucode, batch
FROM lt
WHERE batch IS NULL
AND (tid, sap_do, skucode) IN (
SELECT tid, sap_do, skucode
FROM lt
WHERE IFNULL(sap_do, '') != ''
AND created_time >= 1725120000
GROUP BY tid, sap_do, skucode
HAVING COUNT(1) > 1
AND SUM(CASE WHEN batch IS NULL THEN 1 ELSE 0 END) > 0
);
以上為個人經驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
為什么MySQL 刪除表數(shù)據(jù) 磁盤空間還一直被占用
這篇文章主要討論為什么MySQL 刪除表數(shù)據(jù) 磁盤空間還一直被占用,項目中使用Mysql作為數(shù)據(jù)庫,對于表來說,一般為表結構和表數(shù)據(jù)。表結構占用空間都是比較小的,一般都是表數(shù)據(jù)占用的空間。接下來小編就和大家一起進入下面文章內容的學習2021-10-10
MySQL Lock wait timeout exceeded錯誤
“Lock wait timeout exceeded” 是一個常見的MySQL錯誤,指示了潛在的性能問題或死鎖,本文就來介紹一下如何解決,感興趣的可以了解一下2024-05-05
MySQL生產庫Insert了2次同樣的記錄但是主鍵ID是不一樣的問題的分析過程
這篇文章主要介紹了MySQL生產庫Insert了2次同樣的記錄但是主鍵ID是不一樣的問題的分析過程,需要的朋友可以參考下2014-02-02
MySQL數(shù)據(jù)庫中CAST與CONVERT函數(shù)實現(xiàn)類型轉換的講解
今天小編就為大家分享一篇關于MySQL數(shù)據(jù)庫中CAST與CONVERT函數(shù)實現(xiàn)類型轉換的講解,小編覺得內容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧2019-03-03

