欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Mysql分組查詢每組最新的一條數(shù)據(jù)的五種實現(xiàn)方法

 更新時間:2024年08月04日 09:32:10   作者:kerwin_code  
在寫報表功能時遇到一個需要根據(jù)用戶id分組查詢最新一條錢包明細數(shù)據(jù)的需求,本文主要介紹了Mysql分組查詢每組最新的一條數(shù)據(jù)的五種實現(xiàn)方法,感興趣的可以了解一下

前言

在寫報表功能時遇到一個需要根據(jù)用戶id分組查詢最新一條錢包明細數(shù)據(jù)的需求,在寫sql測試時遇到一個有趣的問題,開始使用子查詢根據(jù)時間倒序+group by customer_id發(fā)現(xiàn)查詢出來的數(shù)據(jù)一直都是最舊的一條,而不是我需要的最新一條數(shù)據(jù)我明明已經倒序排了,后來總結出了五種解決方案如下。

注意事項

數(shù)據(jù)庫版本 Mysql5.7+

執(zhí)行 GROUP BY 語句的時候出現(xiàn) sql_mode=only_full_group_by 解決方法(這里是Mysql8的解決方案,Mysql5.7也差不多,具體實現(xiàn)可以查看 解決MySQL-this is incompatible with sql_mode=only_full_group_by 問題

1、執(zhí)行 select @@sql_mode; 查看sql模式

select @@sql_mode;

在這里插入圖片描述

2、將sql_mode中的only_full_group_by模式剔除 重新設置sql_mode值,如果是使用JDBC連接需要重啟項目才能生效。

set global sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION';
set session sql_mode='STRICT_TRANS_TABLES,NO_ZERO_IN_DATE,NO_ZERO_DATE,ERROR_FOR_DIVISION_BY_ZERO,NO_ENGINE_SUBSTITUTION';

準備SQL

這里模擬一個sql

DROP TABLE IF EXISTS `customer_wallet_detail`;
CREATE TABLE `customer_wallet_detail`  (
  `id` bigint(20) NOT NULL AUTO_INCREMENT,
  `customer_id` bigint(20) NULL DEFAULT NULL COMMENT '用戶ID',
  `happen_amount` varchar(15)  NULL DEFAULT '0' COMMENT '發(fā)生金額 帶-號的代表扣款',
  `balance_amount` varchar(15) NULL DEFAULT '0' COMMENT '可用余額',
  `create_time` bigint(20) NULL DEFAULT NULL COMMENT '發(fā)生時間',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE = InnoDB COMMENT = '用戶錢包明細';

INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (1, 1, '100', '100', 1670300656630);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (2, 1, '-10', '90', 1670300656640);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (3, 1, '5', '95', 1670300656650);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (4, 3, '998', '998', 1670300656660);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (5, 3, '-100', '898', 1670300656670);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (6, 3, '-98', '800', 1670300656680);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (7, 2, '666', '666', 1670300656690);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (8, 2, '-66', '600', 1670300656695);
INSERT INTO `customer_wallet_detail`(`id`, `customer_id`, `happen_amount`, `balance_amount`, `create_time`) VALUES (9, 2, '-600', '0', 1670300656699);

在這里插入圖片描述

錯誤查詢

SELECT
	* 
FROM
	( SELECT * FROM customer_wallet_detail ORDER BY create_time DESC ) t1 
GROUP BY
	t1.customer_id;

在這里插入圖片描述

錯誤原因

在mysql5.7以及之后的版本,如果GROUP BY的子查詢中包含ORDER BY,但是 GROUP BY 不與 LIMIT 配合使用,ORDER BY會被忽略掉,所以子查詢在 GROUP BY 時排序不會生效,可能是因為子查詢大多數(shù)是作為一個結果給主查詢使用,所以子查詢不需要排序。

方法一

鑒于以上的原因我們可以添加上 LIMIT 條件來實現(xiàn)功能。
PS:這個LIMIT的數(shù)量可以先自行 COUNT 出你要遍歷的數(shù)據(jù)條數(shù)(這個數(shù)據(jù)條數(shù)是所有滿足查詢條件的數(shù)據(jù)合,我這里共9條數(shù)據(jù))

SELECT
	* 
FROM
	( SELECT * FROM customer_wallet_detail ORDER BY create_time DESC LIMIT 9 ) t1 
GROUP BY
	t1.customer_id;

在這里插入圖片描述

方法二(適用于自增ID和創(chuàng)建時間排序一致)

方法一需要先 COUNT 查詢然后將查詢結果設置到 LIMIT 條件中比較麻煩,這里還可以使用 MAX() 函數(shù)來實現(xiàn)該功能。
PS:因為我這里的業(yè)務數(shù)據(jù)是有序插入的,使用主鍵自增id和create_time結果是一樣的而且使用id查詢效率更高,如果沒有唯一且有序的id可以替代create_time那么就用方案一,不能直接使用 SELECT id,MAX(create_time) 這種操作來獲取最新一條數(shù)據(jù)id,原因在總結中有詳細描述。

SELECT
	*
FROM
	customer_wallet_detail 
WHERE
	id IN ( SELECT MAX( id ) FROM customer_wallet_detail GROUP BY customer_id ) 
ORDER BY
	customer_id;

在這里插入圖片描述

方法三(適用于自增ID和創(chuàng)建時間排序一致,查詢性能最優(yōu))

方法三和方法二實現(xiàn)邏輯基本一致只是將IN查詢替換成了連接查詢,本地20w條數(shù)據(jù)測試 方法三比方法二性能提升50%,有興趣的可以增大數(shù)據(jù)集測試后續(xù)性能變化。

SELECT
	t1.* 
FROM
	customer_wallet_detail t1
	INNER JOIN ( SELECT MAX( id ) AS id FROM customer_wallet_detail GROUP BY customer_id ) t2 ON t1.id = t2.id

在這里插入圖片描述

方法四(通過DISTINCT關鍵字打破MySQL語句優(yōu)化使排序生效)

方法四實現(xiàn)起來比較簡單,數(shù)據(jù)量小的時候查詢性能也挺不錯的,數(shù)據(jù)量大了之后查詢性能也還可以,我本地測試了100w數(shù)據(jù)的查詢,這個方法耗時0.9s左右,減少DISTINCT的字段能降到0.4s左右,不給customer_id字段加索引的情況下通過方法三查詢耗時0.35s,加了索引耗時0.035s,有興趣可以分析一下方法三和方法四的執(zhí)行計劃。

SELECT
	* 
FROM
	( SELECT DISTINCT * FROM `customer_wallet_detail` ORDER BY id DESC ) AS t1 
GROUP BY
	t1.customer_id;

在這里插入圖片描述

方法五(以創(chuàng)建時間為基準獲取每個用戶最新的一條數(shù)據(jù),必須要添加對應字段的索引 最好是覆蓋索引)

有朋友在評論區(qū)提供了第四種方法,這種方法在表數(shù)據(jù)量少的時候是可行的,我的測試表還是20w數(shù)據(jù),并且customer_id字段加了索引,全部查詢出來耗時在180s左右,我本地MySQL性能會差一點,這種查詢方式是將 b1 中的每一條數(shù)據(jù) 都和 b2 中的每一條數(shù)據(jù)進行比對取出滿足條件的數(shù)據(jù),b1 有20w條數(shù)據(jù) b2 也有20w條數(shù)據(jù),如果沒有索引不計算io開銷,只算cpu開銷,這條sql需要進行 20w * 20w = 400億次數(shù)據(jù)比對,在有索引的情況下數(shù)據(jù)比對次數(shù)會少一些但是也千萬級的,如果考慮其它開銷并且沒索引的情況下那查詢耗時可想而知。

使用限制

  • 1、這種方式其實除了性能問題以外還有一個更加嚴重的問題,在一些業(yè)務里給用戶余額明細添加數(shù)據(jù)時可能同一時間戳添加多條,這樣count結果就大于1了,這個用戶數(shù)據(jù)就查不出來了,還有一種情況如果開發(fā)人員事務沒有控制好,我們在入庫時一般會提前將create_time填充,但是我們用的是自增ID,入庫時create_time 小的,數(shù)據(jù)ID可能還會大一些,選擇那種方法還是需要看業(yè)務上怎么設計的
SELECT
	b1.* 
FROM
	customer_wallet_detail t1 
WHERE
	( SELECT COUNT( 1 ) FROM customer_wallet_detail t1 WHERE t2.customer_id = t1.customer_id AND t1.create_time <= t2.create_time ) <= 1;

在這里插入圖片描述

PS:優(yōu)化方案

  • 1、針對這條語句的查詢特性,我們減少數(shù)據(jù)的查詢條數(shù),比如給 t1和t2 添加上篩選時間區(qū)間,減少遍歷數(shù)組總數(shù)。
  • 2、使用覆蓋索引,我自己在測試的時候發(fā)現(xiàn)如果使用組合索引包含兩個字段 (customer_id,create_time) 性能會提升很多,20w數(shù)據(jù)查詢出結果只用了40s,如果只使用customer_id字段索引會進行回表,使用覆蓋索引沒有額外的回表操作所以會快很多。

總結

結合我的業(yè)務經過測試,目前看來方案三是最合適的,sql簡單性能適中,方案一比方案二性能更差而且實現(xiàn)麻煩,最終選擇那個方案主要看業(yè)務而定。

MAX()函數(shù)和MIN()這一類函數(shù)和GROUP BY配合使用存在問題

MAX()函數(shù)和MIN()這一類函數(shù)和GROUP BY配合使用,GROUP BY拿到的數(shù)據(jù)永遠都是這個分組排序最上面的一條,而MAX()函數(shù)和MIN()這一類函數(shù)會將這個分組中最大或最小的值取出來,這樣會導致查詢出來的數(shù)據(jù)對應不上。

正確查詢:

在這里插入圖片描述

錯誤查詢:這里的確拿到每個分組最新創(chuàng)建時間了但是拿的數(shù)據(jù)id還是排序的第一條

在這里插入圖片描述

在這里插入圖片描述

到此這篇關于Mysql分組查詢每組最新的一條數(shù)據(jù)的五種實現(xiàn)方法的文章就介紹到這了,更多相關Mysql分組查詢內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家! 

相關文章

  • MYSQL實現(xiàn)連續(xù)簽到功能斷簽一天從頭開始(sql語句)

    MYSQL實現(xiàn)連續(xù)簽到功能斷簽一天從頭開始(sql語句)

    這篇文章主要介紹了MYSQL實現(xiàn)連續(xù)簽到功能斷簽一天從頭開始,非常不錯,具有參考借鑒價值,需要的朋友可以參考下
    2017-05-05
  • 詳解監(jiān)聽MySQL的binlog日志工具分析:Canal

    詳解監(jiān)聽MySQL的binlog日志工具分析:Canal

    Canal主要用途是基于MySQL數(shù)據(jù)庫增量日志解析,提供增量數(shù)據(jù)訂閱和消費,目前主要支持MySQL。接下來通過本文給大家介紹監(jiān)聽MySQL的binlog日志工具分析:Canal的相關知識,感興趣的朋友一起看看吧
    2020-10-10
  • centos7通過yum安裝mysql的方法

    centos7通過yum安裝mysql的方法

    這篇文章主要介紹了centos7通過yum安裝mysql的方法,非常不錯,具有一定的參考借鑒價值,需要的朋友可以參考下
    2018-11-11
  • 關于useSSL=false和true的區(qū)別及說明

    關于useSSL=false和true的區(qū)別及說明

    這篇文章主要介紹了關于useSSL=false和true的區(qū)別及說明,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-08-08
  • MySQL算術/比較/邏輯/位/運算符與正則舉例詳解

    MySQL算術/比較/邏輯/位/運算符與正則舉例詳解

    每種數(shù)據(jù)庫都支持SQL語句,但是它們也都有各自支持的運算符,下面這篇文章主要給大家介紹了關于MySQL算術/比較/邏輯/位/運算符與正則的相關資料,文中通過實例代碼介紹的非常詳細,需要的朋友可以參考下
    2023-02-02
  • 詳細解讀MySQL中的權限

    詳細解讀MySQL中的權限

    這篇文章主要介紹了MySQL中的權限,包括各個權限所能操作的事務以及操作權限的一些常用命令語句,需要的朋友可以參考下
    2015-05-05
  • mysql同步復制搭建方法指南詳細步驟

    mysql同步復制搭建方法指南詳細步驟

    MySQL數(shù)據(jù)同步主要有三種方式: 1.利用MySQL自身的數(shù)據(jù)庫同步功能 2.利用MySQL數(shù)據(jù)庫的特性(數(shù)據(jù)庫存在固頂目錄,并且以文件形式存儲),進行數(shù)據(jù)庫目錄同步以達到數(shù)據(jù)同步目的 3.利用專用的MySQL數(shù)據(jù)庫同步軟件
    2008-04-04
  • MYSQL命令行模式管理MySql的一點心得

    MYSQL命令行模式管理MySql的一點心得

    MYSQL命令行模式管理MySql的一點心得...
    2007-09-09
  • MySQL 開啟慢查詢日志的方法

    MySQL 開啟慢查詢日志的方法

    本篇文章主要介紹了MySQL 開啟慢查詢日志的方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2017-06-06
  • Mysql之如何修改字段名和字段類型

    Mysql之如何修改字段名和字段類型

    這篇文章主要介紹了Mysql之如何修改字段名和字段類型問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-07-07

最新評論