有張訂單關(guān)聯(lián)額外費(fèi)用表,而且一個(gè)訂單號(hào)(order_no)記錄只能關(guān)聯(lián)同一個(gè)費(fèi)用(cost_id)一次，但是數(shù)據(jù)庫中出現(xiàn)了同一個(gè)訂單號(hào)關(guān)聯(lián)同一個(gè)費(fèi)用n次

當(dāng)然有人會(huì)說上面的問題我們可以建一個(gè) order_no + cost_id 的組合唯一索引，這樣就算代碼有bug但至少數(shù)據(jù)庫表中不會(huì)有臟數(shù)據(jù)。

似乎這樣就可以了，然而事情并沒有那么簡單。

因?yàn)槲覀儽碇械臄?shù)據(jù)在刪除的時(shí)候不會(huì)真的的刪除，而是采用邏輯刪除，會(huì)有一個(gè) deleted 字段使用0，1標(biāo)識(shí)未刪除與已刪除。

當(dāng)然我們也可以考慮將 order_no + cost_id + deleted 組合成一個(gè)聯(lián)合唯一索引。

這樣就ok了嗎？

其實(shí)會(huì)有一個(gè)新的問題，就是如果同一個(gè)訂單同一個(gè)費(fèi)用如果被刪除一次。再去刪除會(huì)發(fā)現(xiàn)無法成功進(jìn)行此操作，因?yàn)樵摋l數(shù)據(jù)已經(jīng)存在了，不能在刪除了。

所以當(dāng)時(shí)我們并沒有建立聯(lián)合唯一索引，才導(dǎo)致臟數(shù)據(jù)的產(chǎn)生。

其實(shí)上面這種場(chǎng)景網(wǎng)上有個(gè)比較好的解決方案，就是我們依舊可以將 order_no + cost_id + deleted 組合成一個(gè)聯(lián)合唯一索引，
但是刪除的時(shí)候deleted不再是固定的1，而是當(dāng)前的主鍵ID,也就是deleted不等于0都是刪除狀態(tài)，如果刪除了那deleted值=id

言歸正傳,接下來我們來講下該如何修復(fù)臟數(shù)據(jù)的問題

我們先創(chuàng)建一張訂單關(guān)聯(lián)費(fèi)用表

CREATE TABLE `order_cost_detail` (
  `id` int NOT NULL AUTO_INCREMENT COMMENT '主鍵',
  `order_no` varchar(32)  NOT NULL COMMENT '訂單號(hào)',
  `cost_id` int NOT NULL COMMENT '費(fèi)用Id',
  `cost_name` varchar(50)  NOT NULL DEFAULT '' COMMENT '費(fèi)用名稱',
  `money` decimal(10,2) NOT NULL COMMENT '金額',
  `create_time` datetime NOT NULL COMMENT '創(chuàng)建時(shí)間',
  `deleted` tinyint(1) NOT NULL COMMENT '是否刪除（0 否，1 是）',
  PRIMARY KEY (`id`) USING BTREE
) ENGINE=InnoDB AUTO_INCREMENT=1  COMMENT='訂單 - 費(fèi)用表';

插入一些模擬數(shù)據(jù)

INSERT INTO `order_cost_detail` (`id`, `order_no`, `cost_id`, `cost_name`, `money`, `create_time`, `deleted`)
VALUES
	(1, 'EX202208160000012-3', 2, '停車費(fèi)', 100.00, '2022-08-19 11:30:48', 0),
	(2, 'EX202208160000012-4', 3, '停車費(fèi)', 100.00, '2023-02-17 11:25:27', 0),
	(3, 'EX202208160000012-4', 3, '停車費(fèi)', 200.00, '2023-02-17 11:25:28', 0),
	(4, 'EX202208170000002-1', 1, '路橋費(fèi)', 300.00, '2022-08-19 11:31:57', 0),
	(5, 'EX202208170000002-1', 1, '路橋費(fèi)', 450.00, '2022-08-19 11:32:57', 0),
	(6, 'EX202208180000002-1', 2, '高速費(fèi)', 225.00, '2022-08-19 11:35:41', 0);

我們的目的很明確，就是要?jiǎng)h除多余的同一訂單號(hào)費(fèi)用相同的數(shù)據(jù)，同時(shí)保留最新的一條數(shù)據(jù)。

我們可以先用sql看下是否有重復(fù)數(shù)據(jù)

SELECT order_no, cost_name, count(*) AS num
FROM order_cost_detail
WHERE deleted = 0
GROUP BY order_no, cost_name
HAVING num > 1

運(yùn)行結(jié)果

發(fā)現(xiàn)有兩個(gè)訂單有臟數(shù)據(jù)，如果實(shí)際生產(chǎn)只有兩條臟數(shù)據(jù)那簡單，直接查詢這兩個(gè)訂單，把重復(fù)數(shù)據(jù)刪掉就好了。

但如果有幾十條甚至上百條數(shù)據(jù)呢，總不能一條一條的刪吧。

一般我們刪除重復(fù)數(shù)據(jù)都會(huì)保留最新的那條，所以我們可以這樣做

如果主鍵是自增的，那么重復(fù)數(shù)據(jù)刪除的時(shí)候，主鍵最大的一條就是需要保留的,如果主鍵不是自增的，我們可以根據(jù)創(chuàng)建時(shí)間，保留創(chuàng)建時(shí)間最大的記錄

我們先看下，我們需要?jiǎng)h除的記錄

select *
from order_cost_detail
where id not in (
	select max(id) as num
	from order_cost_detail
	where deleted = 0
	group by order_no, cost_name
)

查詢結(jié)果

根據(jù)結(jié)果來看確實(shí)是這兩條記錄需要?jiǎng)h除，那么我們開始執(zhí)行刪除操作

sql如下

-- 這里是邏輯刪除，也就是將需要?jiǎng)h除的數(shù)據(jù)打上deleted = 1 標(biāo)記
update order_cost_detail
set deleted = 1
where id in (
select id from order_cost_detail where id not in (
select max(id) as num from order_cost_detail where deleted = 0 group by order_no, cost_name
		)
	)

執(zhí)行的時(shí)候發(fā)現(xiàn)報(bào)錯(cuò)了

You can't specify target table 'order_cost_detail' for update in FROM clause

它的意思是說，不能在同一語句中，先select出同一表中的某些值，再update這個(gè)表，即不能依據(jù)某字段值做判斷再來更新某字段的值。

這個(gè)問題在MySQL官網(wǎng)中有提到解決方案：拉到文檔下面 https://dev.mysql.com/doc/refman/8.0/en/update.html

解決方法：select 的結(jié)果再通過一個(gè)中間表 select 多一次，就可以避免這個(gè)錯(cuò)誤

update order_cost_detail
set deleted = 1
where id in (
select t.id
from
( 
select id from order_cost_detail where id not in (
select max(id) as num from order_cost_detail where deleted = 0 group by order_no, cost_name )
	) t
)

執(zhí)行成功