關(guān)于MySQL表中沒有主鍵時如何找到重復(fù)的數(shù)據(jù)

更新時間：2023年06月09日 16:02:03 作者：唐小碼

這篇文章主要來和探討一下關(guān)于MySQL表中沒有主鍵時，該如何找到重復(fù)的數(shù)據(jù)，文中的示例代碼講解詳細(xì)，具有一定的參考價值，需要的可以了解一下

1. 使用 GROUP BY 分組查詢法
2. 使用子查詢法
3. 使用連接查詢法
4. 使用去重后比較條數(shù)法
5. 使用子查詢法計算重復(fù)次數(shù)
6. 對多列使用 DISTINCT 子句法
7. 查找輸入數(shù)據(jù)相同的記錄法
8. 根據(jù)下標(biāo)去重
9. 手動輸入表的列名法
10. 使用 ROW_NUMBER() OVER() 分配行號

問題描述

有一次遇到這樣一個面試題，說如果一個表中沒有主鍵，如何找到里面重復(fù)的數(shù)據(jù)？

表數(shù)據(jù)如下：

表結(jié)構(gòu)如下：

針對以上問題，有以下幾種解決方案

解決方案

1. 使用 GROUP BY 分組查詢法

利用 GROUP BY 分組查詢語句來分組聚合，然后篩選出出現(xiàn)次數(shù)大于1的重復(fù)記錄。例如：

SELECT column1, column2, column3, COUNT(*) as count FROM table_name GROUP BY column1, column2, column3 HAVING count > 1;

該語句將按照 column1、column2、column3 分組，統(tǒng)計每個分組的數(shù)量，然后取出數(shù)量大于 1 的分組。該方法比較簡單，但是如果表中記錄較多，可能查詢效率較低。

2. 使用子查詢法

使用子查詢獲得重復(fù)的記錄，例如：

SELECT * FROM table_name WHERE (column1, column2, column3) IN (SELECT column1, column2, column3 FROM table_name GROUP BY column1, column2, column3 HAVING COUNT(*) > 1)

該語句子查詢部分統(tǒng)計每個不同的 column1、column2、column3 分組，然后再用 IN 子句將重復(fù)記錄選出來。

3. 使用連接查詢法

使用連接查詢，將表和本身連接起來，并比較來判斷重復(fù)。例如：

SELECT a.* FROM table_name a INNER JOIN (SELECT column1, column2, column3 FROM table_name GROUP BY column1, column2, column3 HAVING COUNT(*) > 1) b ON a.column1 = b.column1 AND a.column2 = b.column2 AND a.column3 = b.column3

該語句以列 column1、column2、column3 分組，找出出現(xiàn)兩次以上的重復(fù)記錄，并與原表進(jìn)行連接查詢。

4. 使用去重后比較條數(shù)法

將表中所有列的值連接成一個字符串，再將這個字符串進(jìn)行快速 MD5 哈希，用 count() 函數(shù)來計算每個哈希值出現(xiàn)的次數(shù)，如果某個哈希值出現(xiàn)次數(shù)大于 1，那么這些記錄就是重復(fù)的。例如：

SELECT COUNT(*), MD5(CONCAT_WS('|', column_1, column_2, column_3, column_4, ..., column_n)) FROM table_name GROUP BY MD5(CONCAT_WS('|', column_1, column_2, column_3, column_4, ..., column_n)) HAVING COUNT(*) > 1

5. 使用子查詢法計算重復(fù)次數(shù)

使用子查詢先計算出每個記錄重復(fù)的次數(shù)，然后取出重復(fù)次數(shù)大于 1 的記錄。例如：

SELECT a.* FROM table_name a, (SELECT column1, column2, column3, COUNT(*) as count FROM table_name GROUP BY column1, column2, column3 HAVING count > 1) b WHERE a.column1 = b.column1 AND a.column2 = b.column2 AND a.column3 = b.column3

該語句計算出每個 column1、column2、column3 分組中出現(xiàn)的次數(shù)，然后篩選出出現(xiàn)次數(shù)大于 1 的記錄。

6. 對多列使用 DISTINCT 子句法

使用 DISTINCT 子句來去除重復(fù)的數(shù)據(jù)，例如：

SELECT DISTINCT column1, column2, column3 FROM table_name

該語句將按照 column1、column2、column3 去重，只取出不同的記錄。如果存在重復(fù)數(shù)據(jù)，那么就會取出重復(fù)數(shù)據(jù)。

7. 查找輸入數(shù)據(jù)相同的記錄法

這種方法就是找到輸入的記錄與某些記錄是相同的，這些記錄就是重復(fù)記錄。例如：

SELECT * FROM table_name WHERE column1='value1' AND column2='value2' AND column3='value3'

該語句將根據(jù)表中每個過濾條件來查找重復(fù)記錄。

8. 根據(jù)下標(biāo)去重

該方法是通過打印出所有的鍵值，找出重復(fù)的鍵并去重。例如：

SELECT DISTINCT SUBSTRING_INDEX(column_string,',',1) AS column1, SUBSTRING_INDEX(SUBSTRING_INDEX(column_string,',',2),',',-1) AS column2, SUBSTRING_INDEX(column_string,',',-1) AS column3 FROM (SELECT CONCAT(column1,',',column2,',',column3) AS column_string FROM table_name) AS table_alias

該語句將 SELECT CONCAT(column1,',',column2,',',column3) AS column_string FROM table_name 產(chǎn)生的結(jié)果進(jìn)行處理，將 column1、column2、column3 分開，然后再按照去重不同列的方法進(jìn)行處理。

9. 手動輸入表的列名法

該方法是通過手動輸入要查詢的列名，然后進(jìn)行查找。例如：

SELECT column1, column2, column3, COUNT(*) as count FROM table_name GROUP BY column1, column2, column3 HAVING count > 1;

10. 使用 ROW_NUMBER() OVER() 分配行號

該方法基于 ROW_NUMBER() OVER() 分配行號來找到重復(fù)的記錄。例如：

SELECT * FROM (
    SELECT *, ROW_NUMBER() OVER(PARTITION BY column1, column2, column3 ORDER BY column1, column2, column3) AS rn 
    FROM table_name
) t
WHERE t.rn > 1

該語句將按照 column1、column2、column3 分組，為每組結(jié)果分配一個行號并選出行號大于 1 的結(jié)果。這種方法適用于較新的 MySQL 版本和較大的表。

到此這篇關(guān)于關(guān)于MySQL表中沒有主鍵時如何找到重復(fù)的數(shù)據(jù)的文章就介紹到這了,更多相關(guān)MySQL重復(fù)數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: