Postgresql去重函數(shù)distinct的用法說明
在項目中我們常會對數(shù)據(jù)進行去重處理,有時候會用in或者EXISTS函數(shù)?;蛘咄ㄟ^group by也是可以實現(xiàn)查重
不過Postgresql還有自帶去重函數(shù):distinct
下面是distinct 的實例:
1、創(chuàng)建表:user
CREATE TABLE `user` ( `name` varchar(30) DEFAULT NULL, `age` int(11) DEFAULT NULL ) ENGINE=InnoDB DEFAULT CHARSET=utf8; INSERT INTO `user` VALUES ('張三', 20); INSERT INTO `user` VALUES ('李四', 22); INSERT INTO `user` VALUES ('李四', 20); INSERT INTO `user` VALUES ('張三', 22); INSERT INTO `user` VALUES ('張三', 20);
查詢結果:
SELECT * FROM user 張三 20 李四 22 李四 20 張三 22 張三 20
2、根據(jù) name 查詢去重后的數(shù)據(jù):
SELECT distinct name FROM user 張三 李四
3、根據(jù)name 和 age 查詢去重后的數(shù)據(jù):
SELECT distinct name,age FROM user 張三 20 李四 22 李四 20 張三 22
4、根據(jù)name,age查詢重復數(shù)據(jù)數(shù):
SELECT distinct name,age,count(*) 數(shù)據(jù)條數(shù) FROM user GROUP BY name,age 張三 20 2 張三 22 1 李四 20 1 李四 22 1
二、查出重復數(shù)據(jù)后,我們需要刪除重復數(shù)據(jù)
刪除重復數(shù)據(jù)一般幾種方式,一般采用 臨時表 或者根據(jù) 某個字段,例如id等,通過max或者min函數(shù)去重。
補充:基于postgresql ctid實現(xiàn)數(shù)據(jù)的差異同步
項目背景:
最近在做異構數(shù)據(jù)同步方面(非實時)的工作,從oracle,gbase,postgresql向mysql數(shù)據(jù)庫中同步,對于沒有自增字段(自增ID或時間字段)的業(yè)務表,做差異同步是一件非常麻煩的事情,主要體現(xiàn)在記錄的新增、更新與刪除上
備注:源庫只提供一個只讀權限的用戶
ctid在pg中的作用
ctid是用來指向自身或新元組的元組標識符,怎么理解呢?下面能過幾個實驗來測試一下
satdb=# create table test_ctid(id int,name varchar(100)); satdb=# insert into test_ctid values(1,‘a(chǎn)'),(1,‘a(chǎn)'); satdb=# insert into test_ctid values(2,‘a(chǎn)'),(3,‘a(chǎn)');
查看記錄的ctid值
satdb=# select id,name,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 2 | a | (0,3) 3 | a | (0,4) (4 rows)
對id為2的記錄進行更新
satdb=# update test_ctid set name=‘b' where id=2; UPDATE 1
這里可以看到id=2的記錄指向了新的元組標識符 (0,5)
satdb=# select id,name,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 3 | a | (0,4) 2 | b | (0,5) (4 rows) satdb=# select * from test_ctid where ctid='(0,1)'; id | name ----±----- 1 | a (1 row)
刪除 id=3的記錄后,對應的ctid(0,4)不存在了
satdb=# delete from test_ctid where id=3; DELETE 1 satdb=# select *,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 2 | b | (0,5) (3 rows)
再插入一條記錄時,看看會不會使用(0,4)這個標識符
satdb=# insert into test_ctid values(3,‘d'); INSERT 0 1 satdb=# select *,ctid from test_ctid; id | name | ctid ----±-----±------ 1 | a | (0,1) 1 | a | (0,2) 2 | b | (0,5) 3 | d | (0,6)
這里新插入的記錄不會使用(0,4),而是直接分配新的標識符(0,6)
總結:
1、ctid的作用與oracle rowid類似,可以唯一標識一條記錄
2、記錄的更新后,后生產(chǎn)新的ctid
3、記錄刪除后,新插入的記錄不會使用已經(jīng)刪除記錄的ctid
4、基于ctid可以實現(xiàn)記錄的去重操作
5、基于ctid可以實現(xiàn)差異增量同步(新增、刪除、更新)
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。如有錯誤或未考慮完全的地方,望不吝賜教。
相關文章
Postgresql 檢查數(shù)據(jù)庫主從復制進度的操作
這篇文章主要介紹了Postgresql 檢查數(shù)據(jù)庫主從復制進度的操作,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-12-12PostgreSQL教程(十四):數(shù)據(jù)庫維護
這篇文章主要介紹了PostgreSQL教程(十四):數(shù)據(jù)庫維護,本文講解了恢復磁盤空間、更新規(guī)劃器統(tǒng)計、VACUUM和ANALYZE的示例、定期重建索引等內容,需要的朋友可以參考下2015-05-05詳解PostgreSQL中實現(xiàn)數(shù)據(jù)透視表的三種方法
數(shù)據(jù)透視表(Pivot Table)是進行數(shù)據(jù)匯總、分析、瀏覽和展示的強大工具,可以幫助我們了解數(shù)據(jù)中的對比情況、模式和趨勢,是數(shù)據(jù)分析師和運營人員必備技能之一,本給大家介紹PostgreSQL中實現(xiàn)數(shù)據(jù)透視表的三種方法,需要的朋友可以參考下2024-04-04PostgreSQL 實現(xiàn)sql放入文件批量執(zhí)行
這篇文章主要介紹了PostgreSQL 實現(xiàn)sql放入文件批量執(zhí)行,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2021-02-02PostgreSQL利用遞歸優(yōu)化求稀疏列唯一值的方法
這篇文章主要介紹了PostgreSQL利用遞歸優(yōu)化求稀疏列唯一值的方法,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下2021-01-01