oracle sql 去重復(fù)記錄不用distinct如何實(shí)現(xiàn)
更新時(shí)間:2012年11月25日 13:19:08 作者:
本文將詳細(xì)介紹oracle sql 去重復(fù)記錄不用distinct如何實(shí)現(xiàn),需要了解的朋友可以參考下
用distinct關(guān)鍵字只能過濾查詢字段中所有記錄相同的(記錄集相同),而如果要指定一個(gè)字段卻沒有效果,另外distinct關(guān)鍵字會(huì)排序,效率很低 。
select distinct name from t1 能消除重復(fù)記錄,但只能取一個(gè)字段,現(xiàn)在要同時(shí)取id,name這2個(gè)字段的值。
select distinct id,name from t1 可以取多個(gè)字段,但只能消除這2個(gè)字段值全部相同的記錄
所以用distinct達(dá)不到想要的效果,用group by 可以解決這個(gè)問題。
例如要顯示的字段為A、B、C三個(gè),而A字段的內(nèi)容不能重復(fù)可以用下面的語句:
select A, min(B),min(C),count(*) from [table] where [條件] group by A
having [條件] order by A desc
為了顯示標(biāo)題頭好看點(diǎn)可以把select A, min(B),min(C),count(*) 換稱select A as A, min(B) as B,min(C) as C,count(*) as 重復(fù)次數(shù)
顯示出來的字段和排序字段都要包括在group by 中
但顯示出來的字段包有min,max,count,avg,sum等聚合函數(shù)時(shí)可以不在group by 中
如上句的min(B),min(C),count(*)
一般條件寫在where 后面
有聚合函數(shù)的條件寫在having 后面
如果在上句中having加 count(*)>1 就可以查出記錄A的重復(fù)次數(shù)大于1的記錄
如果在上句中having加 count(*)>2 就可以查出記錄A的重復(fù)次數(shù)大于2的記錄
如果在上句中having加 count(*)>=1 就可以查出所有的記錄,但重復(fù)的只顯示一條,并且后面有顯示重復(fù)的次數(shù)----這就是所需要的結(jié)果,而且語句可以通過hibernate
下面語句可以查詢出那些數(shù)據(jù)是重復(fù)的:
select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1
將上面的>號(hào)改為=號(hào)就可以查詢出沒有重復(fù)的數(shù)據(jù)了。
例如
select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having
count(*)>=1 order by GKRQ)
select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by
gcmc ) order by gkrq desc ---還是這個(gè)可行
。
有一面試題說:distinct去重復(fù)的效率很底下,我在網(wǎng)上看到這遍文章的方法好像說是用 group by having 效率很高了?
我在了一個(gè)測(cè)試,有一商品表,26萬條記錄,只有商品編號(hào)建了索引,對(duì)品牌名稱字段做 distinct
select brand,count(*) from tab_commbaseinfo group by brand having count(*) =1
平均時(shí)間是:0.453
select distinct brand from tab_commbaseinfo
平均時(shí)間是:0.39
搞不懂是否還有其它方法。
select distinct name from t1 能消除重復(fù)記錄,但只能取一個(gè)字段,現(xiàn)在要同時(shí)取id,name這2個(gè)字段的值。
select distinct id,name from t1 可以取多個(gè)字段,但只能消除這2個(gè)字段值全部相同的記錄
所以用distinct達(dá)不到想要的效果,用group by 可以解決這個(gè)問題。
例如要顯示的字段為A、B、C三個(gè),而A字段的內(nèi)容不能重復(fù)可以用下面的語句:
select A, min(B),min(C),count(*) from [table] where [條件] group by A
having [條件] order by A desc
為了顯示標(biāo)題頭好看點(diǎn)可以把select A, min(B),min(C),count(*) 換稱select A as A, min(B) as B,min(C) as C,count(*) as 重復(fù)次數(shù)
顯示出來的字段和排序字段都要包括在group by 中
但顯示出來的字段包有min,max,count,avg,sum等聚合函數(shù)時(shí)可以不在group by 中
如上句的min(B),min(C),count(*)
一般條件寫在where 后面
有聚合函數(shù)的條件寫在having 后面
如果在上句中having加 count(*)>1 就可以查出記錄A的重復(fù)次數(shù)大于1的記錄
如果在上句中having加 count(*)>2 就可以查出記錄A的重復(fù)次數(shù)大于2的記錄
如果在上句中having加 count(*)>=1 就可以查出所有的記錄,但重復(fù)的只顯示一條,并且后面有顯示重復(fù)的次數(shù)----這就是所需要的結(jié)果,而且語句可以通過hibernate
下面語句可以查詢出那些數(shù)據(jù)是重復(fù)的:
select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1
將上面的>號(hào)改為=號(hào)就可以查詢出沒有重復(fù)的數(shù)據(jù)了。
例如
復(fù)制代碼 代碼如下:
select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having
count(*)>=1 order by GKRQ)
select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by
gcmc ) order by gkrq desc ---還是這個(gè)可行
有一面試題說:distinct去重復(fù)的效率很底下,我在網(wǎng)上看到這遍文章的方法好像說是用 group by having 效率很高了?
我在了一個(gè)測(cè)試,有一商品表,26萬條記錄,只有商品編號(hào)建了索引,對(duì)品牌名稱字段做 distinct
復(fù)制代碼 代碼如下:
select brand,count(*) from tab_commbaseinfo group by brand having count(*) =1
平均時(shí)間是:0.453
復(fù)制代碼 代碼如下:
select distinct brand from tab_commbaseinfo
平均時(shí)間是:0.39
搞不懂是否還有其它方法。
相關(guān)文章
Oracle用戶連續(xù)登錄失敗次數(shù)限制如何取消
三步驟輕松實(shí)現(xiàn)Oracle取消用戶連續(xù)登錄失敗次數(shù)限制,用戶連續(xù)登錄失敗次數(shù)最大限制時(shí),Oracle就會(huì)鎖定該用戶,如何破解這個(gè)限制,下面為大家介紹,感興趣的小伙伴們可以參考一下2016-05-05ORACLE 常用的SQL語法和數(shù)據(jù)對(duì)象
ORACLE 常用的SQL語法和數(shù)據(jù)對(duì)象...2007-03-03基于Oracle的高性能動(dòng)態(tài)SQL程序開發(fā)
對(duì)動(dòng)態(tài)SQL的程序開發(fā)進(jìn)行了總結(jié),并結(jié)合筆者實(shí)際開發(fā)經(jīng)驗(yàn)給出若干開發(fā)技巧2007-03-03Oracle SQL性能優(yōu)化系列學(xué)習(xí)三
Oracle SQL性能優(yōu)化系列學(xué)習(xí)三...2007-03-03