快捷導(dǎo)航

oracle sql 去重復(fù)記錄不用distinct如何實(shí)現(xiàn)

更新時(shí)間：2012年11月25日 13:19:08 作者：

本文將詳細(xì)介紹oracle sql 去重復(fù)記錄不用distinct如何實(shí)現(xiàn),需要了解的朋友可以參考下

用distinct關(guān)鍵字只能過(guò)濾查詢(xún)字段中所有記錄相同的（記錄集相同），而如果要指定一個(gè)字段卻沒(méi)有效果，另外distinct關(guān)鍵字會(huì)排序，效率很低。
select distinct name from t1 能消除重復(fù)記錄，但只能取一個(gè)字段，現(xiàn)在要同時(shí)取id,name這2個(gè)字段的值。
select distinct id,name from t1 可以取多個(gè)字段，但只能消除這2個(gè)字段值全部相同的記錄
所以用distinct達(dá)不到想要的效果，用group by 可以解決這個(gè)問(wèn)題。
例如要顯示的字段為A、B、C三個(gè)，而A字段的內(nèi)容不能重復(fù)可以用下面的語(yǔ)句：
select A, min(B),min(C),count(*) from [table] where [條件] group by A
having [條件] order by A desc
為了顯示標(biāo)題頭好看點(diǎn)可以把select A, min(B),min(C),count(*) 換稱(chēng)select A as A, min(B) as B,min(C) as C,count(*) as 重復(fù)次數(shù)
顯示出來(lái)的字段和排序字段都要包括在group by 中
但顯示出來(lái)的字段包有min,max,count,avg,sum等聚合函數(shù)時(shí)可以不在group by 中
如上句的min(B),min(C),count(*)
一般條件寫(xiě)在where 后面
有聚合函數(shù)的條件寫(xiě)在having 后面
如果在上句中having加 count(*)>1 就可以查出記錄A的重復(fù)次數(shù)大于1的記錄
如果在上句中having加 count(*)>2 就可以查出記錄A的重復(fù)次數(shù)大于2的記錄
如果在上句中having加 count(*)>=1 就可以查出所有的記錄，但重復(fù)的只顯示一條，并且后面有顯示重復(fù)的次數(shù)----這就是所需要的結(jié)果，而且語(yǔ)句可以通過(guò)hibernate
下面語(yǔ)句可以查詢(xún)出那些數(shù)據(jù)是重復(fù)的：
select 字段1,字段2,count(*) from 表名 group by 字段1,字段2 having count(*) > 1
將上面的>號(hào)改為=號(hào)就可以查詢(xún)出沒(méi)有重復(fù)的數(shù)據(jù)了。
例如

復(fù)制代碼代碼如下:

 
select count(*) from (select gcmc,gkrq,count(*) from gczbxx_zhao t group by gcmc,gkrq having 
count(*)>=1 order by GKRQ) 
select * from gczbxx_zhao where viewid in ( select max(viewid) from gczbxx_zhao group by 
gcmc ) order by gkrq desc ---還是這個(gè)可行 

。
有一面試題說(shuō)：distinct去重復(fù)的效率很底下，我在網(wǎng)上看到這遍文章的方法好像說(shuō)是用 group by having 效率很高了？
我在了一個(gè)測(cè)試，有一商品表，26萬(wàn)條記錄，只有商品編號(hào)建了索引，對(duì)品牌名稱(chēng)字段做 distinct

復(fù)制代碼代碼如下:

select brand,count(*) from tab_commbaseinfo group by brand having count(*) =1

平均時(shí)間是：0.453

復(fù)制代碼代碼如下:

select distinct brand from tab_commbaseinfo

平均時(shí)間是：0.39
搞不懂是否還有其它方法。

您可能感興趣的文章: