欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python對多屬性的重復(fù)數(shù)據(jù)去重實(shí)例

 更新時間:2018年04月18日 15:26:53   作者:I天輝I  
下面小編就為大家分享一篇Python對多屬性的重復(fù)數(shù)據(jù)去重實(shí)例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧

python中的pandas模塊中對重復(fù)數(shù)據(jù)去重步驟:

1)利用DataFrame中的duplicated方法返回一個布爾型的Series,顯示各行是否有重復(fù)行,沒有重復(fù)行顯示為FALSE,有重復(fù)行顯示為TRUE;

2)再利用DataFrame中的drop_duplicates方法用于返回一個移除了重復(fù)行的DataFrame。

注釋:

如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個方法默認(rèn)會判斷全部咧,如果在這兩個方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates(['state']),則指定部分列(state列)進(jìn)行重復(fù)項(xiàng)的判斷。

具體實(shí)例如下:

>>> import pandas as pd 
>>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} 
>>> frame=pd.DataFrame(data) 
>>> frame 
 pop state 
0 a  1 
1 b  1 
2 c  2 
3 d  2 
>>> IsDuplicated=frame.duplicated() 
>>> print IsDuplicated 
0 False 
1 False 
2 False 
3 False 
dtype: bool 
>>> frame=frame.drop_duplicates(['state']) 
>>> frame 
 pop state 
0 a  1 
2 c  2 
>>> IsDuplicated=frame.duplicated(['state']) 
>>> print IsDuplicated 
0 False 
2 False 
dtype: bool 
>>> 

以上這篇Python對多屬性的重復(fù)數(shù)據(jù)去重實(shí)例就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。

相關(guān)文章

最新評論