Python對(duì)多屬性的重復(fù)數(shù)據(jù)去重實(shí)例
python中的pandas模塊中對(duì)重復(fù)數(shù)據(jù)去重步驟:
1)利用DataFrame中的duplicated方法返回一個(gè)布爾型的Series,顯示各行是否有重復(fù)行,沒有重復(fù)行顯示為FALSE,有重復(fù)行顯示為TRUE;
2)再利用DataFrame中的drop_duplicates方法用于返回一個(gè)移除了重復(fù)行的DataFrame。
注釋:
如果duplicated方法和drop_duplicates方法中沒有設(shè)置參數(shù),則這兩個(gè)方法默認(rèn)會(huì)判斷全部咧,如果在這兩個(gè)方法中加入了指定的屬性名(或者稱為列名),例如:frame.drop_duplicates(['state']),則指定部分列(state列)進(jìn)行重復(fù)項(xiàng)的判斷。
具體實(shí)例如下:
>>> import pandas as pd >>> data={'state':[1,1,2,2],'pop':['a','b','c','d']} >>> frame=pd.DataFrame(data) >>> frame pop state 0 a 1 1 b 1 2 c 2 3 d 2 >>> IsDuplicated=frame.duplicated() >>> print IsDuplicated 0 False 1 False 2 False 3 False dtype: bool >>> frame=frame.drop_duplicates(['state']) >>> frame pop state 0 a 1 2 c 2 >>> IsDuplicated=frame.duplicated(['state']) >>> print IsDuplicated 0 False 2 False dtype: bool >>>
以上這篇Python對(duì)多屬性的重復(fù)數(shù)據(jù)去重實(shí)例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
- Python實(shí)現(xiàn)去除Excel重復(fù)數(shù)據(jù)并統(tǒng)計(jì)重復(fù)次數(shù)
- Python?生成多行重復(fù)數(shù)據(jù)的方法實(shí)現(xiàn)
- python列表返回重復(fù)數(shù)據(jù)的下標(biāo)
- python Django批量導(dǎo)入不重復(fù)數(shù)據(jù)
- python實(shí)現(xiàn)查找excel里某一列重復(fù)數(shù)據(jù)并且剔除后打印的方法
- python中查找excel某一列的重復(fù)數(shù)據(jù) 剔除之后打印
- Python-pandas返回重復(fù)數(shù)據(jù)的index問題
相關(guān)文章
python web框架中實(shí)現(xiàn)原生分頁
這篇文章主要為大家詳細(xì)介紹了python web框架中使用原生分頁的方法,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2019-09-09Python3.5實(shí)現(xiàn)的三級(jí)菜單功能示例
這篇文章主要介紹了Python3.5實(shí)現(xiàn)的三級(jí)菜單功能,涉及Python針對(duì)json格式數(shù)據(jù)的讀取、遍歷、查找、判斷等相關(guān)操作技巧,需要的朋友可以參考下2019-03-03Python常見數(shù)據(jù)結(jié)構(gòu)詳解
這篇文章主要介紹了Python常見數(shù)據(jù)結(jié)構(gòu),需要的朋友可以參考下2014-07-07Django模板之基本的 for 循環(huán) 和 List內(nèi)容的顯示方式
這篇文章主要介紹了Django模板之基本的 for 循環(huán) 和 List內(nèi)容的顯示方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-03-03Python如何獲取Win7,Win10系統(tǒng)縮放大小
這篇文章主要介紹了Python如何獲取Win7,Win10系統(tǒng)縮放大小,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-01-01python實(shí)現(xiàn)對(duì)excel進(jìn)行數(shù)據(jù)剔除操作實(shí)例
python在數(shù)據(jù)分析這方便的介紹應(yīng)該不用多說了,下面這篇文章主要給大家介紹了關(guān)于利用python實(shí)現(xiàn)對(duì)excel進(jìn)行數(shù)據(jù)剔除操作的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),需要的朋友可以參考借鑒,下面來一起看看吧。2017-12-12