pandas取出重復(fù)數(shù)據(jù)的方法
drop_duplicates為我們提供了數(shù)據(jù)去重的方法,那怎么得到哪些數(shù)據(jù)有重復(fù)呢?
實現(xiàn)步驟:
1、采用drop_duplicates對數(shù)據(jù)去兩次重,一次將重復(fù)數(shù)據(jù)全部去除(keep=False)記為data1,另一次將重復(fù)數(shù)據(jù)保留一個(keep='first)記為data2;
2、求data1和data2的差集即可:data2.append(data1).drop_duplicates(keep=False)
以上這篇pandas取出重復(fù)數(shù)據(jù)的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實現(xiàn)的大數(shù)據(jù)分析操作系統(tǒng)日志功能示例
這篇文章主要介紹了Python實現(xiàn)的大數(shù)據(jù)分析操作系統(tǒng)日志功能,涉及Python大文件切分、讀取、多線程操作等相關(guān)使用技巧,需要的朋友可以參考下2019-02-02python實現(xiàn)基于SVM手寫數(shù)字識別功能
這篇文章主要為大家詳細介紹了python實現(xiàn)基于SVM手寫數(shù)字識別功能,文中示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-01-01python實現(xiàn)股票歷史數(shù)據(jù)可視化分析案例
股票交易數(shù)據(jù)分析可直觀股市走向,對于如何把握股票行情,快速解讀股票交易數(shù)據(jù)有不可替代的作用,感興趣的可以了解一下2021-06-06python 代碼實現(xiàn)k-means聚類分析的思路(不使用現(xiàn)成聚類庫)
這篇文章主要介紹了python 代碼實現(xiàn)k-means聚類分析(不使用現(xiàn)成聚類庫),本文通過實例代碼給大家介紹的非常詳細,對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-06-06