pandas取出重復(fù)數(shù)據(jù)的方法
drop_duplicates為我們提供了數(shù)據(jù)去重的方法,那怎么得到哪些數(shù)據(jù)有重復(fù)呢?
實(shí)現(xiàn)步驟:
1、采用drop_duplicates對(duì)數(shù)據(jù)去兩次重,一次將重復(fù)數(shù)據(jù)全部去除(keep=False)記為data1,另一次將重復(fù)數(shù)據(jù)保留一個(gè)(keep='first)記為data2;
2、求data1和data2的差集即可:data2.append(data1).drop_duplicates(keep=False)
以上這篇pandas取出重復(fù)數(shù)據(jù)的方法就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實(shí)現(xiàn)的大數(shù)據(jù)分析操作系統(tǒng)日志功能示例
這篇文章主要介紹了Python實(shí)現(xiàn)的大數(shù)據(jù)分析操作系統(tǒng)日志功能,涉及Python大文件切分、讀取、多線程操作等相關(guān)使用技巧,需要的朋友可以參考下2019-02-02Python正則表達(dá)式re.search()用法詳解
re是Python中最常見的正則表達(dá)式模塊,常用方法包括compile,match,findall,finditer,search,split,sub等,下面這篇文章主要給大家介紹了關(guān)于Python正則表達(dá)式re.search()用法詳解的相關(guān)資料,需要的朋友可以參考下2022-09-09python實(shí)現(xiàn)基于SVM手寫數(shù)字識(shí)別功能
這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)基于SVM手寫數(shù)字識(shí)別功能,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-01-01python實(shí)現(xiàn)股票歷史數(shù)據(jù)可視化分析案例
股票交易數(shù)據(jù)分析可直觀股市走向,對(duì)于如何把握股票行情,快速解讀股票交易數(shù)據(jù)有不可替代的作用,感興趣的可以了解一下2021-06-06Python中實(shí)現(xiàn)常量(Const)功能
這篇文章主要介紹了Python中實(shí)現(xiàn)常量(Const)功能,python語言本身沒有提供const,本文使用一個(gè)類來實(shí)現(xiàn)常量定義功能,并介紹了使用方法,需要的朋友可以參考下2015-01-01python 代碼實(shí)現(xiàn)k-means聚類分析的思路(不使用現(xiàn)成聚類庫)
這篇文章主要介紹了python 代碼實(shí)現(xiàn)k-means聚類分析(不使用現(xiàn)成聚類庫),本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2020-06-06