pandas DataFrame 刪除重復的行的實現(xiàn)方法
1. 建立一個DataFrame
C=pd.DataFrame({'a':['dog']*3+['fish']*3+['dog'],'b':[10,10,12,12,14,14,10]})
2. 判斷是否有重復項
用duplicated( )函數(shù)判斷
C.duplicated()
3. 有重復項,則可以用drop_duplicates()移除重復項
C.drop_duplicates()
4. Duplicated( )和drop_duplicates( )方法是以默認的方式判斷全部的列(上面的例子中是看兩個變量a和b是否都是重復出現(xiàn))。
我們也可以對特定的列進行重復項判斷。
C.duplicated(['a']) C.drop_duplicates(['a']) C.duplicated(['b']) C.drop_duplicates(['b'])
5. norepeat_df = df.drop_duplicates(subset=['A_ID', 'B_ID'], keep='first')
#上面的命令去掉UNIT_ID和KPI_ID列中重復的行,并保留重復出現(xiàn)的行中第一次出現(xiàn)的行
補充:
- 當keep=False時,就是去掉所有的重復行
- 當keep=‘first'時,就是保留第一次出現(xiàn)的重復行
- 當keep='last'時就是保留最后一次出現(xiàn)的重復行。
(注意,這里的參數(shù)是字符串,要加引號?。。。?/p>
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
基于python3 OpenCV3實現(xiàn)靜態(tài)圖片人臉識別
這篇文章主要為大家詳細介紹了基于Python3 OpenCV3實現(xiàn)靜態(tài)圖片人臉識別,具有一定的參考價值,感興趣的小伙伴們可以參考一下2018-05-05一文帶你深入理解Flask中的Session和Cookies
Flask,作為一個靈活的微型 web 框架,提供了會話(Session)和 Cookies 管理的能力,本文將深入探討 Flask 中的會話和 Cookies 的概念、工作機制以及應用實例,希望對大家有所幫助2023-12-12Python數(shù)據(jù)類型之List列表實例詳解
這篇文章主要介紹了Python數(shù)據(jù)類型之List列表,結(jié)合實例形式分析了PythonList列表的概念、功能、定義以及判斷、截取、遍歷、切片等常見操作技巧,需要的朋友可以參考下2019-05-05python實現(xiàn)數(shù)據(jù)可視化超詳細講解
Python的數(shù)據(jù)可視化是將數(shù)據(jù)以圖形或圖表的形式呈現(xiàn),使復雜的信息更易于理解和分析,本文給大家詳細介紹了python數(shù)據(jù)可視化的實現(xiàn),文中通過圖文結(jié)合的方式介紹的非常詳細,需要的朋友可以參考下2024-06-06