pd.drop_duplicates刪除重復(fù)行的方法實(shí)現(xiàn)
drop_duplicates 方法實(shí)現(xiàn)對(duì)數(shù)據(jù)框 DataFrame 去除特定列的重復(fù)行,返回 DataFrame 格式數(shù)據(jù)。
一、使用語法及參數(shù)
使用語法:
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False, ignore_index=False)
參數(shù):
- subset – 指定特定的列 默認(rèn)所有列
- keep:{‘first’, ‘last’, False} – 刪除重復(fù)項(xiàng)并保留第一次出現(xiàn)的項(xiàng) 默認(rèn)第一個(gè)
- keep=False – 表示刪除所有重復(fù)項(xiàng) 不保留
- inplace – 是否直接修改原對(duì)象
- gnore_index=True – 重置索引 (version 1.0.0 才有這個(gè)參數(shù))
二、實(shí)操
1.例子一
import pandas as pd df = pd.DataFrame({'a':[1,1,2,2], ? ? ? ? ? ? ? ? ? ?'b':['a','b','a','b']}) # 單列 df.drop_duplicates('b', 'first', inplace=True) print(df) ''' ? ?a ?b 0 ?1 ?a 1 ?1 ?b ''' # 多列 df.drop_duplicates(subset=['a', 'b'], keep='first', inplace=False) # 刪除所有重復(fù)項(xiàng) 不保留 df.drop_duplicates(subset=['a', 'b'], False)
2.例子二
# 構(gòu)建測(cè)試數(shù)據(jù)框 import pandas as pd df = pd.DataFrame({ ? ? 'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'], ? ? 'style': ['cup', 'cup', 'cup', 'pack', 'pack'], ? ? 'rating': [4, 4, 3.5, 15, 5] }) # 默認(rèn)按所有列去重 df.drop_duplicates() # 指定列 df.drop_duplicates(subset=['brand']) # 保留最后一個(gè)重復(fù)值 df.drop_duplicates(subset=['brand', 'style'], keep='last')
3.刪除重復(fù)項(xiàng)后重置索引
# 方法一 df.drop_duplicates(ignore_index=True) # 方法二 df.drop_duplicates().reset_index(drop=True) # 方法三 df.index = range(df.shape[0])
到此這篇關(guān)于pd.drop_duplicates刪除重復(fù)行的方法實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pd.drop_duplicates刪除重復(fù)行內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python學(xué)習(xí)之使用Matplotlib畫實(shí)時(shí)的動(dòng)態(tài)折線圖的示例代碼
這篇文章主要介紹了python學(xué)習(xí)之使用Matplotlib畫實(shí)時(shí)的動(dòng)態(tài)折線圖的示例代碼,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-02-02Python用HBuilder創(chuàng)建交流社區(qū)APP
這篇文章主要講解Python使用HBuilder創(chuàng)建交流社區(qū)APP,使用HBuilder做一個(gè)簡(jiǎn)單的社區(qū)瀏覽界面,下面文章附有詳細(xì)的代碼,需要的朋友可以參考一下2021-11-11Python?Cloudinary實(shí)現(xiàn)圖像和視頻上傳詳解
這篇文章主要介紹了Python?Cloudinary實(shí)現(xiàn)圖像和視頻上傳功能,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)吧2022-11-11Python實(shí)現(xiàn)字符串反轉(zhuǎn)的常用方法分析【4種方法】
這篇文章主要介紹了Python實(shí)現(xiàn)字符串反轉(zhuǎn)的常用方法,結(jié)合具體實(shí)例形式分析了4種常用的Python字符串反轉(zhuǎn)操作技巧,需要的朋友可以參考下2017-09-09使用selenium和pyquery爬取京東商品列表過程解析
這篇文章主要介紹了使用selenium和pyquery爬取京東商品列表過程解析,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-08-08python實(shí)現(xiàn)按關(guān)鍵字篩選日志文件
今天小編大家分享一篇python實(shí)現(xiàn)按關(guān)鍵字篩選日志文件方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-12-12python-opencv-cv2.threshold()二值化函數(shù)的使用
這篇文章主要介紹了python-opencv-cv2.threshold()二值化函數(shù)的使用,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2022-11-11用Anaconda安裝本地python包的方法及路徑問題(圖文)
這篇文章主要介紹了用Anaconda安裝本地python包的方法及路徑問題,小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2019-07-07