Pandas去除重復項函數(shù)詳解drop_duplicates()

更新時間：2024年02月20日 17:01:28 作者：ckSpark

這篇文章主要介紹了Pandas去除重復項函數(shù)drop_duplicates(),具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教

drop_duplicates函數(shù)用途

pandas中的drop_duplicates()函數(shù)

可以通過SQL中關鍵字distinct的用法來理解

根據指定的字段對數(shù)據集進行去重處理

drop_duplicates()函數(shù)的具體參數(shù)

用法：

DataFrame.drop_duplicates(subset=None, keep=‘first', inplace=False)

參數(shù)說明：

參數(shù)	說明
subset	根據指定的列名進行去重，默認整個數(shù)據集
keep	可選{‘first’, ‘last’, False}，默認first，即默認保留第一次出現(xiàn)的重復值，并刪去其他重復的數(shù)據，F(xiàn)alse是指刪去所有重復數(shù)據。
inplace	是否對數(shù)據集本身進行修改，默認False

drop_duplicates用法舉例

根據指定字段進行去重

保留第一次出現(xiàn)的數(shù)據

import pandas as pd
#創(chuàng)建數(shù)據框
df=pd.DataFrame({
    'a':[1,2,4,3,3,3,4],
    'b':[2,3,3,4,4,5,3]
})
print('去重前：\n',df)

#根據字段a進行去重，保留第一次出現(xiàn)的數(shù)據
df.drop_duplicates(['a'],keep='first',inplace=True)
print('去重后：\n',df)

>>>
去重前：
    a  b
0  1  2
1  2  3
2  4  3
3  3  4
4  3  4
5  3  5
6  4  3
去重后：
    a  b
0  1  2
1  2  3
2  4  3
3  3  4

總結

以上為個人經驗，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

python實現(xiàn)滑雪者小游戲
這篇文章主要為大家詳細介紹了python實現(xiàn)滑雪者小游戲，文中示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2020-02-02
Python隨機數(shù)種子(random seed)的設置小結
隨機數(shù)種子是控制偽隨機數(shù)生成器的初始值,通過設置相同的種子,可以確保隨機數(shù)序列的一致性,本文主要介紹了Python隨機數(shù)種子(random seed)的設置,感興趣的可以了解一下
2025-03-03
解析Python中的__getitem__專有方法
__getitem__是Python雙下劃線包圍的special method之一,這里我們就來解析Python中的__getitem__專有方法的使用,需要的朋友可以參考下:
2016-06-06
python中有幫助函數(shù)嗎
在本篇文章里小編給大家分享的是一篇關于python幫助函數(shù)詳解內容，有興趣的朋友們可以學習下。
2020-06-06
Python?pydash庫處理大規(guī)模數(shù)據集執(zhí)行復雜操作
在數(shù)據處理和分析領域,Python一直是一種強大的編程語言,然而,在處理大規(guī)模數(shù)據集和執(zhí)行復雜操作時,有時候需要更高效的工具,在本文中,我們將深入探討pydash庫,這是一個專注于提高Python代碼性能的工具
2023-12-12
?python 中的條件判斷語句的使用介紹
這篇文章主要介紹了?python 中的條件判斷語句的使用，主要學習內容有封裝過于復雜的邏輯判斷，不同分支下的重復代碼等，更多相關內容，需要的小伙伴可以參考下面文章詳細介紹內容
2022-03-03
如何讀取.npy文件以及如何實現(xiàn)將數(shù)組保存為圖片
這篇文章主要介紹了如何讀取.npy文件以及如何實現(xiàn)將數(shù)組保存為圖片問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2024-02-02
Python基礎之python循環(huán)控制語句break/continue詳解
Python中提供了兩個關鍵字用來控制循環(huán)語句,分別是break和continue，接下來通過兩個案例來區(qū)分這兩個控制語句的不同，感興趣的朋友一起看看吧
2021-09-09
Python?虛擬環(huán)境的價值和常用命令詳解
在實際項目開發(fā)中，我們通常會根據自己的需求去下載各種相應的框架庫，如Scrapy、Beautiful?Soup等，但是可能每個項目使用的框架庫并不一樣，或使用框架的版本不一樣，今天給大家分享下Python?虛擬環(huán)境的價值和常用命令，感興趣的朋友一起看看吧
2022-05-05
Python的Django框架使用入門指引
這篇文章主要介紹了Python的Django框架使用入門指引,本文來自于IBM官方網站技術文檔,需要的朋友可以參考下
2015-04-04