欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python?Pandas中DataFrame.drop_duplicates()刪除重復值詳解

 更新時間:2022年07月11日 16:10:36   作者:山茶花開時。  
在實際處理數(shù)據(jù)中,數(shù)據(jù)預處理操作中,常常需要去除掉重復的數(shù)據(jù),這篇文章主要給大家介紹了關于Python?Pandas中DataFrame.drop_duplicates()刪除重復值的相關資料,需要的朋友可以參考下

語法

df.drop_duplicates(subset = None,
                   keep = 'first', 
                   inplace = False, 
                   ignore_index = False)

參數(shù)

1.subset:指定的標簽或標簽序列,僅刪除這些列重復值,默認情況為所有列

2.keep:確定要保留的重復值,有以下可選項:

first:保留第一次出現(xiàn)的重復值,默認

last:保留最后一次出現(xiàn)的重復值

False:刪除所有重復值

3.inplace:是否生效

4.ignore_index:如果為True,則重新分配自然索引(0,1,…,n - 1)

# 刪除重復值 DataFrame.drop_duplicates()
import pandas as pd
 
df = pd.DataFrame([['x','x',1],['x','x',1],['z','x',2]], columns = ['A','B','C'])
 
# 刪除重復行
res1 = df.drop_duplicates()
 
# 刪除指定列
res2 = df.drop_duplicates(subset = ['A'])
 
# 保留最后一個
res3 = df.drop_duplicates(subset = ['A'], keep = 'last')

結果展示

df

res1

res2

res3

擴展:識別重復值

import pandas as pd
 
df = pd.DataFrame({
    'studentID':['A001','A002','A003','A004','A005','A006','A006'],
    'score':[100,93,94,96,93,95,95]})
 
# 識別重復值
duplicate_value = df[df.duplicated()]

df

由上圖可知studentID為'A006'的記錄有兩條,我們可以使用duplicated()方法識別重復值,它返回的是布爾值結果(True:有重復值,F(xiàn)alse:無重復值)

duplicate_value

總結

到此這篇關于Python Pandas中DataFrame.drop_duplicates()刪除重復值的文章就介紹到這了,更多相關Pandas DataFrame.drop_duplicates()刪除重復值內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • Python對象中__del__方法起作用的條件詳解

    Python對象中__del__方法起作用的條件詳解

    今天小編就為大家分享一篇Python對象中__del__方法起作用的條件詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-11-11
  • python文本進度條實例

    python文本進度條實例

    這篇文章主要為大家介紹了python文本進度條,具有一定的參考價值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來幫助
    2021-12-12
  • Python合并多個Excel數(shù)據(jù)的方法

    Python合并多個Excel數(shù)據(jù)的方法

    這篇文章主要介紹了Python合并多個Excel數(shù)據(jù)的方法也就是說將多個excel中的數(shù)據(jù)合并到另一個表中,本文通過實例代碼相結合的形式給大家介紹的非常詳細,具有一定的參考借鑒價值,需要的朋友參考下吧
    2018-07-07
  • python assert的用處示例詳解

    python assert的用處示例詳解

    python assert 句語格式及用法很簡單。通常程序在運行完之后拋出異常,使用assert可以在出現(xiàn)有異常的代碼處直接終止運行。這篇文章通過實例代碼介紹了python assert的用處 ,需要的朋友可以參考下
    2019-04-04
  • 推薦8款常用的Python GUI圖形界面開發(fā)框架

    推薦8款常用的Python GUI圖形界面開發(fā)框架

    這篇文章主要介紹了推薦8款常用的Python GUI圖形界面開發(fā)框架,需要的朋友可以參考下
    2020-02-02
  • Python實現(xiàn)Word批量轉(zhuǎn)PDF的小工具

    Python實現(xiàn)Word批量轉(zhuǎn)PDF的小工具

    這篇文章主要為大家詳細介紹了如何使用Python復刻一個Word批量轉(zhuǎn)PDF的小工具,文中的示例代碼講解詳細,感興趣的小伙伴可以參考一下
    2025-05-05
  • python?包?requests?實現(xiàn)請求操作

    python?包?requests?實現(xiàn)請求操作

    這篇文章主要介紹了python?包?requests?實現(xiàn)請求操作,文章介紹內(nèi)容包括帶參數(shù)請求、自定義headers,文章內(nèi)容詳細具有一定的參考價值,需要的小伙伴可以參考一下
    2022-04-04
  • Python get()函數(shù)用法案例詳解

    Python get()函數(shù)用法案例詳解

    在Python中,get()是字典(dict)類型的內(nèi)置方法,用于安全地獲取字典中指定鍵對應的值,它的核心作用是避免因訪問不存在的鍵而引發(fā)KeyError錯誤,本文給大家介紹Python get()函數(shù)用法案例,感興趣的朋友一起看看吧
    2025-06-06
  • 如何用定值 Cookie 實現(xiàn)反爬詳解

    如何用定值 Cookie 實現(xiàn)反爬詳解

    這篇文章主要為大家介紹了如何用定值 Cookie 實現(xiàn)反爬示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2023-04-04
  • Matplotlib之解決plt.savefig()保存多張圖片有重疊的問題

    Matplotlib之解決plt.savefig()保存多張圖片有重疊的問題

    這篇文章主要介紹了Matplotlib之解決plt.savefig()保存多張圖片有重疊的問題,具有很好的參考價值,希望對大家有所幫助,
    2023-09-09

最新評論