欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas刪除重復(fù)數(shù)據(jù)簡單方法

 更新時間:2023年07月07日 12:03:04   作者:**星光*  
這篇文章主要給大家介紹了關(guān)于pandas刪除重復(fù)數(shù)據(jù)的簡單方法,在數(shù)據(jù)處理過程中常常會遇到重復(fù)的問題,文中通過實例代碼介紹的非常詳細(xì),需要的朋友可以參考下

 1、pandas中重復(fù)索引問題

df = df[~df.index.duplicated()]

2、pandas刪除重復(fù)數(shù)據(jù)行

# 首先導(dǎo)入常用的兩個包
import pandas as pd
import numpy as np
 
# 1.刪除完全重復(fù)的行
df.drop_duplicates()
 
2.按k列進(jìn)行去重,對于重復(fù)項,保留第一次出現(xiàn)的值
df.drop_duplicates('k',keep='first')
 
3、k2和k1兩列進(jìn)行去重
df.drop_duplicates(['k2','k1'], keep='first')
 
"""
keep:{‘first', ‘last', False}, 默認(rèn)值 ‘first'
first:保留第一次出現(xiàn)的重復(fù)行,刪除后面的重復(fù)行。
last:刪除前面的重復(fù)項,保留最后一次出現(xiàn)的重復(fù)行。
False:刪除所有重復(fù)項
"""

 3、drop_duplicates()函數(shù)的語法

df.drop_duplicates(subset=['A','B','C'],keep='first',inplace=True)

參數(shù)說明如下:

  • subset:表示要進(jìn)去重的列名,默認(rèn)為 None。
  • keep:有三個可選參數(shù),分別是 first、last、False,默認(rèn)為 first,表示只保留第一次出現(xiàn)的重復(fù)項,刪除其余重復(fù)項,last 表示只保留最后一次出現(xiàn)的重復(fù)項,F(xiàn)alse 則表示刪除所有重復(fù)項。
  • inplace:布爾值參數(shù),默認(rèn)為 False 表示刪除重復(fù)項后返回一個副本,若為 Ture 則表示直接在原數(shù)據(jù)上刪除重復(fù)項。

附:pandas數(shù)據(jù)處理——取出重復(fù)數(shù)據(jù)

平常我們用pandas做重復(fù)數(shù)據(jù)處理時,常常調(diào)用到drop_duplicates方法來去除重。

現(xiàn)在我不想完全去除重復(fù),而是把重復(fù)數(shù)據(jù)輸出,現(xiàn)有數(shù)據(jù)如下所示:

方法:

重復(fù)數(shù)據(jù)保留一個,duplicate_bool輸出的是bool類型值,通過判斷bool==True,取出重復(fù)行。

duplicate_bool = df.duplicated(subset=['id'], keep='first')
repeat=df.loc[duplicate_bool == True]
repeat復(fù)制

輸出:

 總結(jié)

到此這篇關(guān)于pandas刪除重復(fù)數(shù)據(jù)的文章就介紹到這了,更多相關(guān)pandas刪除重復(fù)數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python多線程應(yīng)用于自動化測試操作示例

    Python多線程應(yīng)用于自動化測試操作示例

    這篇文章主要介紹了Python多線程應(yīng)用于自動化測試操作,結(jié)合實例形式分析了Python多線程基于Selenium進(jìn)行自動化操作相關(guān)實現(xiàn)技巧,需要的朋友可以參考下
    2018-12-12
  • python Tkinter的簡單入門教程

    python Tkinter的簡單入門教程

    這篇文章主要介紹了python Tkinter的簡單入門教程,幫助大家更好的理解和學(xué)習(xí)使用python制作gui程序,感興趣的朋友可以了解下
    2021-04-04
  • Python?實操顯示數(shù)據(jù)圖表并固定時間長度

    Python?實操顯示數(shù)據(jù)圖表并固定時間長度

    這篇文章主要介紹了Python?實操顯示數(shù)據(jù)圖表并固定時間長度,文章圍繞主題展開詳細(xì)的內(nèi)容介紹,具有一定的參考價值,需要的小伙伴可以參考一下
    2022-08-08
  • keras 指定程序在某塊卡上訓(xùn)練實例

    keras 指定程序在某塊卡上訓(xùn)練實例

    這篇文章主要介紹了keras 指定程序在某塊卡上訓(xùn)練實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • 3行Python代碼實現(xiàn)剪輯音樂

    3行Python代碼實現(xiàn)剪輯音樂

    你以為剪輯音樂要很久嗎?其余3行語句Python就能瞬間搞定。本文就來詳細(xì)為大家講講實現(xiàn)的步驟,文中的示例代碼講解詳細(xì),感興趣的可以動手嘗試一下
    2022-06-06
  • python 網(wǎng)絡(luò)編程常用代碼段

    python 網(wǎng)絡(luò)編程常用代碼段

    這篇文章主要介紹了python 網(wǎng)絡(luò)編程常用代碼段,需要的朋友可以參考下
    2016-08-08
  • Python3 ffmpeg視頻轉(zhuǎn)換工具使用方法解析

    Python3 ffmpeg視頻轉(zhuǎn)換工具使用方法解析

    這篇文章主要介紹了Python3 ffmpeg視頻轉(zhuǎn)換工具使用方法解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-08-08
  • python3列表刪除大量重復(fù)元素remove()方法的問題詳解

    python3列表刪除大量重復(fù)元素remove()方法的問題詳解

    這篇文章主要給大家介紹了關(guān)于python3列表刪除大量重復(fù)元素remove()方法的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2021-01-01
  • Python實現(xiàn)自定義異常堆棧信息的示例代碼

    Python實現(xiàn)自定義異常堆棧信息的示例代碼

    當(dāng)我們的程序報錯時,解釋器會將整個異常的堆棧信息全部輸出出來。解釋器會將異常產(chǎn)生的整個調(diào)用鏈都給打印出來,那么問題來了,我們能不能自定義這些報錯信息呢?本文就來為大家詳細(xì)講講
    2022-07-07
  • 簡單有效上手Python3異步asyncio問題

    簡單有效上手Python3異步asyncio問題

    這篇文章主要介紹了簡單有效上手Python3異步asyncio問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-01-01

最新評論