欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas去除重復(fù)項(xiàng)函數(shù)詳解drop_duplicates()

 更新時(shí)間:2024年02月20日 17:01:28   作者:ckSpark  
這篇文章主要介紹了Pandas去除重復(fù)項(xiàng)函數(shù)drop_duplicates(),具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教

drop_duplicates函數(shù)用途

pandas中的drop_duplicates()函數(shù)

可以通過(guò)SQL中關(guān)鍵字distinct的用法來(lái)理解

根據(jù)指定的字段對(duì)數(shù)據(jù)集進(jìn)行去重處理

drop_duplicates()函數(shù)的具體參數(shù)

用法:

DataFrame.drop_duplicates(subset=None, keep=‘first', inplace=False)

參數(shù)說(shuō)明:

參數(shù)說(shuō)明
subset根據(jù)指定的列名進(jìn)行去重,默認(rèn)整個(gè)數(shù)據(jù)集
keep可選{‘first’, ‘last’, False},默認(rèn)first,即默認(rèn)保留第一次出現(xiàn)的重復(fù)值,并刪去其他重復(fù)的數(shù)據(jù),F(xiàn)alse是指刪去所有重復(fù)數(shù)據(jù)。
inplace是否對(duì)數(shù)據(jù)集本身進(jìn)行修改,默認(rèn)False

drop_duplicates用法舉例

根據(jù)指定字段進(jìn)行去重

保留第一次出現(xiàn)的數(shù)據(jù)

import pandas as pd
#創(chuàng)建數(shù)據(jù)框
df=pd.DataFrame({
    'a':[1,2,4,3,3,3,4],
    'b':[2,3,3,4,4,5,3]
})
print('去重前:\n',df)

#根據(jù)字段a進(jìn)行去重,保留第一次出現(xiàn)的數(shù)據(jù)
df.drop_duplicates(['a'],keep='first',inplace=True)
print('去重后:\n',df)

>>>
去重前:
    a  b
0  1  2
1  2  3
2  4  3
3  3  4
4  3  4
5  3  5
6  4  3
去重后:
    a  b
0  1  2
1  2  3
2  4  3
3  3  4

總結(jié)

以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • python實(shí)現(xiàn)滑雪者小游戲

    python實(shí)現(xiàn)滑雪者小游戲

    這篇文章主要為大家詳細(xì)介紹了python實(shí)現(xiàn)滑雪者小游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2020-02-02
  • Python隨機(jī)數(shù)種子(random seed)的設(shè)置小結(jié)

    Python隨機(jī)數(shù)種子(random seed)的設(shè)置小結(jié)

    隨機(jī)數(shù)種子是控制偽隨機(jī)數(shù)生成器的初始值,通過(guò)設(shè)置相同的種子,可以確保隨機(jī)數(shù)序列的一致性,本文主要介紹了Python隨機(jī)數(shù)種子(random seed)的設(shè)置,感興趣的可以了解一下
    2025-03-03
  • 解析Python中的__getitem__專(zhuān)有方法

    解析Python中的__getitem__專(zhuān)有方法

    __getitem__是Python雙下劃線(xiàn)包圍的special method之一,這里我們就來(lái)解析Python中的__getitem__專(zhuān)有方法的使用,需要的朋友可以參考下:
    2016-06-06
  • python中有幫助函數(shù)嗎

    python中有幫助函數(shù)嗎

    在本篇文章里小編給大家分享的是一篇關(guān)于python幫助函數(shù)詳解內(nèi)容,有興趣的朋友們可以學(xué)習(xí)下。
    2020-06-06
  • Python?pydash庫(kù)處理大規(guī)模數(shù)據(jù)集執(zhí)行復(fù)雜操作

    Python?pydash庫(kù)處理大規(guī)模數(shù)據(jù)集執(zhí)行復(fù)雜操作

    在數(shù)據(jù)處理和分析領(lǐng)域,Python一直是一種強(qiáng)大的編程語(yǔ)言,然而,在處理大規(guī)模數(shù)據(jù)集和執(zhí)行復(fù)雜操作時(shí),有時(shí)候需要更高效的工具,在本文中,我們將深入探討pydash庫(kù),這是一個(gè)專(zhuān)注于提高Python代碼性能的工具
    2023-12-12
  • ?python 中的條件判斷語(yǔ)句的使用介紹

    ?python 中的條件判斷語(yǔ)句的使用介紹

    這篇文章主要介紹了?python 中的條件判斷語(yǔ)句的使用,主要學(xué)習(xí)內(nèi)容有封裝過(guò)于復(fù)雜的邏輯判斷,不同分支下的重復(fù)代碼等,更多相關(guān)內(nèi)容,需要的小伙伴可以參考下面文章詳細(xì)介紹內(nèi)容
    2022-03-03
  • 如何讀取.npy文件以及如何實(shí)現(xiàn)將數(shù)組保存為圖片

    如何讀取.npy文件以及如何實(shí)現(xiàn)將數(shù)組保存為圖片

    這篇文章主要介紹了如何讀取.npy文件以及如何實(shí)現(xiàn)將數(shù)組保存為圖片問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2024-02-02
  • Python基礎(chǔ)之python循環(huán)控制語(yǔ)句break/continue詳解

    Python基礎(chǔ)之python循環(huán)控制語(yǔ)句break/continue詳解

    Python中提供了兩個(gè)關(guān)鍵字用來(lái)控制循環(huán)語(yǔ)句,分別是break和continue,接下來(lái)通過(guò)兩個(gè)案例來(lái)區(qū)分這兩個(gè)控制語(yǔ)句的不同,感興趣的朋友一起看看吧
    2021-09-09
  • Python?虛擬環(huán)境的價(jià)值和常用命令詳解

    Python?虛擬環(huán)境的價(jià)值和常用命令詳解

    在實(shí)際項(xiàng)目開(kāi)發(fā)中,我們通常會(huì)根據(jù)自己的需求去下載各種相應(yīng)的框架庫(kù),如Scrapy、Beautiful?Soup等,但是可能每個(gè)項(xiàng)目使用的框架庫(kù)并不一樣,或使用框架的版本不一樣,今天給大家分享下Python?虛擬環(huán)境的價(jià)值和常用命令,感興趣的朋友一起看看吧
    2022-05-05
  • Python的Django框架使用入門(mén)指引

    Python的Django框架使用入門(mén)指引

    這篇文章主要介紹了Python的Django框架使用入門(mén)指引,本文來(lái)自于IBM官方網(wǎng)站技術(shù)文檔,需要的朋友可以參考下
    2015-04-04

最新評(píng)論