Pandas去除重復(fù)項(xiàng)函數(shù)詳解drop_duplicates()
drop_duplicates函數(shù)用途
pandas中的drop_duplicates()函數(shù)
可以通過(guò)SQL中關(guān)鍵字distinct的用法來(lái)理解
根據(jù)指定的字段對(duì)數(shù)據(jù)集進(jìn)行去重處理
drop_duplicates()函數(shù)的具體參數(shù)
用法:
DataFrame.drop_duplicates(subset=None, keep=‘first', inplace=False)
參數(shù)說(shuō)明:
參數(shù) | 說(shuō)明 |
---|---|
subset | 根據(jù)指定的列名進(jìn)行去重,默認(rèn)整個(gè)數(shù)據(jù)集 |
keep | 可選{‘first’, ‘last’, False},默認(rèn)first,即默認(rèn)保留第一次出現(xiàn)的重復(fù)值,并刪去其他重復(fù)的數(shù)據(jù),F(xiàn)alse是指刪去所有重復(fù)數(shù)據(jù)。 |
inplace | 是否對(duì)數(shù)據(jù)集本身進(jìn)行修改,默認(rèn)False |
drop_duplicates用法舉例
根據(jù)指定字段進(jìn)行去重
保留第一次出現(xiàn)的數(shù)據(jù)
import pandas as pd #創(chuàng)建數(shù)據(jù)框 df=pd.DataFrame({ 'a':[1,2,4,3,3,3,4], 'b':[2,3,3,4,4,5,3] }) print('去重前:\n',df) #根據(jù)字段a進(jìn)行去重,保留第一次出現(xiàn)的數(shù)據(jù) df.drop_duplicates(['a'],keep='first',inplace=True) print('去重后:\n',df) >>> 去重前: a b 0 1 2 1 2 3 2 4 3 3 3 4 4 3 4 5 3 5 6 4 3 去重后: a b 0 1 2 1 2 3 2 4 3 3 3 4
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python隨機(jī)數(shù)種子(random seed)的設(shè)置小結(jié)
隨機(jī)數(shù)種子是控制偽隨機(jī)數(shù)生成器的初始值,通過(guò)設(shè)置相同的種子,可以確保隨機(jī)數(shù)序列的一致性,本文主要介紹了Python隨機(jī)數(shù)種子(random seed)的設(shè)置,感興趣的可以了解一下2025-03-03解析Python中的__getitem__專(zhuān)有方法
__getitem__是Python雙下劃線(xiàn)包圍的special method之一,這里我們就來(lái)解析Python中的__getitem__專(zhuān)有方法的使用,需要的朋友可以參考下:2016-06-06Python?pydash庫(kù)處理大規(guī)模數(shù)據(jù)集執(zhí)行復(fù)雜操作
在數(shù)據(jù)處理和分析領(lǐng)域,Python一直是一種強(qiáng)大的編程語(yǔ)言,然而,在處理大規(guī)模數(shù)據(jù)集和執(zhí)行復(fù)雜操作時(shí),有時(shí)候需要更高效的工具,在本文中,我們將深入探討pydash庫(kù),這是一個(gè)專(zhuān)注于提高Python代碼性能的工具2023-12-12如何讀取.npy文件以及如何實(shí)現(xiàn)將數(shù)組保存為圖片
這篇文章主要介紹了如何讀取.npy文件以及如何實(shí)現(xiàn)將數(shù)組保存為圖片問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-02-02Python基礎(chǔ)之python循環(huán)控制語(yǔ)句break/continue詳解
Python中提供了兩個(gè)關(guān)鍵字用來(lái)控制循環(huán)語(yǔ)句,分別是break和continue,接下來(lái)通過(guò)兩個(gè)案例來(lái)區(qū)分這兩個(gè)控制語(yǔ)句的不同,感興趣的朋友一起看看吧2021-09-09Python?虛擬環(huán)境的價(jià)值和常用命令詳解
在實(shí)際項(xiàng)目開(kāi)發(fā)中,我們通常會(huì)根據(jù)自己的需求去下載各種相應(yīng)的框架庫(kù),如Scrapy、Beautiful?Soup等,但是可能每個(gè)項(xiàng)目使用的框架庫(kù)并不一樣,或使用框架的版本不一樣,今天給大家分享下Python?虛擬環(huán)境的價(jià)值和常用命令,感興趣的朋友一起看看吧2022-05-05