Pandas之使用drop_duplicates:去除重復(fù)項(xiàng)
前言
本文,我們講述Pandas如何去除重復(fù)項(xiàng)的操作,我們選擇一個(gè)評(píng)價(jià)數(shù)據(jù)集來(lái)演示如何刪除特定列上的重復(fù)項(xiàng),如何刪除重復(fù)項(xiàng)并保留最后一次出現(xiàn),以及drop_duplicates的默認(rèn)用法
方法
DataFrame.drop_duplicates(subset=None, keep='first', inplace=False)
返回值
這個(gè)drop_duplicate方法是對(duì)DataFrame格式的數(shù)據(jù),去除特定列下面的重復(fù)行。
返回刪除重復(fù)行的 DataFrame。
考慮某些列是可選的。
索引(包括時(shí)間索引)將被忽略。
參數(shù)
返回DataFrame格式的數(shù)據(jù)。
- subset : column label or sequence of labels, optional
- 用來(lái)指定特定的列,默認(rèn)所有列
- keep : {‘first’, ‘last’, False}, default ‘first’
- 刪除重復(fù)項(xiàng)并保留第一次出現(xiàn)的項(xiàng)
- inplace : boolean, default False
- 是直接在原來(lái)數(shù)據(jù)上修改還是保留一個(gè)副本
實(shí)驗(yàn)
構(gòu)建包含拉面評(píng)級(jí)的數(shù)據(jù)集
df = pd.DataFrame({ 'brand': ['Yum Yum', 'Yum Yum', 'Indomie', 'Indomie', 'Indomie'], 'style': ['cup', 'cup', 'cup', 'pack', 'pack'], 'rating': [4, 4, 3.5, 15, 5] })
數(shù)據(jù)集數(shù)據(jù)格式
df
brand style rating
0 Yum Yum cup 4.0
1 Yum Yum cup 4.0
2 Indomie cup 3.5
3 Indomie pack 15.0
4 Indomie pack 5.0
默認(rèn)情況下,它會(huì)根據(jù)所有列刪除重復(fù)的行
df.drop_duplicates()
brand style rating
0 Yum Yum cup 4.0
2 Indomie cup 3.5
3 Indomie pack 15.0
4 Indomie pack 5.0
要?jiǎng)h除特定列上的重復(fù)項(xiàng),請(qǐng)使用subset
df.drop_duplicates(subset=['brand'])
brand style rating
0 Yum Yum cup 4.0
2 Indomie cup 3.5
要?jiǎng)h除重復(fù)項(xiàng)并保留最后一次出現(xiàn),請(qǐng)使用 keep
df.drop_duplicates(subset=['brand', 'style'], keep='last')
brand style rating
1 Yum Yum cup 4.0
2 Indomie cup 3.5
4 Indomie pack 5.0
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
- Pandas去除重復(fù)項(xiàng)函數(shù)詳解drop_duplicates()
- Pandas 中的 drop_duplicates()詳解
- pandas重復(fù)行刪除操作df.drop_duplicates和df.duplicated的區(qū)別
- Python?Pandas中DataFrame.drop_duplicates()刪除重復(fù)值詳解
- pandas.DataFrame.drop_duplicates 用法介紹
- 詳解pandas使用drop_duplicates去除DataFrame重復(fù)項(xiàng)參數(shù)
- Pandas之drop_duplicates:去除重復(fù)項(xiàng)方法
- pandas的drop_duplicates無(wú)法去重問(wèn)題解決
相關(guān)文章
python 消費(fèi) kafka 數(shù)據(jù)教程
今天小編就為大家分享一篇python 消費(fèi) kafka 數(shù)據(jù)教程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-12-12python動(dòng)畫manim中的顏色ManimColor的使用方法詳解
這篇文章主要介紹了python動(dòng)畫manim中的顏色ManimColor的使用方法,本文通過(guò)實(shí)例圖文展示給大家介紹的非常詳細(xì),感興趣的朋友跟隨小編一起看看吧2024-08-08自動(dòng)轉(zhuǎn)換Python代碼為HTML界面的GUI庫(kù)remi使用探究
這篇文章主要為大家介紹了自動(dòng)轉(zhuǎn)換Python代碼為HTML界面的GUI庫(kù)remi使用探究,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01python nohup 實(shí)現(xiàn)遠(yuǎn)程運(yùn)行不宕機(jī)操作
這篇文章主要介紹了python nohup 實(shí)現(xiàn)遠(yuǎn)程運(yùn)行不宕機(jī)操作,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-04-04python計(jì)算機(jī)視覺(jué)實(shí)現(xiàn)全景圖像拼接示例
這篇文章主要為大家介紹了python計(jì)算機(jī)視覺(jué)實(shí)現(xiàn)全景圖像拼接示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2022-05-05在Python的Flask框架中實(shí)現(xiàn)單元測(cè)試的教程
這篇文章主要介紹了在Python的Flask框架中實(shí)現(xiàn)單元測(cè)試的教程,屬于自動(dòng)化部署的方面,可以給debug工作帶來(lái)諸多便利,需要的朋友可以參考下2015-04-04