快捷導(dǎo)航

pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)

更新時(shí)間：2021年02月20日 12:01:12 作者：Mr番茄蛋

這篇文章主要介紹了pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

本文主要介紹了pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)，分享給大家，具體如下：

from pandas import DataFrame

df = DataFrame({'key1':['a','a','b','b','a','a'],
        'key2':['one','two','one','two','one','one'],
        'data1':[1,2,3,2,1,1],
        # 'data2':np.random.randn(5)
        })
# 打印數(shù)據(jù)框
print(df)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two
# 4   1  a one
# 5   1  a one

# 重復(fù)項(xiàng)
print(df[df.duplicated()])
#  data1 key1 key2
# 4   1  a one
# 5   1  a one

# 統(tǒng)計(jì)重復(fù)值
dup=df[df.duplicated()].count()
print(dup) # 最后兩項(xiàng)重復(fù)
# data1  2
# key1   2
# key2   2

# 去除重復(fù)項(xiàng)
nodup=df[-df.duplicated()]
print(nodup)
#  data1 key1 key2
# 0   1  a one
# 1   2  a two
# 2   3  b one
# 3   2  b two

pandas 中 dataframe 重復(fù)元素個(gè)數(shù)的獲取

方法有二：

1. 在調(diào)用duplicated方法后，非重復(fù)的元素會(huì)被標(biāo)記為False，而重復(fù)的元素會(huì)被標(biāo)記為True

count = 0
for i in users_info['user_id'].duplicated():
  if i == True:
    count = count + 1
count

【注1】users_info為一個(gè)dataframe框，user_id為其中一列

【注2】duplicated( )方法只會(huì)把重復(fù)的元素標(biāo)記為True,而不會(huì)標(biāo)記被重復(fù)的元素

2.這行代碼的速度更快，drop_duplicates(['user_id'])方法為刪除user_id列中相同的元素

users_info.shape[0] - users_info.drop_duplicates(['user_id']).shape[0]

【注】shape[0] 為獲取行數(shù)

到此這篇關(guān)于pandas統(tǒng)計(jì)重復(fù)值次數(shù)的方法實(shí)現(xiàn)的文章就介紹到這了,更多相關(guān)pandas統(tǒng)計(jì)重復(fù)值次數(shù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

相關(guān)文章

PyCharm永久激活方式(推薦)
這篇文章主要介紹了PyCharm永久激活方式，本文通過圖文并茂的方式給大家介紹的非常詳細(xì)，對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
2020-03-03
關(guān)于Python中的元組介紹
大家好，本篇文章主要講的是關(guān)于Python中的元組介紹，感興趣的同學(xué)趕快來看一看吧，對你有幫助的話記得收藏一下，方便下次瀏覽
2021-12-12
TensorFlow人工智能學(xué)習(xí)數(shù)據(jù)填充復(fù)制實(shí)現(xiàn)示例
這篇文章主要為大家介紹了TensorFlow人工智能學(xué)習(xí)如何進(jìn)行數(shù)據(jù)填充復(fù)制的實(shí)現(xiàn)示例，有需要的朋友可以借鑒參考下，希望能夠有所幫助
2021-11-11
詳解django自定義中間件處理
這篇文章主要介紹了詳解django自定義中間件處理，小編覺得挺不錯(cuò)的，現(xiàn)在分享給大家，也給大家做個(gè)參考。一起跟隨小編過來看看吧
2018-11-11
python爬蟲基于requests模塊發(fā)起ajax的get請求實(shí)現(xiàn)解析
這篇文章主要介紹了python爬蟲基于requests模塊發(fā)起ajax的get請求實(shí)現(xiàn)解析,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2019-08-08
Java byte數(shù)組操縱方式代碼實(shí)例解析
這篇文章主要介紹了Java byte數(shù)組操縱方式代碼實(shí)例解析,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2020-07-07
python字符串Intern機(jī)制詳解
這篇文章主要介紹了python字符串Intern機(jī)制詳解,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下
2019-07-07
PyTorch搭建LSTM實(shí)現(xiàn)多變量多步長時(shí)序負(fù)荷預(yù)測
這篇文章主要為大家介紹了PyTorch搭建LSTM實(shí)現(xiàn)多變量多步長時(shí)序負(fù)荷預(yù)測，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步，早日升職加薪
2022-05-05
Python自動(dòng)化之批量處理工作簿和工作表
今天給大家整理了如何使用Python實(shí)現(xiàn)批量處理工作簿和工作表,文中有非常詳細(xì)的介紹及代碼示例,對小伙伴們很有幫助,需要的朋友可以參考下
2021-06-06
這篇文章主要介紹了python字典排序?qū)崿F(xiàn)方法,實(shí)例分析了Python字典排序的相關(guān)技巧,需要的朋友可以參考下
2015-05-05