欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas中的unique()和nunique()區(qū)別詳解

 更新時(shí)間:2022年08月08日 11:04:45   作者:追風(fēng)少年?  
Pandas中Series和DataFrame的兩種數(shù)據(jù)類型中都有nunique()和unique()方法,本文詳細(xì)的介紹了兩者的區(qū)別,具有一定的參考價(jià)值,感興趣的可以了解一下

Pandas中Series和DataFrame的兩種數(shù)據(jù)類型中都有nunique()和unique()方法。這兩個(gè)方法作用很簡(jiǎn)單,都是求Series或Pandas中的不同值。而unique()方法返回的是去重之后的不同值,而nunique()方法則直接放回不同值的個(gè)數(shù)。

具體如下:

如果Series或DataFrame中沒(méi)有None值,則unique()方法返回的序列數(shù)據(jù)的長(zhǎng)度等于nunique()方法的返回值(如上述代碼中所展示的)。則當(dāng)Series或DataFrame中有None值時(shí),這兩個(gè)就不一定相等了。具體如下:

從上述結(jié)果可知, nunique()可以通過(guò)參數(shù)dropna來(lái)自定義設(shè)置在統(tǒng)計(jì)不同值過(guò)程中是否需要包含None值,而unique()方法中沒(méi)有可設(shè)置的參數(shù),該方法在統(tǒng)計(jì)時(shí)無(wú)法排除None值。 

1 unique()

統(tǒng)計(jì)list中的不同值時(shí),返回的是array.它有三個(gè)參數(shù),可分別統(tǒng)計(jì)不同的量,返回的都是array.

當(dāng)list中的元素也是list時(shí),盡量不要用這種方法.

import numpy as np
a = [1,5,4,2,3,3,5]
# 返回一個(gè)array
print(np.unique(a))
# [1 2 3 4 5]
 
# 返回該元素在list中第一次出現(xiàn)的索引
print(np.unique(a,return_index=True))
# (array([1, 2, 3, 4, 5]), array([0, 3, 4, 2, 1]))
 
# 返回原list中每個(gè)元素在新的list中對(duì)應(yīng)的索引
print(np.unique(a,return_inverse=True))
# (array([1, 2, 3, 4, 5]), array([0, 4, 3, 1, 2, 2, 4]))
 
# 返回該元素在list中出現(xiàn)的次數(shù)
print(np.unique(a,return_counts=True))
# (array([1, 2, 3, 4, 5]), array([1, 1, 2, 1, 2]))
 
# 當(dāng)加參數(shù)時(shí),unique()返回的是一個(gè)tuple,這里利用了tuple的性質(zhì),即有多少個(gè)元素即可賦值給對(duì)應(yīng)的多少個(gè)變量
p,q,m,n = np.unique(a,return_index=True,return_inverse=True,return_counts=True)
print(p,q,m,n)
# [1 2 3 4 5] [0 3 4 2 1] [0 4 3 1 2 2 4] [1 1 2 1 2]
 
# 注意當(dāng)list中的元素不是數(shù)字而是list的時(shí)候,輸出的數(shù)據(jù)類型與list中元素的長(zhǎng)度有關(guān)
# 利用這種方法對(duì)list中元素去重或求里面元素的個(gè)數(shù)都不是好方法,很容易出錯(cuò) 

統(tǒng)計(jì)series中的不同值時(shí),返回的是array,它沒(méi)有其它參數(shù)

import pandas as pd
se = pd.Series([1,3,4,5,2,2,3])
print(se.unique())
# [1 3 4 5 2]

2.nunique()

可直接統(tǒng)計(jì)dataframe中每列的不同值的個(gè)數(shù),也可用于series,但不能用于list.返回的是不同值的個(gè)數(shù).

df=pd.DataFrame({'A':[0,1,1],'B':[0,5,6]})
print(df)
print(df.nunique())
#    A  B
# 0  0  0
# 1  1  5
# 2  1  6
# A    2
# B    3
# dtype: int64

也可與groupby結(jié)合使用,統(tǒng)計(jì)每個(gè)塊的不同值的個(gè)數(shù).

all_user_repay = all_user_repay.groupby(['user_id'])['listing_id'].agg(['nunique']).reset_index()
#    user_id  nunique
# 0       40        1
# 1       56        1
# 2       98        1
# 3      103        1
# 4      122        1

 到此這篇關(guān)于Pandas中的unique()和nunique()區(qū)別詳解的文章就介紹到這了,更多相關(guān)Pandas unique()和nunique()內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • python的input,print,eval函數(shù)概述

    python的input,print,eval函數(shù)概述

    這篇文章主要為大家概述了python的input,print,eval函數(shù),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助
    2022-01-01
  • Python學(xué)生信息管理系統(tǒng)修改版

    Python學(xué)生信息管理系統(tǒng)修改版

    這篇文章主要為大家詳細(xì)介紹了python學(xué)生信息管理系統(tǒng),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2018-03-03
  • django從后臺(tái)返回html代碼的實(shí)例

    django從后臺(tái)返回html代碼的實(shí)例

    這篇文章主要介紹了django從后臺(tái)返回html代碼的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2020-03-03
  • 在python中使用requests 模擬瀏覽器發(fā)送請(qǐng)求數(shù)據(jù)的方法

    在python中使用requests 模擬瀏覽器發(fā)送請(qǐng)求數(shù)據(jù)的方法

    今天小編就為大家分享一篇在python中使用requests 模擬瀏覽器發(fā)送請(qǐng)求數(shù)據(jù)的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-12-12
  • Pycharm 安裝 idea VIM插件的圖文教程詳解

    Pycharm 安裝 idea VIM插件的圖文教程詳解

    這篇文章主要介紹了Pycharm 安裝 idea VIM的教程,本文通過(guò)圖文并茂的形式給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2020-02-02
  • 詳解Pytorch自動(dòng)求導(dǎo)機(jī)制

    詳解Pytorch自動(dòng)求導(dǎo)機(jī)制

    自動(dòng)求導(dǎo)是一種計(jì)算梯度的技術(shù),它允許我們?cè)诙x模型時(shí)不需要手動(dòng)推導(dǎo)梯度計(jì)算公式,PyTorch 提供了自動(dòng)求導(dǎo)的功能,使得梯度的計(jì)算變得非常簡(jiǎn)單和高效,這篇文章主要介紹了Pytorch自動(dòng)求導(dǎo)機(jī)制詳解,需要的朋友可以參考下
    2023-07-07
  • python 獲取指定文件夾下所有文件名稱并寫入列表的實(shí)例

    python 獲取指定文件夾下所有文件名稱并寫入列表的實(shí)例

    下面小編就為大家分享一篇python 獲取指定文件夾下所有文件名稱并寫入列表的實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧
    2018-04-04
  • Python中Matplotlib的點(diǎn)、線形狀、顏色以及繪制散點(diǎn)圖

    Python中Matplotlib的點(diǎn)、線形狀、顏色以及繪制散點(diǎn)圖

    與線型圖類似的是,散點(diǎn)圖也是一個(gè)個(gè)點(diǎn)集構(gòu)成的,下面這篇文章主要給大家介紹了關(guān)于Python中Matplotlib的點(diǎn)、線形狀、顏色以及繪制散點(diǎn)圖的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),需要的朋友可以參考下
    2022-04-04
  • Python之OptionParser模塊使用詳解

    Python之OptionParser模塊使用詳解

    這篇文章主要為大家詳細(xì)介紹了Python之OptionParser模塊使用,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助
    2022-02-02
  • Flask wtforms實(shí)現(xiàn)表單驗(yàn)證使用

    Flask wtforms實(shí)現(xiàn)表單驗(yàn)證使用

    本文主要介紹了Flask wtforms實(shí)現(xiàn)表單驗(yàn)證使用,文中通過(guò)示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-08-08

最新評(píng)論