Pandas 實(shí)現(xiàn)分組計(jì)數(shù)且不計(jì)重復(fù)
在對dataframe進(jìn)行分析的時(shí)候會(huì)遇到需要分組計(jì)數(shù),計(jì)數(shù)的column中屬性有重復(fù),但又需要僅對不重復(fù)的項(xiàng)計(jì)數(shù)(即重復(fù)N次出現(xiàn)的項(xiàng)只計(jì)1次)。
函數(shù)如下:
dataframe.groupby([‘分組的列名']).需要計(jì)數(shù)的列名.nunique()
舉例:
數(shù)組“data”如下:
StoreID | Sales | SalesDate | Channel |
---|---|---|---|
A | 100 | 2018/1/1 | 01 |
A | 90 | 2018/1/1 | 02 |
A | 110 | 2018/1/2 | 01 |
B | 82.2 | 2018/1/1 | 01 |
B | 90 | 2018/1/2 | 02 |
如果要按StoreID來統(tǒng)計(jì)每一家店的營業(yè)日期數(shù)(可以通過不計(jì)重復(fù)的count “SalesDate”來完成)
代碼如下:
data.groupby(['StoreID']).SalesDate.nunique()
補(bǔ)充:pandas 統(tǒng)計(jì)分組內(nèi)不重復(fù)計(jì)數(shù)
在數(shù)據(jù)分析中的數(shù)據(jù)處理過程中,經(jīng)常需要對數(shù)據(jù)進(jìn)行分組計(jì)數(shù),看下下面這組數(shù)據(jù)
數(shù)據(jù)中name 為C 的有三行,其中有2個(gè)code是重復(fù)的
目標(biāo):
按name 分組,統(tǒng)計(jì)每組中code的不重復(fù)數(shù)量
df.groupby('name')['code'].nunique() # 以name 分組后,統(tǒng)計(jì)code的不重復(fù)數(shù)目
結(jié)果如下:
排序
df.groupby('name')['code'].nunique().sort_values(ascending=False) # 以name 分組后,統(tǒng)計(jì)code的不重復(fù)數(shù)目
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教。
相關(guān)文章
Python+matplotlib實(shí)現(xiàn)餅圖的繪制
Matplotlib是一個(gè)Python的2D繪圖庫,它以各種硬拷貝格式和跨平臺(tái)的交互式環(huán)境生成出版質(zhì)量級別的圖形。本文將利用Matplotlib庫繪制餅圖,感興趣的可以了解一下2022-03-03解決PIP安裝第三方庫報(bào)錯(cuò)SSL: CERTIFICATE_VERIFY_FAILED問題
這篇文章主要介紹了解決PIP安裝第三方庫報(bào)錯(cuò)SSL: CERTIFICATE_VERIFY_FAILED問題,具有很好的參考價(jià)值,希望對大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-01-01python跳過第一行快速讀取文件內(nèi)容的實(shí)例
今天小編就為大家分享一篇python跳過第一行快速讀取文件內(nèi)容的實(shí)例,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07Python使用sqlalchemy實(shí)現(xiàn)連接數(shù)據(jù)庫的幫助類
這篇文章主要為大家詳細(xì)介紹了Python如何使用sqlalchemy實(shí)現(xiàn)連接數(shù)據(jù)庫的幫助類,文中的示例代碼講解詳細(xì),具有一定的借鑒價(jià)值,需要的可以參考下2024-02-02解決Tensorflow安裝成功,但在導(dǎo)入時(shí)報(bào)錯(cuò)的問題
今天小編就為大家分享一篇解決Tensorflow安裝成功,但在導(dǎo)入時(shí)報(bào)錯(cuò)的問題,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-06-06在Python運(yùn)行時(shí)動(dòng)態(tài)查看進(jìn)程內(nèi)部信息的方法
今天小編就為大家分享一篇在Python運(yùn)行時(shí)動(dòng)態(tài)查看進(jìn)程內(nèi)部信息的方法,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-02-02Python PyQt4實(shí)現(xiàn)QQ抽屜效果
這篇文章主要為大家詳細(xì)介紹了Python PyQt4實(shí)現(xiàn)QQ抽屜效果,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-04-04