詳解python pandas 分組統計的方法

更新時間：2019年07月30日 09:10:46 作者：kingsam_

這篇文章主要介紹了詳解pandas python 分組統計的方法，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

首先，看看本文所面向的應用場景：我們有一個數據集df，現在想統計數據中某一列每個元素的出現次數。這個在我們前面文章《如何畫直方圖》中已經介紹了方法，利用value_counts()就可以實現（具體回看文章）

但是，現在，我們考慮另外一個場景，我們假如要想統計其中兩列元素出現次數呢？舉個栗子：

在df數據集中，如果我們想統計A、B兩列的元素的出現情況，也就是說，得到如下表。

從上面的最后一列可以看到，在A、B兩列中，1 2 出現了2次，1 4 出現1次，1 6出現1次，2 3出現了2次， 2 4 出現1次， 3 1出現了1次

具體實現的代碼：

import pandas as pd
df=pd.DataFrame([[1,2,2],[1,4,5],[1,2,4],[1,6,3],[2,3,1],[2,4,1],[2,3,5],[3,1,1]],columns=['A','B','C'])

gp=df.groupby(by=['A','B'])
gp.size()

所以，如果想統計更多列，只要在groupby()中的by參數添加就可以，例如統計3列。

gp=df.groupby(by=['A','B','C'])

由gp.size()得到的是可以mulitiindex Series。

下面，要轉化成DataFrame的結構。

newdf=gp.size()
newdf.reset_index(name='times')

其中name中參數就是我們可以為最后一列添加新的名字，例如這里的“times”

這個時候newdf已經是DataFrame的類型了。

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

python直接調用和使用swig法方調用c++庫
這篇文章主要介紹了python直接調用和使用swig法方調用c++庫，c++運算速度快于python，python簡單易寫。很多時候對于已有的c++代碼也不想用python重寫，此時就自然而然地想到用python調用c或者c++，兩全其美,需要的朋友可以參考一下
2022-03-03
keras讀取h5文件load_weights、load代碼操作
這篇文章主要介紹了keras讀取h5文件load_weights、load代碼操作，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-06-06
Python機器學習庫sklearn(scikit-learn)的基礎知識和高級用法
Scikit-Learn是 Python 最流行的機器學習庫之一，它提供了各種工具來實現、評估和探索各種學習算法，用于,各種機器學習任務,在本教程中，我們將介紹 Scikit-Learn 的基礎知識和一些高級用法，并提供一些實例代碼來幫助我們更好地理解
2023-07-07
python實現圖像隨機裁剪的示例代碼
這篇文章主要介紹了python實現圖像隨機裁剪的示例代碼，幫助大家更好的理解和使用python處理圖片，感興趣的朋友可以了解下
2020-12-12
python在windows下實現ping操作并接收返回信息的方法
這篇文章主要介紹了python在windows下實現ping操作并接收返回信息的方法,實例分析了Python實現ping操作的技巧,具有一定參考借鑒價值,需要的朋友可以參考下
2015-03-03
Python開發(fā)的HTTP庫requests詳解
Requests是用Python語言編寫，基于urllib，采用Apache2 Licensed開源協議的HTTP庫。它比urllib更加方便，可以節(jié)約我們大量的工作，完全滿足HTTP測試需求。Requests的哲學是以PEP 20 的習語為中心開發(fā)的，所以它比urllib更加Pythoner。更重要的一點是它支持Python3哦！
2017-08-08
Python帶你從淺入深探究Tuple(基礎篇)
大家都知道Python中的元組容器序列（tuple）與列表容器序列（list）有很多相同之處，他們雖然都可以存儲任意類型的數據，但是一個元組定義好之后就不能夠再進行修改，對Python Tuple相關知識感興趣的朋友一起看看吧
2021-05-05
python逆向之pyc反編譯的使用教程
python代碼的運行是靠python解析器將源代碼轉換為字節(jié)碼,本文主要介紹了python逆向之pyc反編譯的使用教程,具有一定的參考價值,感興趣的可以了解一下
2024-03-03
Python第三方庫undetected_chromedriver的使用
這篇文章主要給大家介紹了關于Python第三方庫undetected_chromedriver的使用方法,文中通過實例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2023-01-01
利用PyCharm Profile分析異步爬蟲效率詳解
這篇文章主要給大家介紹了關于如何利用PyCharm Profile分析異步爬蟲效率的相關資料，文中通過示例代碼介紹的非常詳細，對大家學習或者使用PyCharm具有一定的參考學習價值，需要的朋友們下面來一起學習學習吧
2019-05-05

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

詳解python pandas 分組統計的方法

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具