pandas去重復(fù)行并分類匯總的實現(xiàn)方法
今天主要記錄一下pandas去重復(fù)行以及如何分類匯總。以下面的數(shù)據(jù)幀作為一個例子:
import pandas as pd
data=pd.DataFrame({'產(chǎn)品':['A','A','A','A'],'數(shù)量':[50,50,30,30]})
pandas判斷dataframe是否含有重復(fù)行數(shù)據(jù)用:df.duplicated()

第一次出現(xiàn)的數(shù)據(jù)為False.重復(fù)的數(shù)據(jù)行就被記錄為True。
去掉重復(fù)行數(shù)據(jù)使用data.drop_duplicates().

可以看到索引亂了,我們使用data.reset_index(),里面的參數(shù)drop=True,表明要舍掉原來的索引,不然的話原來的索引會保留下來。

分類匯總主要使用groupby(表明匯總的條件列)以及agg(要匯總的字段/列以及匯總的方式:求和還是最大最小值或者計數(shù))。完整代碼如下圖
# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'產(chǎn)品':['A','A','A','A'],'數(shù)量':[50,50,30,30]})
if data.duplicated:
dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='產(chǎn)品').agg({'數(shù)量':sum})
print('數(shù)據(jù)匯總結(jié)果:')
print(dataB)
結(jié)果展示如下圖:

以上就是本文的全部內(nèi)容,希望對大家的學(xué)習(xí)有所幫助,也希望大家多多支持腳本之家。
相關(guān)文章
linux環(huán)境部署清華大學(xué)大模型最新版 chatglm2-6b 圖文教程
這篇文章主要介紹了linux環(huán)境部署清華大學(xué)大模型最新版 chatglm2-6b ,結(jié)合實例形式詳細(xì)分析了Linux環(huán)境下chatglm2-6b部署相關(guān)操作步驟與注意事項,需要的朋友可以參考下2023-07-07
python爬蟲_實現(xiàn)校園網(wǎng)自動重連腳本的教程
下面小編就為大家分享一篇python爬蟲_實現(xiàn)校園網(wǎng)自動重連腳本的教程,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-04-04
Python自定義sorted排序?qū)崿F(xiàn)方法詳解
這篇文章主要介紹了Python自定義sorted排序?qū)崿F(xiàn)方法詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2020-09-09
TensorFlow基于MNIST數(shù)據(jù)集實現(xiàn)車牌識別(初步演示版)
這篇文章主要介紹了TensorFlow基于MNIST數(shù)據(jù)集實現(xiàn)車牌識別(初步演示版),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08

