快捷導(dǎo)航

pandas去重復(fù)行并分類匯總的實現(xiàn)方法

更新時間：2019年01月29日 11:44:16 作者：qq_24499417

這篇文章主要介紹了pandas去重復(fù)行并分類匯總的實現(xiàn)方法，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

今天主要記錄一下pandas去重復(fù)行以及如何分類匯總。以下面的數(shù)據(jù)幀作為一個例子：

import pandas as pd
data=pd.DataFrame({'產(chǎn)品':['A','A','A','A'],'數(shù)量':[50,50,30,30]})

pandas判斷dataframe是否含有重復(fù)行數(shù)據(jù)用：df.duplicated()

第一次出現(xiàn)的數(shù)據(jù)為False.重復(fù)的數(shù)據(jù)行就被記錄為True。

去掉重復(fù)行數(shù)據(jù)使用data.drop_duplicates().

可以看到索引亂了,我們使用data.reset_index(),里面的參數(shù)drop=True，表明要舍掉原來的索引，不然的話原來的索引會保留下來。

分類匯總主要使用groupby(表明匯總的條件列)以及agg(要匯總的字段/列以及匯總的方式：求和還是最大最小值或者計數(shù))。完整代碼如下圖

# -*- coding: utf-8 -*-
"""
Created on Fri Jul 20 09:08:10 2018
@author: FanXiaoLei
"""
import pandas as pd
data=pd.DataFrame({'產(chǎn)品':['A','A','A','A'],'數(shù)量':[50,50,30,30]})
if data.duplicated:
  dataA=data.drop_duplicates().reset_index(drop=True)
print(dataA)
dataB=dataA.groupby(by='產(chǎn)品').agg({'數(shù)量':sum})
print('數(shù)據(jù)匯總結(jié)果:')
print(dataB)

結(jié)果展示如下圖：

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

linux環(huán)境部署清華大學(xué)大模型最新版 chatglm2-6b 圖文教程
這篇文章主要介紹了linux環(huán)境部署清華大學(xué)大模型最新版 chatglm2-6b ,結(jié)合實例形式詳細(xì)分析了Linux環(huán)境下chatglm2-6b部署相關(guān)操作步驟與注意事項,需要的朋友可以參考下
2023-07-07
python爬蟲_實現(xiàn)校園網(wǎng)自動重連腳本的教程
下面小編就為大家分享一篇python爬蟲_實現(xiàn)校園網(wǎng)自動重連腳本的教程，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-04-04
python目錄與文件名操作例子
這篇文章主要介紹了python目錄與文件名操作例子,需要的朋友可以參考下
2016-08-08
使用PyInstaller?打包配置文件
這篇文章主要介紹了使用PyInstaller?打包配置文件，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2022-02-02
Django如何防止定時任務(wù)并發(fā)淺析
這篇文章主要給大家介紹了關(guān)于Django如何防止定時任務(wù)并發(fā)的相關(guān)資料，文中通過示例代碼介紹的非常詳細(xì)，對大家學(xué)習(xí)或者使用Django具有一定的參考學(xué)習(xí)價值，需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧
2019-05-05
Python自定義sorted排序?qū)崿F(xiàn)方法詳解
這篇文章主要介紹了Python自定義sorted排序?qū)崿F(xiàn)方法詳解,文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
2020-09-09
Python爬蟲爬取網(wǎng)站圖片
這篇文章主要介紹了Python爬蟲爬取網(wǎng)站圖片,此次python3主要用requests，解析圖片網(wǎng)址主要用beautiful soup，可以基本完成爬取圖片功能,需要的朋友可以參考一下
2022-01-01
Python實現(xiàn)人臉識別的詳細(xì)圖文教程
人臉識別是人工智能的一個重要應(yīng)用,下面這篇文章主要給大家介紹了關(guān)于Python實現(xiàn)人臉識別的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下
2022-08-08
TensorFlow基于MNIST數(shù)據(jù)集實現(xiàn)車牌識別(初步演示版)
這篇文章主要介紹了TensorFlow基于MNIST數(shù)據(jù)集實現(xiàn)車牌識別(初步演示版)，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
2019-08-08
一文帶你了解Python中的雙下方法
Python中有一些特殊方法的方法名都是以雙下劃線開始和結(jié)束，所以又被稱為雙下方法。本文就來為大家詳細(xì)講講Python中的雙下方法的使用，感興趣的可以了解一下
2022-07-07