對DataFrame數(shù)據(jù)中的重復(fù)行,利用groupby累加合并的方法詳解
pandas讀取一組數(shù)據(jù),可能存在重復(fù)索引,雖然可以利用drop_duplicate直接刪除,但是會刪除重要信息。
比如同一ID用戶,多次登錄學習時間。要計算該用戶總共‘'學習時間‘',就要把重復(fù)的ID的‘'學習時間‘'累加。
可以結(jié)合groupby和sum函數(shù)完成該操作。
實例如下:
新建一個DataFrame,計算每個 id 的總共學習時間。其中 id 為one/two的存在重復(fù)學習時間。先利用 groupby 按照鍵 id 分組,然后利用sum()函數(shù)求和,即可得到每個id的總共學習時間。

以上這篇對DataFrame數(shù)據(jù)中的重復(fù)行,利用groupby累加合并的方法詳解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python實現(xiàn)將字典內(nèi)容寫入json文件
這篇文章主要為大家詳細介紹了如何利用Python語言實現(xiàn)將字典內(nèi)容寫入json文件,文中的示例代碼講解詳細,感興趣的小伙伴可以了解一下2022-08-08
使用Python中的Argparse實現(xiàn)將列表作為命令行參數(shù)傳遞
Argparse?是一個?Python?庫,用于以用戶友好的方式解析命令行參數(shù),本文我們將討論如何使用?Python?中的?Argparse?庫將列表作為命令行參數(shù)傳遞,感興趣的可以了解下2023-08-08
Keras 數(shù)據(jù)增強ImageDataGenerator多輸入多輸出實例
這篇文章主要介紹了Keras 數(shù)據(jù)增強ImageDataGenerator多輸入多輸出實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-07-07
Pytorch如何加載自己的數(shù)據(jù)集(使用DataLoader讀取Dataset)
這篇文章主要介紹了Pytorch如何加載自己的數(shù)據(jù)集(使用DataLoader讀取Dataset)問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教2022-12-12
matplotlib實現(xiàn)自定義散點形狀marker的3種方法
本文主要介紹了matplotlib實現(xiàn)自定義散點形狀marker的3種方法,文中通過示例代碼介紹的非常詳細,具有一定的參考價值,感興趣的小伙伴們可以參考一下2021-10-10

