腳本之家服務器常用軟件

快捷導航

pandas去除重復列的實現(xiàn)方法

更新時間：2019年01月29日 14:20:58 作者：Emily_2018

這篇文章主要介紹了pandas去除重復列的實現(xiàn)方法，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧

數(shù)據(jù)準備

假設我們目前有兩個數(shù)據(jù)表：

① 一個數(shù)據(jù)表是關于三個人他們的id以及其他的幾列屬性信息

import pandas as pd
import numpy as np
data = pd.DataFrame(np.random.randint(low=1,high=20,size=(3,4)))
data['id'] = range(1,4)
# 輸出：其中，最左邊的0 1 2 為其索引

② 另外一個數(shù)據(jù)表是3個用戶的app操作日志信息，一個人會有多條app操作記錄

sample = pd.DataFrame(np.random.randint(low=1,high=9,size=(7,1)),columns=['hhh'])
sample['id'] = [1,1,2,2,3,3,3]
# 輸出：

問題描述

① 首先我們需要統(tǒng)計每個用戶app操作記錄數(shù)，比如上表可以看出用戶id為1的用戶有2條操作記錄，用戶id為3的用戶有3條操作記錄

s = sample.groupby('id').count()
# 輸出：

② 此時，S是一個以id為索引，count出來的記錄數(shù)為value的Series結構。因為考慮到后面我們需要id列進行merge，所以我們需要讓id列從索引列變成真實的一列。

s = s.reset_index()
# 輸出：

③ 將S與最上的data表進行merge，我們不想要看到重復的id列，甚至我們也可以將問題延伸為S與data表不止是id列的重復，還有好多條其他的列的重復，那么如何保證將它們merge之后沒有重復列呢？

解決方案

第一想法是用 DataFrame.drop(‘列名') 或者用 del DataFrame[‘列名']

但是如果用該方法，會刪除掉所有的重復列，而達不到我們的要求。

辦法是：參考StackOverflow解答

cols_to_use = s.columns.difference(data.columns) # pandas版本在0.15及之上的都可以用這種方法，該方法找出S和data表的不同列，然后再進行merge
pd.merge(data, s[cols_to_use], left_index=True, right_index=True, how='outer')

以上就是本文的全部內容，希望對大家的學習有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

python裝飾器中@property屬性的使用解析
這篇文章主要介紹了python裝飾器中@property屬性的使用解析,property屬性是一種用起來像是使用的實例屬性一樣的特殊屬性,可以對應于某個方法,需要的朋友可以參考下
2023-09-09
python 根據(jù)時間來生成唯一的字符串方法
今天小編就為大家分享一篇python 根據(jù)時間來生成唯一的字符串方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2019-01-01
基于PyQt5制作一個截圖翻譯工具
這篇文章主要為大家介紹了如何利用PyQt5制作一個簡單的截圖翻譯工具，具有截圖功能、翻譯功能和文字識別OCR，需要的可以參考一下
2022-05-05
10行Python代碼實現(xiàn)Web自動化管控的示例代碼
這篇文章主要介紹了10行Python代碼實現(xiàn)Web自動化管控的示例代碼，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2020-08-08
python?pip?install總是報錯情況分析及解決辦法
這篇文章主要給大家介紹了關于python?pip?install總是報錯情況分析及解決辦法,安裝包時經常遇到報錯,這里提供兩種方式解決,文中通過圖文介紹的非常詳細,需要的朋友可以參考下
2023-10-10
分分鐘入門python語言
分分鐘學會一門語言之Python篇，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2018-03-03
Python中Scrapy+adbapi提高數(shù)據(jù)庫寫入效率實現(xiàn)
本文主要介紹了Python中Scrapy+adbapi提高數(shù)據(jù)庫寫入效率實現(xiàn)，文中通過示例代碼介紹的非常詳細，具有一定的參考價值，感興趣的小伙伴們可以參考一下
2021-10-10
Mac版Python3安裝/升級的方式
這篇文章主要介紹了Mac版Python3安裝/升級的方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-03-03
Python OpenCV招商銀行信用卡卡號識別的方法
這篇文章主要介紹了Python OpenCV招商銀行信用卡卡號識別的方法，文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值，需要的朋友們下面隨著小編來一起學習學習吧
2021-03-03
python實現(xiàn)手機號歸屬地查詢功能
手機上突然收到了某銀行的短信提示,看了一下手機的位數(shù),正好是11位,我一想,這不就是標準的手機號碼嗎？于是想用python的庫實現(xiàn)查詢手機號碼歸屬地查詢自由,所以本文給大家介紹了如何用python實現(xiàn)手機號歸屬地查詢功能,需要的朋友可以參考下
2024-03-03

欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

pandas去除重復列的實現(xiàn)方法

相關文章

最新評論

大家感興趣的內容

最近更新的內容

常用在線小工具