快捷導(dǎo)航

pandas DataFrame 交集并集補集的實現(xiàn)

更新時間：2019年06月24日 14:18:33 作者：niuniuc.vip

這篇文章主要介紹了pandas DataFrame 交集并集補集的實現(xiàn)，文中通過示例代碼介紹的非常詳細(xì)，對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值，需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧

1.場景，對于colums都相同的dataframe做過濾的時候

例如：

df1 = DataFrame([['a', 10, '男'], 
         ['b', 11, '男'], 
         ['c', 11, '女'], 
         ['a', 10, '女'],
         ['c', 11, '男']], 
        columns=['name', 'age', 'sex'])

df2 = DataFrame([['a', 10, '男'], 
         ['b', 11, '女']],
        columns=['name', 'age', 'sex'])

取交集：print(pd.merge(df1,df2,on=['name', 'age', 'sex']))

取并集：print(pd.merge(df1,df2,on=['name', 'age', 'sex'], how='outer'))

取差集(從df1中過濾df1在df2中存在的行)：

df1 = df1.append(df2)
df1 = df1.append(df2)
df1 = df1.drop_duplicates(subset=['name', 'age', 'sex'],keep=False)
print(df1)

代碼：

# -*- coding:utf-8 -*-
__version__ = '1.0.0.0'
"""
@brief :  簡介
@details:  詳細(xì)信息
@author :  zhphuang
@date  :  2018-10-29
"""

import pandas as pd
from pandas import *

df1 = DataFrame([['a', 10, '男'],
         ['b', 11, '男'],
         ['c', 11, '女'],
         ['a', 10, '女'],
         ['c', 11, '男']],
        columns=['name', 'age', 'sex'])
print("df1:\n%s\n\n" % df1)
df2 = DataFrame([['a', 10, '男'],
         ['b', 11, '女']],
        columns=['name', 'age', 'sex'])
print("df2:\n%s\n\n" % df2)
# 取交集
print("交集:\n%s\n\n" % pd.merge(df1,df2,on=['name', 'age', 'sex']))

# 取并集
print("并集:\n%s\n\n" % pd.merge(df1,df2,on=['name', 'age', 'sex'], how='outer'))

# 從df1中過濾df1在df2中存在的行，也就是取補集
df1 = df1.append(df2)
df1 = df1.append(df2)
print("補集(從df1中過濾df1在df2中存在的行):\n%s\n\n" % df1.drop_duplicates(subset=['name', 'age', 'sex'],keep=False))

截圖

以上就是本文的全部內(nèi)容，希望對大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章:

相關(guān)文章

python共享引用(多個變量引用)示例代碼
python單個（一個）對象被多個變量引用又是怎么一回事兒呢？看下面代碼
2013-12-12
python和shell實現(xiàn)的校驗IP地址合法性腳本分享
這篇文章主要介紹了python和shell實現(xiàn)的校驗IP地址合法性腳本分享,每個腳本配有執(zhí)行效果圖,需要的朋友可以參考下
2014-10-10
基于Python實現(xiàn)的戀愛對話小程序詳解
這篇文章主要介紹了基于Python制作一個戀愛對話小程序，文章詳細(xì)介紹了小程序的實現(xiàn)過程，感興趣的小伙伴可以跟隨小編一起學(xué)習(xí)學(xué)習(xí)
2022-01-01
Django定制Admin頁面詳細(xì)實例(展示頁面和編輯頁面)
django自帶的admin因為功能和樣式比較簡陋,常常需要再次定制,下面這篇文章主要給大家介紹了關(guān)于Django定制Admin頁面(展示頁面和編輯頁面)的相關(guān)資料,需要的朋友可以參考下
2023-06-06
Python趣味編程實現(xiàn)手繪風(fēng)視頻示例
本文與計算機視覺相關(guān)，使用Python將圖片由自然風(fēng)轉(zhuǎn)化為手繪風(fēng)，期間未對圖片進(jìn)行任何預(yù)處理、后處理；代碼中只借助了兩個常見庫，核心計算由Numpy負(fù)責(zé) ，Pillow 負(fù)責(zé)圖片讀寫
2021-10-10
Python基于SMTP發(fā)送郵件的方法
這篇文章主要介紹了Python基于SMTP 發(fā)送郵件的方法，幫助大家更好的理解和學(xué)習(xí)使用python，感興趣的朋友可以了解下
2021-03-03
Pycharm遠(yuǎn)程調(diào)試和MySQL數(shù)據(jù)庫授權(quán)問題
這篇文章主要介紹了Pycharm遠(yuǎn)程調(diào)試和MySQL數(shù)據(jù)庫授權(quán)問題,文章內(nèi)容介紹詳細(xì)，需要的小伙伴可以參考一下，希望對你的學(xué)習(xí)或工作有所幫助
2022-03-03
Pandas 內(nèi)置的十種畫圖方法
這篇文章主要介紹了Pandas 內(nèi)置的十種畫圖方法，Pandas是非常常見的數(shù)據(jù)分析工具，我們一般都會處理好處理數(shù)據(jù)然后使用searbon或matplotlib來進(jìn)行繪制
2022-09-09
python requests post的使用方式
這篇文章主要介紹了python requests post的使用方式，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-03-03
Python 輸入一個數(shù)字判斷成績分?jǐn)?shù)等級的方法
今天小編就為大家分享一篇Python 輸入一個數(shù)字判斷成績分?jǐn)?shù)等級的方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-11-11