pandas DataFrame 交集并集補集的實現(xiàn)
更新時間:2019年06月24日 14:18:33 作者:niuniuc.vip
這篇文章主要介紹了pandas DataFrame 交集并集補集的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
1.場景,對于colums都相同的dataframe做過濾的時候
例如:
df1 = DataFrame([['a', 10, '男'], ['b', 11, '男'], ['c', 11, '女'], ['a', 10, '女'], ['c', 11, '男']], columns=['name', 'age', 'sex']) df2 = DataFrame([['a', 10, '男'], ['b', 11, '女']], columns=['name', 'age', 'sex'])
取交集:print(pd.merge(df1,df2,on=['name', 'age', 'sex']))
取并集:print(pd.merge(df1,df2,on=['name', 'age', 'sex'], how='outer'))
取差集(從df1中過濾df1在df2中存在的行):
df1 = df1.append(df2) df1 = df1.append(df2) df1 = df1.drop_duplicates(subset=['name', 'age', 'sex'],keep=False) print(df1)
代碼:
# -*- coding:utf-8 -*- __version__ = '1.0.0.0' """ @brief : 簡介 @details: 詳細信息 @author : zhphuang @date : 2018-10-29 """ import pandas as pd from pandas import * df1 = DataFrame([['a', 10, '男'], ['b', 11, '男'], ['c', 11, '女'], ['a', 10, '女'], ['c', 11, '男']], columns=['name', 'age', 'sex']) print("df1:\n%s\n\n" % df1) df2 = DataFrame([['a', 10, '男'], ['b', 11, '女']], columns=['name', 'age', 'sex']) print("df2:\n%s\n\n" % df2) # 取交集 print("交集:\n%s\n\n" % pd.merge(df1,df2,on=['name', 'age', 'sex'])) # 取并集 print("并集:\n%s\n\n" % pd.merge(df1,df2,on=['name', 'age', 'sex'], how='outer')) # 從df1中過濾df1在df2中存在的行,也就是取補集 df1 = df1.append(df2) df1 = df1.append(df2) print("補集(從df1中過濾df1在df2中存在的行):\n%s\n\n" % df1.drop_duplicates(subset=['name', 'age', 'sex'],keep=False))
截圖
以上就是本文的全部內(nèi)容,希望對大家的學習有所幫助,也希望大家多多支持腳本之家。
相關文章
python和shell實現(xiàn)的校驗IP地址合法性腳本分享
這篇文章主要介紹了python和shell實現(xiàn)的校驗IP地址合法性腳本分享,每個腳本配有執(zhí)行效果圖,需要的朋友可以參考下2014-10-10Django定制Admin頁面詳細實例(展示頁面和編輯頁面)
django自帶的admin因為功能和樣式比較簡陋,常常需要再次定制,下面這篇文章主要給大家介紹了關于Django定制Admin頁面(展示頁面和編輯頁面)的相關資料,需要的朋友可以參考下2023-06-06Pycharm遠程調(diào)試和MySQL數(shù)據(jù)庫授權問題
這篇文章主要介紹了Pycharm遠程調(diào)試和MySQL數(shù)據(jù)庫授權問題,文章內(nèi)容介紹詳細,需要的小伙伴可以參考一下,希望對你的學習或工作有所幫助2022-03-03Python 輸入一個數(shù)字判斷成績分數(shù)等級的方法
今天小編就為大家分享一篇Python 輸入一個數(shù)字判斷成績分數(shù)等級的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-11-11