欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas的DataFrame如何做交集,并集,差集與對稱差集

 更新時(shí)間:2022年01月27日 09:18:02   作者:葉庭云??  
這篇文章主要介紹了Pandas的DataFrame如何做交集,并集,差集與對稱差集,Python的數(shù)據(jù)類型集合由不同元素組成的集合,集合中是一組無序排列的可?Hash?的值,可以作為字典的Key,下面來看看文章的詳細(xì)內(nèi)容吧

一、簡介

Python的數(shù)據(jù)類型集合:由不同元素組成的集合,集合中是一組無序排列的可 Hash 的值(不可變類型),可以作為字典的Key

Pandas中的DataFrameDataFrame是一個(gè)表格型的數(shù)據(jù)結(jié)構(gòu),可以理解為帶有標(biāo)簽的二維數(shù)組。

常用的集合操作如下圖所示:

二、交集

  • pandasmerge 功能默認(rèn)為 inner 連接,可以實(shí)現(xiàn)取交集
  • 集合 set 可以直接用 & 取交集
import pandas as pd

print("CSDN葉庭云:https://yetingyun.blog.csdn.net/")
set1 = {"Python", "Go", "C++", "Java"}
set2 = {"Go", "C++", "JavaScript", "C"}
set1 & set2

df1 = pd.DataFrame([
? ? ? ? ['1', 'Python'],
? ? ? ? ['2', 'Go'],
? ? ? ? ['3', 'C++'],
? ? ? ? ['4', 'Java'],
? ? ], columns=['id','name'])


df2 = pd.DataFrame([
? ? ? ? ['2','Go'],
? ? ? ? ['3','C++'],
? ? ? ? ['5','JavaScript'],
? ? ? ? ['6','C'],
? ? ], columns=['id','name'])

pd.merge(df1, df2, on=['id','name'])

操作如下所示:

三、并集

  • Pandas的 merge 方法里參數(shù) how 的取值有 “left”, “right”, “inner”, “outer”,默認(rèn)是inner。outer外連接可以實(shí)現(xiàn)取并集。另一種方法也可以df1.append(df2)后去重,保留第一次出現(xiàn)的也可以實(shí)現(xiàn)取并集。
  • 集合 set 可以直接用 | 取并集
set1 = {"Python", "Go", "C++", "Java"}
set2 = {"Go", "C++", "JavaScript", "C"}
set1 | set2

print("CSDN葉庭云:https://yetingyun.blog.csdn.net/")

df1 = pd.DataFrame([
? ? ? ? ['1', 'Python'],
? ? ? ? ['2', 'Go'],
? ? ? ? ['3', 'C++'],
? ? ? ? ['4', 'Java'],
? ? ], columns=['id','name'])


df2 = pd.DataFrame([
? ? ? ? ['2','Go'],
? ? ? ? ['3','C++'],
? ? ? ? ['5','JavaScript'],
? ? ? ? ['6','C'],
? ? ], columns=['id','name'])

pd.merge(df1, df2,
? ? ? ? ?on=['id','name'],
? ? ? ? ?how='outer')
? ? ? ? ?
df3 = df1.append(df2)
df3.drop_duplicates(subset=['id'], keep="first")

四、差集

set1 = {"Python", "Go", "C++", "Java"}
set2 = {"Go", "C++", "JavaScript", "C"}
set1 - set2

print("CSDN葉庭云:https://yetingyun.blog.csdn.net/")
set1 = {"Python", "Go", "C++", "Java"}
set2 = {"Go", "C++", "JavaScript", "C"}
set2 - set1

# df1-df2
df1 = pd.DataFrame([
? ? ? ? ['1', 'Python'],
? ? ? ? ['2', 'Go'],
? ? ? ? ['3', 'C++'],
? ? ? ? ['4', 'Java'],
? ? ], columns=['id','name'])


df2 = pd.DataFrame([
? ? ? ? ['2','Go'],
? ? ? ? ['3','C++'],
? ? ? ? ['5','JavaScript'],
? ? ? ? ['6','C'],
? ? ], columns=['id','name'])

df1 = df1.append(df2)
df1 = df1.append(df2)
set_diff_df = df1.drop_duplicates(subset=df1.columns,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? keep=False)
set_diff_df

# df2-df1
df1 = pd.DataFrame([
? ? ? ? ['1', 'Python'],
? ? ? ? ['2', 'Go'],
? ? ? ? ['3', 'C++'],
? ? ? ? ['4', 'Java'],
? ? ], columns=['id','name'])

df2 = pd.DataFrame([
? ? ? ? ['2','Go'],
? ? ? ? ['3','C++'],
? ? ? ? ['5','JavaScript'],
? ? ? ? ['6','C'],
? ? ], columns=['id','name'])

print("CSDN葉庭云:https://yetingyun.blog.csdn.net/")
df2 = df2.append(df1)
df2 = df2.append(df1)
set_diff_df = df2.drop_duplicates(subset=df2.columns,
? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? ? keep=False)
set_diff_df

# df1-df2
df1 = pd.DataFrame([
? ? ? ? ['1', 'Python'],
? ? ? ? ['2', 'Go'],
? ? ? ? ['3', 'C++'],
? ? ? ? ['4', 'Java'],
? ? ], columns=['id','name'])


df2 = pd.DataFrame([
? ? ? ? ['2','Go'],
? ? ? ? ['3','C++'],
? ? ? ? ['5','JavaScript'],
? ? ? ? ['6','C'],
? ? ], columns=['id','name'])

pd.concat([df1, df2, df2]).drop_duplicates(keep=False)

# df2-df1
df1 = pd.DataFrame([
? ? ? ? ['1', 'Python'],
? ? ? ? ['2', 'Go'],
? ? ? ? ['3', 'C++'],
? ? ? ? ['4', 'Java'],
? ? ], columns=['id','name'])


df2 = pd.DataFrame([
? ? ? ? ['2','Go'],
? ? ? ? ['3','C++'],
? ? ? ? ['5','JavaScript'],
? ? ? ? ['6','C'],
? ? ], columns=['id','name'])

pd.concat([df2, df1, df1]).drop_duplicates(keep=False)

五、對稱差集

print("CSDN葉庭云:https://yetingyun.blog.csdn.net/")
set1 = {"Python", "Go", "C++", "Java"}
set2 = {"Go", "C++", "JavaScript", "C"}
set1 ^ set2 ? ?# 對稱差集

# 去重 ? 不保留重復(fù)的:即可實(shí)現(xiàn)取對稱差集
df3 = df1.append(df2)

df3.drop_duplicates(subset=['id'], keep=False)

 到此這篇關(guān)于PandasDataFrame如何做交集,并集,差集與對稱差集的文章就介紹到這了,更多相關(guān)Pandas的DataFrame如何做交集,并集,差集與對稱差集內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • Python?運(yùn)算符Inplace?與Standard?

    Python?運(yùn)算符Inplace?與Standard?

    這篇文章主要介紹了Python?運(yùn)算符Inplace?與Standard,nplace運(yùn)算符的行為類似于普通運(yùn)算符,只是它們在可變和不可變目標(biāo)的情況下以不同的方式運(yùn)行
    2022-09-09
  • PyCharm下載和安裝詳細(xì)步驟

    PyCharm下載和安裝詳細(xì)步驟

    這篇文章主要介紹了PyCharm下載和安裝詳細(xì)步驟,本文圖文并茂給大家介紹的非常詳細(xì),具有一定的參考借鑒價(jià)值,需要的朋友可以參考下
    2019-12-12
  • Python服務(wù)器創(chuàng)建虛擬環(huán)境跑代碼

    Python服務(wù)器創(chuàng)建虛擬環(huán)境跑代碼

    本文主要介紹了Python服務(wù)器創(chuàng)建虛擬環(huán)境跑代碼,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2022-07-07
  • 詳解scrapy內(nèi)置中間件的順序

    詳解scrapy內(nèi)置中間件的順序

    這篇文章主要介紹了詳解scrapy內(nèi)置中間件的順序,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-09-09
  • python調(diào)用fortran模塊

    python調(diào)用fortran模塊

    本文給大家介紹的是在Python中調(diào)用fortran代碼,主要是用到了f2py這個(gè)程序,十分的實(shí)用,有需要的小伙伴可以參考下
    2016-04-04
  • 對python PLT中的image和skimage處理圖片方法詳解

    對python PLT中的image和skimage處理圖片方法詳解

    今天小編就為大家分享一篇對python PLT中的image和skimage處理圖片方法詳解,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-01-01
  • Python中的異常處理學(xué)習(xí)筆記

    Python中的異常處理學(xué)習(xí)筆記

    這篇文章主要介紹了Python中的異常處理學(xué)習(xí)筆記,本文講解了常見的異常類、自定義異常類、捕獲異常、拋出異常、上下文管理器等內(nèi)容,需要的朋友可以參考下
    2015-01-01
  • linux 下selenium chrome使用詳解

    linux 下selenium chrome使用詳解

    這篇文章主要介紹了linux 下selenium chrome使用詳解,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-04-04
  • pandas按某列降序的實(shí)現(xiàn)

    pandas按某列降序的實(shí)現(xiàn)

    本文主要介紹了pandas按某列降序的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-01-01
  • Flask wtforms實(shí)現(xiàn)表單驗(yàn)證使用

    Flask wtforms實(shí)現(xiàn)表單驗(yàn)證使用

    本文主要介紹了Flask wtforms實(shí)現(xiàn)表單驗(yàn)證使用,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-08-08

最新評論