欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Pandas數(shù)據(jù)集的合并與連接merge()方法

 更新時間:2023年11月22日 10:04:17   作者:阿松愛睡覺  
Pandas數(shù)據(jù)集的合并與連接(merge())是數(shù)據(jù)處理過程中常用的操作之一,在使用Pandas進行數(shù)據(jù)集合并時,可以使用merge()函數(shù)將兩個或多個數(shù)據(jù)集按照指定的列進行合并,本文就來介紹一下,感興趣的可以了解一下

merge()解析

merge()可根據(jù)一個或者多個鍵將不同的DataFrame連接在一起,類似于SQL數(shù)據(jù)庫中的合并操作。

在這里插入圖片描述

數(shù)據(jù)連接的類型

  • 一對一的連接:
df1 = pd.DataFrame({'employee': ['Bob', 'Jake', 'Lisa', 'Sue'], 'group': ['Accounting', 'Engineering', 'Engineering', 'HR']})
df2 = pd.DataFrame({'employee': ['Lisa', 'Bob', 'Jake', 'Sue'], 'hire_date': [2004, 2008, 2012, 2014]})
df3 = pd.merge(df1,df2)
df3

輸出:

在這里插入圖片描述

df3

在這里插入圖片描述

  • 多對一的連接:
df4 = pd.DataFrame({'group': ['Accounting', 'Engineering', 'HR'], 'supervisor': ['Carly', 'Guido', 'Steve']})
pd.merge(df3,df4) 

輸出:

在這里插入圖片描述

  • 多對多連接:
df5 = pd.DataFrame({'group': ['Accounting', 'Accounting', 'Engineering', 'Engineering', 'HR', 'HR'], 'skills': ['math', 'spreadsheets', 'coding', 'linux', 'spreadsheets', 'organization']})
pd.merge(df1,df5)

輸出:

在這里插入圖片描述

merge()的主要參數(shù)

1. on 可以是列名字符串或者一個包含多列名稱的列表;

pd.merge(df1, df2, on='employee')

輸出:

在這里插入圖片描述

這個參數(shù)只能在兩個DataFrame有共同列名的時候才可以使用。

2. left_onright_on參數(shù)

有時你也需要合并兩個列名不同的數(shù)據(jù)集,例如前面的員工信息表中有一個字段不是employee而是name。在這種情況下,就可以用left_on和right_on參數(shù)來指定列名。

df3 = pd.DataFrame({'name': ['Bob', 'Jake', 'Lisa', 'Sue'], 'salary': [70000, 80000, 120000, 90000]})
dfx = pd.merge(df1,df3,left_on="employee",right_on="name")

輸出:

在這里插入圖片描述

在這里插入圖片描述

drop()刪除
如果出現(xiàn)重復列,但是列名不同時,可以使用drop方法將這列去掉;

dfx.drop("name",axis=1)

輸出:

在這里插入圖片描述

3. left_index與right_index參數(shù) 用于合并索引

df1a = df1.set_index('employee')
df2a = df2.set_index('employee')
pd.merge(df1a,df2a,left_index=True,right_index=True)

輸出:

在這里插入圖片描述

join()方法也可以實現(xiàn)該功能:

df1a.join(df2a)

輸出:

在這里插入圖片描述

如果想將索引與列混合使用,那么可以通過結(jié)合left_index與 right_on,或者結(jié)合left_on與right_index來實現(xiàn)。

pd.merge(df1a, df3, left_index=True, right_on='name')

輸出:

在這里插入圖片描述

4. how參數(shù)

how參數(shù)默認情況下是inner,也就是取交集。how參數(shù)支持的數(shù)據(jù)連接方式還有outer、leftrightouter表示外連接,取并集。

df6 = pd.DataFrame({'name': ['Peter', 'Paul', 'Mary'], 'food': ['fish', 'beans', 'bread']}, columns=['name', 'food']) 
df7 = pd.DataFrame({'name': ['Mary', 'Joseph'], 'drink': ['wine', 'beer']}, columns=['name', 'drink'])
pd.merge(df6, df7, how='outer') 

輸出:

在這里插入圖片描述

左連接和右連接返回的結(jié)果分別只包含左列和右列;

pd.merge(df6, df7, how='left')

輸出:

在這里插入圖片描述

5. suffixes參數(shù)

如果輸出結(jié)果中有兩個重復的列名,因此pd.merge()函數(shù)會自動為它們增加后綴 _x 或 _y,當然也可以通過suffixes參數(shù)自定義后綴名。

df8 = pd.DataFrame({'name': ['Bob', 'Jake', 'Lisa', 'Sue'], 'rank': [1, 2, 3, 4]}) 
df9 = pd.DataFrame({'name': ['Bob', 'Jake', 'Lisa', 'Sue'], 'rank': [3, 1, 4, 2]})
pd.merge(df8, df9, on="name", suffixes=["_L", "_R"])

輸出:

在這里插入圖片描述

suffixes參數(shù)同樣適用于任何連接方式,即使有三個及三個以上的重復列名時也同樣適用。

到此這篇關(guān)于Pandas數(shù)據(jù)集的合并與連接merge()方法的文章就介紹到這了,更多相關(guān)Pandas數(shù)據(jù)集的合并與連接內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

最新評論