欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python Pandas實現(xiàn)DataFrame合并的圖文教程

 更新時間:2022年07月26日 09:55:19   作者:笑?癮  
我們在使用pandas處理數(shù)據(jù)的時候,往往會需要合并兩個或者多個DataFrame的操作,下面這篇文章主要給大家介紹了關(guān)于Pandas實現(xiàn)DataFrame合并的相關(guān)資料,需要的朋友可以參考下

一、merge(合并)的語法:

pd.merge(left, right, how='inner', on=None, left_on=None, right_on=None, left_index=False, right_index=False, sort=True, suffixes=('_x', '_y'), copy=True, indicator=False, validate=None)
參數(shù)介紹:
left,right:要merge的dataframe或者有name的Series
how:join類型,'left', 'right', 'outer', 'inner'
on:join的key,left和right都需要有這個key
left_on:left的df或者series的key
right_on:right的df或者seires的key
left_index,right_index:使用index而不是普通的column做join
suffixes:兩個元素的后綴,如果列有重名,自動添加后綴,默認是('_x', '_y')

二、以關(guān)鍵列來合并兩個dataframe

可以看到只有l(wèi)eft和right的key1=y的行保留了下來,即默認合并后只保留有共同列項并且值相等行(即交集)。

本例中l(wèi)eft和right的k1=y分別有2個,最終構(gòu)成了2*2=4行

import pandas as pd
left = pd.DataFrame({'A': ['a0', 'a1', 'a2', 'a3'],
                     'B': ['b0', 'b1', 'b2', 'b3'],
                     'k1': ['x', 'x', 'y', 'y']})
right = pd.DataFrame({'C': ['c1', 'c2', 'c3', 'c4'],
                      'D': ['d1', 'd2', 'd3', 'd4'],
                      'k1': ['y', 'y', 'z', 'z']})

left

left

right

pd.merge(left, right, on=‘k1’)

三、理解merge時數(shù)量的對齊關(guān)系

one-to-one:一對一關(guān)系,關(guān)聯(lián)的key都是唯一的
    比如(學(xué)號,姓名) merge (學(xué)號,年齡)
    結(jié)果條數(shù)為:1*1
one-to-many:一對多關(guān)系,左邊唯一key,右邊不唯一key
    比如(學(xué)號,姓名) merge (學(xué)號,[語文成績、數(shù)學(xué)成績、英語成績])
    結(jié)果條數(shù)為:1*N
many-to-many:多對多關(guān)系,左邊右邊都不是唯一的
    比如(學(xué)號,[語文成績、數(shù)學(xué)成績、英語成績]) merge (學(xué)號,[籃球、足球、乒乓球])
    結(jié)果條數(shù)為:M*N

1、one-to-one 一對一關(guān)系的merge

left = pd.DataFrame({'sno': [11, 12, 13, 14],
                      'name': ['name_a', 'name_b', 'name_c', 'name_d']
                    })
right = pd.DataFrame({'sno': [11, 12, 13, 14],
                      'age': ['21', '22', '23', '24']
                    })

left

right

# 一對一關(guān)系,結(jié)果中有4條
pd.merge(left, right, on='sno')

2、one-to-many 一對多關(guān)系的merge

注意:數(shù)據(jù)會被復(fù)制

left = pd.DataFrame({'sno': [11, 12, 13, 14],
                      'name': ['name_a', 'name_b', 'name_c', 'name_d']
                    })
right = pd.DataFrame({'sno': [11, 11, 11, 12, 12, 13],
                       'grade': ['語文88', '數(shù)學(xué)90', '英語75','語文66', '數(shù)學(xué)55', '英語29']
                     })

left

right

# 數(shù)目以多的一邊為準(zhǔn)
pd.merge(left, right, on='sno')

3、many-to-many 多對多關(guān)系的merge

注意:結(jié)果數(shù)量會出現(xiàn)乘法

left = pd.DataFrame({'sno': [11, 11, 12, 12,12],
                      '愛好': ['籃球', '羽毛球', '乒乓球', '籃球', "足球"]
                    })
right = pd.DataFrame({'sno': [11, 11, 11, 12, 12, 13],
                       'grade': ['語文88', '數(shù)學(xué)90', '英語75','語文66', '數(shù)學(xué)55', '英語29']
                     })

left

right

pd.merge(left, right, on=‘sno’)

四、理解left join、right join、inner join、outer join的區(qū)別

left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                      'A': ['A0', 'A1', 'A2', 'A3'],
                      'B': ['B0', 'B1', 'B2', 'B3']})

right = pd.DataFrame({'key': ['K0', 'K1', 'K4', 'K5'],
                      'C': ['C0', 'C1', 'C4', 'C5'],
                      'D': ['D0', 'D1', 'D4', 'D5']})

left

right

1、inner join,默認

左邊和右邊的key都有,才會出現(xiàn)在結(jié)果里

pd.merge(left, right, how='inner')

2、left join

左邊的都會出現(xiàn)在結(jié)果里,右邊的如果無法匹配則為Null

pd.merge(left, right, how='left')

3、 right join

右邊的都會出現(xiàn)在結(jié)果里,左邊的如果無法匹配則為Null

pd.merge(left, right, how='right')

4、 outer join

左邊、右邊的都會出現(xiàn)在結(jié)果里,如果無法匹配則為Null

pd.merge(left, right, how='outer')

五、如果出現(xiàn)非Key的字段重名怎么辦

left = pd.DataFrame({'key': ['K0', 'K1', 'K2', 'K3'],
                      'A': ['A0', 'A1', 'A2', 'A3'],
                      'B': ['B0', 'B1', 'B2', 'B3']})

right = pd.DataFrame({'key': ['K0', 'K1', 'K4', 'K5'],
                      'A': ['A10', 'A11', 'A12', 'A13'],
                      'D': ['D0', 'D1', 'D4', 'D5']})

left

right

pd.merge(left, right, on='key')

pd.merge(left, right, on='key', suffixes=('_left', '_right'))

總結(jié)

到此這篇關(guān)于Pandas實現(xiàn)DataFrame合并的文章就介紹到這了,更多相關(guān)Pandas DataFrame合并內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 基于PyQt5完成的PDF拆分功能

    基于PyQt5完成的PDF拆分功能

    這篇文章主要介紹了基于PyQt5完成的PDF拆分功能,本文介紹的pdf拆分功能還有一些待完善地方,例如可增加預(yù)覽功能,實現(xiàn)每頁預(yù)覽,以及如何實現(xiàn)多條件拆分,需要的朋友可以參考下
    2022-06-06
  • pycharm永久激活方法

    pycharm永久激活方法

    這篇文章給大家介紹了pycharm永久激活碼,通過實例代碼給大家介紹的非常詳細,具有一定的參考借鑒價值,對pycharm激活碼相關(guān)知識感興趣的朋友一起看看吧
    2020-01-01
  • Python應(yīng)用自動化部署工具Fabric原理及使用解析

    Python應(yīng)用自動化部署工具Fabric原理及使用解析

    這篇文章主要介紹了Python應(yīng)用自動化部署工具Fabric原理及使用解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-11-11
  • 學(xué)Python 3的理由和必要性

    學(xué)Python 3的理由和必要性

    在本篇文章里小編給大家整理的是關(guān)于學(xué)Python 3的理由的優(yōu)勢,有興趣的朋友們跟著學(xué)習(xí)參考下。
    2019-11-11
  • 關(guān)于python中range()的參數(shù)問題

    關(guān)于python中range()的參數(shù)問題

    這篇文章主要介紹了關(guān)于python中range()的參數(shù)問題,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2022-05-05
  • Django開發(fā)中復(fù)選框用法示例

    Django開發(fā)中復(fù)選框用法示例

    這篇文章主要介紹了Django開發(fā)中復(fù)選框用法,結(jié)合實例形式分析了Django基于ajax的復(fù)選框遍歷、提交及后臺數(shù)據(jù)庫查詢等相關(guān)操作技巧,需要的朋友可以參考下
    2018-03-03
  • Python高斯消除矩陣

    Python高斯消除矩陣

    今天小編就為大家分享一篇關(guān)于Python高斯消除矩陣,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-01-01
  • opencv python Canny邊緣提取實現(xiàn)過程解析

    opencv python Canny邊緣提取實現(xiàn)過程解析

    這篇文章主要介紹了opencv python Canny邊緣提取實現(xiàn)過程解析,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下
    2020-02-02
  • 利用Python創(chuàng)建第一個Django框架程序

    利用Python創(chuàng)建第一個Django框架程序

    這篇文章主要介紹了利用Python創(chuàng)建第一個Django框架程序,文章圍繞主題展開詳細的內(nèi)容介紹,具有一定的參考價值,感興趣的小伙伴可以參考一下
    2022-06-06
  • tensorflow 中對數(shù)組元素的操作方法

    tensorflow 中對數(shù)組元素的操作方法

    今天小編就為大家分享一篇tensorflow 中對數(shù)組元素的操作方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2018-07-07

最新評論