本文主要介紹了使用pd.merge表連接出現(xiàn)多余行的問題解決，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧

本文的目標(biāo)是將表1論文及出版物與表2出版物及其指標(biāo)進(jìn)行匹配。

表1 論文出版物信息（存在空值）

表2 出版物指標(biāo)信息

利用pandas的merge函數(shù)實(shí)現(xiàn)表的左外連接。左外連接即左表的外連接，左表保持不變，匹配右表的行（合并后右表肯能存在空值）。

paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator,
    how='left',left_on='出版物',right_on='名稱',sort=False)

結(jié)果發(fā)現(xiàn)連接后表相比于表1論文出版物多出來(lái)13行。進(jìn)行探究發(fā)現(xiàn)是表2出版物指標(biāo)信息中存在出版物A-指標(biāo)1，出版物A-指標(biāo)2這樣的出版物重復(fù)行。進(jìn)行匹配后會(huì)出現(xiàn)：

出版物  名稱  指標(biāo)
出版物A  出版物A  指標(biāo)1
出版物A  出版物A  指標(biāo)2   #多余的行

這里選擇預(yù)先刪除表2出版物指標(biāo) 中的重復(fù)出版物信息。

publicationIndicator.drop_duplicates(subset=['名稱'],
		keep='first',inplace=True)

這樣結(jié)果就沒有問題了。

到此這篇關(guān)于使用pd.merge表連接出現(xiàn)多余行的問題解決的文章就介紹到這了,更多相關(guān)pd.merge表連接多余行問題內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章:

一次性徹底講透Python中pd.concat與pd.merge

相關(guān)文章

Django自定義列表 models字段顯示方式
這篇文章主要介紹了Django自定義列表 models字段顯示方式，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧
2020-04-04
解決每次打開pycharm直接進(jìn)入項(xiàng)目的問題
今天小編就為大家分享一篇解決每次打開pycharm直接進(jìn)入項(xiàng)目的問題，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧
2018-10-10
python中numpy包使用教程之?dāng)?shù)組和相關(guān)操作詳解
這篇文章主要給大家介紹了關(guān)于python中numpy包的使用教程，包含數(shù)組和相關(guān)操作等內(nèi)容，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面來(lái)跟著小編一起學(xué)習(xí)學(xué)習(xí)吧。
2017-07-07
OPENAI?API?微調(diào)?GPT-3?的?Ada?模型
這篇文章主要為大家介紹了OPENAI?API?微調(diào)?GPT-3?的?Ada?模型使用示例詳解，有需要的朋友可以借鑒參考下，希望能夠有所幫助，祝大家多多進(jìn)步，早日升職加薪
2023-04-04
pycharm查看變量值的4種方法匯總
因?yàn)镻ython是腳本語(yǔ)言,不會(huì)進(jìn)行編譯,所以只有執(zhí)行到那一行,才能知道那個(gè)變量的類型,下面這篇文章主要給大家介紹了關(guān)于pycharm查看變量值的4種方法,需要的朋友可以參考下
2022-04-04
Python實(shí)現(xiàn)解析yaml配置文件的示例詳解
在開發(fā)過程中，配置文件是少不了的，而且配置文件是有專門的格式的，比如：ini，yaml，toml等等。本文帶大家來(lái)看看Python如何解析yaml文件，它的表達(dá)能力相比?ini?更加的強(qiáng)大，需要的可以參考一下
2022-09-09
在dataframe兩列日期相減并且得到具體的月數(shù)實(shí)例
今天小編就為大家分享一篇在dataframe兩列日期相減并且得到具體的月數(shù)實(shí)例，具有很好的參考價(jià)值，希望對(duì)大家有所幫助。一起跟隨小編過來(lái)看看吧
2018-07-07
Python實(shí)現(xiàn)批量word文檔轉(zhuǎn)pdf并統(tǒng)計(jì)其頁(yè)碼
pypdf2是一個(gè)Python模塊，可以用來(lái)讀取、寫入和操作PDF文件，本文就將利用該模塊實(shí)現(xiàn)批量word文檔轉(zhuǎn)pdf并統(tǒng)計(jì)其頁(yè)碼，需要的小伙伴可以了解一下
2023-05-05
python excel多行合并的方法
這篇文章主要介紹了python excel多行合并的方法，幫助大家更好的利用python處理excel表格，感興趣的朋友可以了解下
2020-12-12
Selenium+Python自動(dòng)化測(cè)試入門
本文主要介紹了Selenium+Python自動(dòng)化測(cè)試入門，文中通過示例代碼介紹的非常詳細(xì)，對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值，需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧
2022-08-08