使用pd.merge表連接出現(xiàn)多余行的問題解決
本文的目標是將表1論文及出版物與表2出版物及其指標進行匹配。
利用pandas的merge函數(shù)實現(xiàn)表的左外連接。左外連接即左表的外連接,左表保持不變,匹配右表的行(合并后右表肯能存在空值)。
paperPublicationIndicator = pd.merge(paperPublication,publicationIndicator, how='left',left_on='出版物',right_on='名稱',sort=False)
結果發(fā)現(xiàn)連接后表相比于表1論文出版物 多出來13行。進行探究發(fā)現(xiàn)是表2出版物指標信息中存在 出版物A-指標1,出版物A-指標2這樣的出版物重復行。進行匹配后會出現(xiàn):
出版物 名稱 指標 出版物A 出版物A 指標1 出版物A 出版物A 指標2 #多余的行
這里選擇預先刪除 表2出版物指標 中的重復出版物信息。
publicationIndicator.drop_duplicates(subset=['名稱'], keep='first',inplace=True)
這樣結果就沒有問題了。
到此這篇關于使用pd.merge表連接出現(xiàn)多余行的問題解決的文章就介紹到這了,更多相關pd.merge表連接多余行問題內容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!
相關文章
python中numpy包使用教程之數(shù)組和相關操作詳解
這篇文章主要給大家介紹了關于python中numpy包的使用教程,包含數(shù)組和相關操作等內容,文中通過示例代碼介紹的非常詳細,對大家具有一定的參考學習價值,需要的朋友們下面來跟著小編一起學習學習吧。2017-07-07在dataframe兩列日期相減并且得到具體的月數(shù)實例
今天小編就為大家分享一篇在dataframe兩列日期相減并且得到具體的月數(shù)實例,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2018-07-07Python實現(xiàn)批量word文檔轉pdf并統(tǒng)計其頁碼
pypdf2是一個Python模塊,可以用來讀取、寫入和操作PDF文件,本文就將利用該模塊實現(xiàn)批量word文檔轉pdf并統(tǒng)計其頁碼,需要的小伙伴可以了解一下2023-05-05