快捷導(dǎo)航

Python處理數(shù)據(jù)之匹配兩個(gè)Excel文件數(shù)據(jù)的實(shí)現(xiàn)方法

更新時(shí)間：2023年09月26日 16:34:34 作者：烏漆帥黑

這篇文章主要給大家介紹了關(guān)于Python處理數(shù)據(jù)之匹配兩個(gè)Excel文件數(shù)據(jù)的實(shí)現(xiàn)方法,可以使用Python的Pandas庫(kù)來(lái)實(shí)現(xiàn)兩層循環(huán)匹配兩個(gè)Excel文件,需要的朋友可以參考下

前言

當(dāng)需要處理兩個(gè)Excel文件的數(shù)據(jù)，根據(jù)兩個(gè)Excel的某一些內(nèi)容進(jìn)行數(shù)據(jù)匹配，從而提取出相應(yīng)的數(shù)據(jù)時(shí)，除了使用Excel自帶的Vlookup函數(shù)，還能使用Python進(jìn)行處理。我是不會(huì)告訴你們我選擇Python處理的原因是對(duì)Excel的Vlookup不熟悉的。

1 前言自述

這是我在工作中遇到的一個(gè)數(shù)據(jù)處理需求問(wèn)題，該問(wèn)題有兩種解決方式，一種是Office高效辦公，一種是Python高效辦公。是的，我選擇了后者。將解決該問(wèn)題的過(guò)程記錄下來(lái)，作為我使用Python高效辦公的一個(gè)紀(jì)念。在最后，為了方便其他沒(méi)有Python的同事使用，我還嘗試將該程序進(jìn)行了打包處理，發(fā)現(xiàn)雖然能打包，但是代碼行數(shù)增加了不少。因此，建議有Python基礎(chǔ)的朋友還是直接使用代碼比用打包好的程序比較好。

2 需求場(chǎng)景

有兩個(gè)excel文件，都放了大量的數(shù)據(jù)：

第一個(gè)excel文件：

第二個(gè)excel文件：

需求是：將兩個(gè)excel文件中的數(shù)據(jù)進(jìn)行匹配，當(dāng)兩個(gè)excel文件中的項(xiàng)目名稱和項(xiàng)目號(hào)都一樣的時(shí)候，將第二個(gè)excel文件中的合同號(hào)填入到第一個(gè)文件中的合同號(hào)中。即匹配兩列相同列名的數(shù)據(jù)，當(dāng)對(duì)應(yīng)行數(shù)的數(shù)據(jù)一模一樣的時(shí)候，在第一個(gè)excel文件中標(biāo)記新的數(shù)據(jù)出來(lái)。在這種情況下，通常是會(huì)面對(duì)大量數(shù)據(jù)，即兩個(gè)excel文件有上千條數(shù)據(jù)。為了方便理解，我將第二個(gè)文件中的不同用顏色標(biāo)了出來(lái)。

舉個(gè)例子：第二個(gè)excel文件中有兩個(gè)項(xiàng)目名稱A7（第三行和第七行），但對(duì)應(yīng)項(xiàng)目號(hào)能和第一個(gè)excel文件匹配得上的只有第3行，因此此時(shí)需要將第二個(gè)excel文件中第三行的合同號(hào)填入到第一個(gè)excel文件的序號(hào)7行對(duì)應(yīng)的合同號(hào)列表中。

3 代碼實(shí)現(xiàn)

import pandas as pd
# 讀取excel1和excel2數(shù)據(jù)
total_table = pd.read_excel('第一個(gè)excel文件.xlsx')
subset_table = pd.read_excel('第二個(gè)excel文件.xlsx')
# 在第一個(gè)excel中添加新列
total_table['合同號(hào)'] = ""
# 根據(jù)第二個(gè)excel數(shù)據(jù)進(jìn)行匹配和填充合同號(hào)
for index, row in subset_table.iterrows():
    # 獲取分表中的兩列內(nèi)容
    column1_match = row['項(xiàng)目名稱']
    column2_match = row['項(xiàng)目號(hào)']
    # 在第一個(gè)excel中查找匹配行
    matched_rows = total_table.loc[(total_table['項(xiàng)目名稱'] == column1_match) & (total_table['項(xiàng)目號(hào)'] == column2_match)]
    # 填充合同號(hào)
    total_table.loc[matched_rows.index, '合同號(hào)'] = row['合同號(hào)']
# 保存修改后的第一個(gè)excel數(shù)據(jù)到新的文件
total_table.to_excel('新增合同號(hào)的excel文件.xlsx', index=False)

4 運(yùn)行結(jié)果

總結(jié)

到此這篇關(guān)于Python處理數(shù)據(jù)之匹配兩個(gè)Excel文件數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python匹配兩個(gè)Excel數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: