python:pandas合并csv文件的方法(圖書數(shù)據(jù)集成)
數(shù)據(jù)集成:將不同表的數(shù)據(jù)通過主鍵進(jìn)行連接起來,方便對(duì)數(shù)據(jù)進(jìn)行整體的分析。
兩張表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:

ReaderRentRecode.csv:

pandas讀取csv文件,并進(jìn)行csv文件合并處理:
# -*- coding:utf-8 -*-
import csv as csv
import numpy as np
# -------------
# csv讀取表格數(shù)據(jù)
# -------------
'''
csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb'))
header = csv_file_object.next()
print header
print type(header)
print header[1]
data = []
for row in csv_file_object:
data.append(row)
data = np.array(data)
print data[0::, 0]
'''
# -------------
# pandas讀取表格數(shù)據(jù)
# -------------
import pandas as pd
df = pd.read_csv('ReaderRentRecode.csv') # 讀者借閱信息表
'''
print df.head()
print '----------------'
print df[['讀者證號(hào)', '讀者姓名', '書名', '中圖法分類號(hào)']] # 選取其中的四列
print '------------------------------------------------------------------'
print
'''
dd = pd.read_csv('ReaderInformation.csv')
'''
print dd.head()
print '----------------'
print dd[['讀者證號(hào)', '讀者性別', '讀者單位', '讀者類別']]
print '------------------------------------------------------------------'
print
'''
data = pd.merge(df, dd, on=['讀者證號(hào)', '讀者姓名'], how='left') # pandas csv表左連接
data = data[['讀者證號(hào)', '讀者姓名', '讀者性別', '書名', '中圖法分類號(hào)', '讀者單位', '讀者類別']]
print data
print '------------------------------------------------------------------'
print
# -------------
# pandas寫入表格數(shù)據(jù)
# -------------
data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv

通過使用pandas的函數(shù)merge來進(jìn)行兩個(gè)表的左連接,最后得到相應(yīng)的data.csv文件。
以上這篇python:pandas合并csv文件的方法(圖書數(shù)據(jù)集成)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
django model去掉unique_together報(bào)錯(cuò)的解決方案
本文給大家分享的是在使用django model去掉unique_together時(shí)報(bào)錯(cuò)的解決思路和具體步驟,提供給大家參考下,希望對(duì)大家學(xué)習(xí)使用django能夠有所幫助2016-10-10
python讀取文件列表并排序的實(shí)現(xiàn)示例
本文主要介紹了python讀取文件列表并排序的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-07-07

