python:pandas合并csv文件的方法(圖書數(shù)據(jù)集成)
數(shù)據(jù)集成:將不同表的數(shù)據(jù)通過主鍵進(jìn)行連接起來,方便對數(shù)據(jù)進(jìn)行整體的分析。
兩張表:ReaderInformation.csv,ReaderRentRecode.csv
ReaderInformation.csv:
ReaderRentRecode.csv:
pandas讀取csv文件,并進(jìn)行csv文件合并處理:
# -*- coding:utf-8 -*- import csv as csv import numpy as np # ------------- # csv讀取表格數(shù)據(jù) # ------------- ''' csv_file_object = csv.reader(codecs.open('ReaderRentRecode.csv', 'rb')) header = csv_file_object.next() print header print type(header) print header[1] data = [] for row in csv_file_object: data.append(row) data = np.array(data) print data[0::, 0] ''' # ------------- # pandas讀取表格數(shù)據(jù) # ------------- import pandas as pd df = pd.read_csv('ReaderRentRecode.csv') # 讀者借閱信息表 ''' print df.head() print '----------------' print df[['讀者證號', '讀者姓名', '書名', '中圖法分類號']] # 選取其中的四列 print '------------------------------------------------------------------' print ''' dd = pd.read_csv('ReaderInformation.csv') ''' print dd.head() print '----------------' print dd[['讀者證號', '讀者性別', '讀者單位', '讀者類別']] print '------------------------------------------------------------------' print ''' data = pd.merge(df, dd, on=['讀者證號', '讀者姓名'], how='left') # pandas csv表左連接 data = data[['讀者證號', '讀者姓名', '讀者性別', '書名', '中圖法分類號', '讀者單位', '讀者類別']] print data print '------------------------------------------------------------------' print # ------------- # pandas寫入表格數(shù)據(jù) # ------------- data.to_csv(r'data.csv', encoding='gbk')
合并后的csv文件:data.csv
通過使用pandas的函數(shù)merge來進(jìn)行兩個(gè)表的左連接,最后得到相應(yīng)的data.csv文件。
以上這篇python:pandas合并csv文件的方法(圖書數(shù)據(jù)集成)就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
django model去掉unique_together報(bào)錯(cuò)的解決方案
本文給大家分享的是在使用django model去掉unique_together時(shí)報(bào)錯(cuò)的解決思路和具體步驟,提供給大家參考下,希望對大家學(xué)習(xí)使用django能夠有所幫助2016-10-10python讀取文件列表并排序的實(shí)現(xiàn)示例
本文主要介紹了python讀取文件列表并排序的實(shí)現(xiàn)示例,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2022-07-07