快捷導(dǎo)航

python讀取與寫入csv格式文件的示例代碼

更新時(shí)間：2017年12月16日 10:54:23 作者：暴走小飛鼠

本篇文章主要介紹了python讀取與寫入csv格式文件的示例代碼，小編覺得挺不錯(cuò)的，現(xiàn)在分享給大家，也給大家做個(gè)參考。一起跟隨小編過來看看吧

在數(shù)據(jù)分析中經(jīng)常需要從csv格式的文件中存取數(shù)據(jù)以及將數(shù)據(jù)寫書到csv文件中。將csv文件中的數(shù)據(jù)直接讀取為 dict 類型和 DataFrame 是非常方便也很省事的一種做法，以下代碼以鳶尾花數(shù)據(jù)為例。

csv文件讀取為dict

代碼

 # -*- coding: utf-8 -*-
import csv
with open('E:/iris.csv') as csvfile:
reader = csv.DictReader(csvfile, fieldnames=None) # fieldnames默認(rèn)為None,如果所讀csv文件沒有表頭，則需要指定
list_1 = [e for e in reader] # 每行數(shù)據(jù)作為一個(gè)dict存入鏈表中
csvfile.close()
print list_1[0]

輸出

{'Petal.Length': '1.4', 'Sepal.Length': '5.1', 'Petal.Width': '0.2', 'Sepal.Width': '3.5', 'Species': 'setosa'}

如果讀入的每條數(shù)據(jù)需要單獨(dú)處理且數(shù)據(jù)量較大，推薦逐條處理然后再放入。

 list_1 = list()
for e in reader:
 list_1.append(your_func(e)) # your_func為每條數(shù)據(jù)的處理函數(shù)

多條類型為dict的數(shù)據(jù)寫入csv文件

代碼

 # 數(shù)據(jù)
data = [
{'Petal.Length': '1.4', 'Sepal.Length': '5.1', 'Petal.Width': '0.2', 'Sepal.Width': '3.5', 'Species': 'setosa'},
{'Petal.Length': '1.4', 'Sepal.Length': '4.9', 'Petal.Width': '0.2', 'Sepal.Width': '3', 'Species': 'setosa'},
{'Petal.Length': '1.3', 'Sepal.Length': '4.7', 'Petal.Width': '0.2', 'Sepal.Width': '3.2', 'Species': 'setosa'},
{'Petal.Length': '1.5', 'Sepal.Length': '4.6', 'Petal.Width': '0.2', 'Sepal.Width': '3.1', 'Species': 'setosa'}
]
# 表頭
header = ['Petal.Length', 'Sepal.Length', 'Petal.Width', 'Sepal.Width', 'Species']
print len(data)
with open('E:/dst.csv', 'wb') as dstfile: #寫入方式選擇wb，否則有空行
 writer = csv.DictWriter(dstfile, fieldnames=header)
 writer.writeheader() # 寫入表頭
 writer.writerows(data) # 批量寫入
dstfile.close()

上述代碼將數(shù)據(jù)整體寫入csv文件，如果數(shù)據(jù)量較多且想實(shí)時(shí)查看寫入了多少數(shù)據(jù)可以使用 writerows 函數(shù)。

讀取csv文件為DataFrame

代碼

 # 讀取csv文件為DataFrame
import pandas as pd
dframe = pd.DataFrame.from_csv('E:/iris.csv')

也可以稍微曲折點(diǎn)：

import csv
import pandas as pd
with open('E:/iris.csv') as csvfile:
 reader = csv.DictReader(csvfile, fieldnames=None) # fieldnames默認(rèn)為None,如果所讀csv文件沒有表頭，則需要指定
 list_1 = [e for e in reader] # 每行數(shù)據(jù)作為一個(gè)dict存入鏈表中
csvfile.close()
dfrme = pd.DataFrame.from_records(list_1)

從zip文件中讀取指定csv文件為DataFrame

dst.zip文件中包含有dst.csv和其它文件，現(xiàn)在在不解壓縮的情況下直接讀取dst.csv文件為DataFrame.

import pandas as pd
import zipfile
z_file = zipfile.ZipFile('E:/dst.zip')
dframe = pd.read_csv(z_file.open('dst.csv'))
z_file.close()
print dframe

DataFrame寫入csv文件

dfrme.to_csv('E:/dst.csv', index=False) # 不要每行的編號(hào)

讀取txt文件為DataFrame

import pandas as pd
# `path`為文件路徑或文件句柄，`header`文件第一行是否是表頭，`delimiter`每個(gè)字段的分隔符，`dtype`數(shù)據(jù)讀入后的存儲(chǔ)類型。
frame = pd.read_table(path, header=None, index_col=False, delimiter='\t', dtype=str)

以上就是本文的全部?jī)?nèi)容，希望對(duì)大家的學(xué)習(xí)有所幫助，也希望大家多多支持腳本之家。

您可能感興趣的文章: