欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python如何讀取、寫入CSV數(shù)據(jù)

 更新時(shí)間:2020年07月28日 09:08:23   作者:看云  
這篇文章主要介紹了Python如何讀寫CSV數(shù)據(jù),文中講解非常細(xì)致,代碼幫助大家更好的理解和學(xué)習(xí),感興趣的朋友可以了解下

問題

你想讀寫一個(gè)CSV格式的文件。

解決方案

對(duì)于大多數(shù)的CSV格式的數(shù)據(jù)讀寫問題,都可以使用 csv 庫。、例如,假設(shè)你在一個(gè)名叫stocks.csv文件中有一些股票市場(chǎng)數(shù)據(jù),就像這樣:

下面向你展示如何將這些數(shù)據(jù)讀取為一個(gè)元組的序列:

import csv
with open('stocks.csv') as f:
 f_csv = csv.reader(f)
 headers = next(f_csv)
 for row in f_csv:
  # Process row
  ...

在上面的代碼中,row 會(huì)是一個(gè)元組。因此,為了訪問某個(gè)字段,你需要使用下標(biāo),如row[0]訪問Symbol,row[4]訪問Change。

由于這種下標(biāo)訪問通常會(huì)引起混淆,你可以考慮使用命名元組。例如:

from collections import namedtuple
with open('stock.csv') as f:
 f_csv = csv.reader(f)
 headings = next(f_csv)
 Row = namedtuple('Row', headings)
 for r in f_csv:
  row = Row(*r)
  # Process row
  ...

它允許你使用列名如 row.Symbol 和 row.Change 代替下標(biāo)訪問。需要注意的是這個(gè)只有在列名是合法的Python標(biāo)識(shí)符的時(shí)候才生效。如果不是的話,你可能需要修改下原始的列名(如將非標(biāo)識(shí)符字符替換成下劃線之類的)。

另外一個(gè)選擇就是將數(shù)據(jù)讀取到一個(gè)字典序列中去。可以這樣做:

import csv
with open('stocks.csv') as f:
 f_csv = csv.DictReader(f)
 for row in f_csv:
  # process row
  ...

在這個(gè)版本中,你可以使用列名去訪問每一行的數(shù)據(jù)了。比如,row['Symbol'] 或者 row['Change'] 。

為了寫入CSV數(shù)據(jù),你仍然可以使用csv模塊,不過這時(shí)候先創(chuàng)建一個(gè) writer 對(duì)象。例如;

headers = ['Symbol','Price','Date','Time','Change','Volume']
rows = [('AA', 39.48, '6/11/2007', '9:36am', -0.18, 181800),
   ('AIG', 71.38, '6/11/2007', '9:36am', -0.15, 195500),
   ('AXP', 62.58, '6/11/2007', '9:36am', -0.46, 935000),
  ]

with open('stocks.csv','w') as f:
 f_csv = csv.writer(f)
 f_csv.writerow(headers)
 f_csv.writerows(rows)

如果你有一個(gè)字典序列的數(shù)據(jù),可以像這樣做:

headers = ['Symbol', 'Price', 'Date', 'Time', 'Change', 'Volume']
rows = [{'Symbol':'AA', 'Price':39.48, 'Date':'6/11/2007',
  'Time':'9:36am', 'Change':-0.18, 'Volume':181800},
  {'Symbol':'AIG', 'Price': 71.38, 'Date':'6/11/2007',
  'Time':'9:36am', 'Change':-0.15, 'Volume': 195500},
  {'Symbol':'AXP', 'Price': 62.58, 'Date':'6/11/2007',
  'Time':'9:36am', 'Change':-0.46, 'Volume': 935000},
  ]

with open('stocks.csv','w') as f:
 f_csv = csv.DictWriter(f, headers)
 f_csv.writeheader()
 f_csv.writerows(rows)

討論

你應(yīng)該總是優(yōu)先選擇csv模塊分割或解析CSV數(shù)據(jù)。例如,你可能會(huì)像編寫類似下面這樣的代碼:

with open('stocks.csv') as f:
for line in f:
 row = line.split(',')
 # process row
 ...

使用這種方式的一個(gè)缺點(diǎn)就是你仍然需要去處理一些棘手的細(xì)節(jié)問題。比如,如果某些字段值被引號(hào)包圍,你不得不去除這些引號(hào)。另外,如果一個(gè)被引號(hào)包圍的字段碰巧含有一個(gè)逗號(hào),那么程序就會(huì)因?yàn)楫a(chǎn)生一個(gè)錯(cuò)誤大小的行而出錯(cuò)。

默認(rèn)情況下,csv 庫可識(shí)別Microsoft Excel所使用的CSV編碼規(guī)則。這或許也是最常見的形式,并且也會(huì)給你帶來最好的兼容性。然而,如果你查看csv的文檔,就會(huì)發(fā)現(xiàn)有很多種方法將它應(yīng)用到其他編碼格式上(如修改分割字符等)。例如,如果你想讀取以tab分割的數(shù)據(jù),可以這樣做:

# Example of reading tab-separated values
with open('stock.tsv') as f:
 f_tsv = csv.reader(f, delimiter='\t')
 for row in f_tsv:
  # Process row
  ...

如果你正在讀取CSV數(shù)據(jù)并將它們轉(zhuǎn)換為命名元組,需要注意對(duì)列名進(jìn)行合法性認(rèn)證。例如,一個(gè)CSV格式文件有一個(gè)包含非法標(biāo)識(shí)符的列頭行,類似下面這樣:

這樣最終會(huì)導(dǎo)致在創(chuàng)建一個(gè)命名元組時(shí)產(chǎn)生一個(gè) ValueError 異常而失敗。為了解決這問題,你可能不得不先去修正列標(biāo)題。例如,可以像下面這樣在非法標(biāo)識(shí)符上使用一個(gè)正則表達(dá)式替換:

import re
with open('stock.csv') as f:
 f_csv = csv.reader(f)
 headers = [ re.sub('[^a-zA-Z_]', '_', h) for h in next(f_csv) ]
 Row = namedtuple('Row', headers)
 for r in f_csv:
  row = Row(*r)
  # Process row
  ...

還有重要的一點(diǎn)需要強(qiáng)調(diào)的是,csv產(chǎn)生的數(shù)據(jù)都是字符串類型的,它不會(huì)做任何其他類型的轉(zhuǎn)換。如果你需要做這樣的類型轉(zhuǎn)換,你必須自己手動(dòng)去實(shí)現(xiàn)。下面是一個(gè)在CSV數(shù)據(jù)上執(zhí)行其他類型轉(zhuǎn)換的例子:

col_types = [str, float, str, str, float, int]
with open('stocks.csv') as f:
 f_csv = csv.reader(f)
 headers = next(f_csv)
 for row in f_csv:
  # Apply conversions to the row items
  row = tuple(convert(value) for convert, value in zip(col_types, row))
  ...

另外,下面是一個(gè)轉(zhuǎn)換字典中特定字段的例子:

print('Reading as dicts with type conversion')
field_types = [ ('Price', float),
    ('Change', float),
    ('Volume', int) ]

with open('stocks.csv') as f:
 for row in csv.DictReader(f):
  row.update((key, conversion(row[key]))
    for key, conversion in field_types)
  print(row)

通常來講,你可能并不想過多去考慮這些轉(zhuǎn)換問題。在實(shí)際情況中,CSV文件都或多或少有些缺失的數(shù)據(jù),被破壞的數(shù)據(jù)以及其它一些讓轉(zhuǎn)換失敗的問題。因此,除非你的數(shù)據(jù)確實(shí)有保障是準(zhǔn)確無誤的,否則你必須考慮這些問題(你可能需要增加合適的錯(cuò)誤處理機(jī)制)。

最后,如果你讀取CSV數(shù)據(jù)的目的是做數(shù)據(jù)分析和統(tǒng)計(jì)的話,你可能需要看一看 Pandas 包。Pandas 包含了一個(gè)非常方便的函數(shù)叫 pandas.read_csv() ,它可以加載CSV數(shù)據(jù)到一個(gè) DataFrame 對(duì)象中去。然后利用這個(gè)對(duì)象你就可以生成各種形式的統(tǒng)計(jì)、過濾數(shù)據(jù)以及執(zhí)行其他高級(jí)操作了。

以上就是Python如何讀寫CSV數(shù)據(jù)的詳細(xì)內(nèi)容,更多關(guān)于Python讀寫CSV數(shù)據(jù)的資料請(qǐng)關(guān)注腳本之家其它相關(guān)文章!

相關(guān)文章

  • python?實(shí)現(xiàn)銀行卡號(hào)查詢銀行名稱和簡(jiǎn)稱功能

    python?實(shí)現(xiàn)銀行卡號(hào)查詢銀行名稱和簡(jiǎn)稱功能

    這篇文章主要介紹了python?實(shí)現(xiàn)銀行卡號(hào)查詢銀行名稱和簡(jiǎn)稱功能,本文通過實(shí)例代碼補(bǔ)充介紹了基于PyQT5+OpenCv實(shí)現(xiàn)銀行卡號(hào)識(shí)別功能,感興趣的朋友一起看看吧
    2023-11-11
  • django的安裝和創(chuàng)建應(yīng)用過程詳解

    django的安裝和創(chuàng)建應(yīng)用過程詳解

    這篇文章主要介紹了django的安裝和創(chuàng)建應(yīng)用,本文通過圖文并茂的形式給大家介紹的非常詳細(xì),需要的朋友可以參考下
    2023-07-07
  • np.meshgrid中的indexing參數(shù)問題解決

    np.meshgrid中的indexing參數(shù)問題解決

    本文主要介紹了np.meshgrid中的indexing參數(shù)問題解決,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2023-03-03
  • python執(zhí)行數(shù)據(jù)庫的查詢操作實(shí)例講解

    python執(zhí)行數(shù)據(jù)庫的查詢操作實(shí)例講解

    在本篇文章里小編給大家整理了一篇關(guān)于python執(zhí)行數(shù)據(jù)庫的查詢操作實(shí)例講解內(nèi)容,有需要的朋友們可以參考學(xué)習(xí)下。
    2021-10-10
  • Python報(bào)錯(cuò)ValueError: cannot reindex from a duplicate axis的解決方法

    Python報(bào)錯(cuò)ValueError: cannot reindex from 

    當(dāng)處理Pandas數(shù)據(jù)框(DataFrame)時(shí),你是否遇到過ValueError: cannot reindex from a duplicate axis的報(bào)錯(cuò)?這個(gè)問題通常發(fā)生在嘗試對(duì)DataFrame進(jìn)行重索引時(shí),如果索引有重復(fù)值,就會(huì)觸發(fā)這個(gè)錯(cuò)誤,下面,我們將探討這個(gè)問題并提供解決方法
    2024-09-09
  • Python庫AutoTS一行代碼得到最強(qiáng)時(shí)序基線

    Python庫AutoTS一行代碼得到最強(qiáng)時(shí)序基線

    AutoTS它是一個(gè)用于自動(dòng)時(shí)間序列分析的 Python 庫。AutoTS 允許我們用一行代碼訓(xùn)練多個(gè)時(shí)間序列模型,以便我們可以選擇最適合的模型,今天介紹一種非常霸道的工具,融合了自動(dòng)化機(jī)器學(xué)習(xí)技術(shù)開發(fā)的AutoTS
    2022-03-03
  • Eclipse和PyDev搭建完美Python開發(fā)環(huán)境教程(Windows篇)

    Eclipse和PyDev搭建完美Python開發(fā)環(huán)境教程(Windows篇)

    這篇文章主要介紹了Eclipse和PyDev搭建完美Python開發(fā)環(huán)境教程(Windows篇),具有一定的參考價(jià)值,感興趣的小伙伴可以了解一下。
    2016-11-11
  • 利用numpy和pandas處理csv文件中的時(shí)間方法

    利用numpy和pandas處理csv文件中的時(shí)間方法

    下面小編就為大家分享一篇利用numpy和pandas處理csv文件中的時(shí)間方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧
    2018-04-04
  • 一文帶你搞懂Python中的數(shù)據(jù)容器

    一文帶你搞懂Python中的數(shù)據(jù)容器

    這篇文章主要為大家詳細(xì)介紹了Python中數(shù)據(jù)容器的相關(guān)資料,文中的示例代碼講解詳細(xì),對(duì)我們學(xué)習(xí)Python有一定的幫助,感興趣的可以了解一下
    2022-11-11
  • python的urllib.parse用法及說明

    python的urllib.parse用法及說明

    這篇文章主要介紹了python的urllib.parse用法及說明,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2023-09-09

最新評(píng)論