Python讀csv文件去掉一列后再寫入新的文件實例

更新時間：2017年12月28日 14:35:37 作者：卡路西法

下面小編就為大家分享一篇Python讀csv文件去掉一列后再寫入新的文件實例，具有很的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧

用了兩種方式解決該問題，都是網(wǎng)上現(xiàn)有的解決方案。

場景說明：

有一個數(shù)據(jù)文件，以文本方式保存，現(xiàn)在有三列user_id,plan_id,mobile_id。目標是得到新文件只有mobile_id,plan_id。

解決方案

方案一：用python的打開文件寫文件的方式直接擼一遍數(shù)據(jù)，for循環(huán)內(nèi)處理數(shù)據(jù)并寫入到新文件。

代碼如下：

def readwrite1( input_file,output_file):
 f = open(input_file, 'r')
 out = open(output_file,'w')
 print (f)
 for line in f.readlines():
 a = line.split(",")
 x=a[0] + "," + a[1]+"\n"
 out.writelines(x)
 f.close()
 out.close()

方案二：用 pandas 讀數(shù)據(jù)到 DataFrame 再做數(shù)據(jù)分割，直接用 DataFrame 的寫入功能寫到新文件

代碼如下：

def readwrite2(input_file,output_file): date_1=pd.read_csv(input_file,header=0,sep=',') date_1[['mobile', 'plan_id']].to_csv(output_file, sep=',', header=True,index=False)

從代碼上看，pandas邏輯更清晰。

下面看下執(zhí)行的效率吧！

def getRunTimes( fun ,input_file,output_file):
 begin_time=int(round(time.time() * 1000))
 fun(input_file,output_file)
 end_time=int(round(time.time() * 1000))
 print("讀寫運行時間：",(end_time-begin_time),"ms")

getRunTimes(readwrite1,input_file,output_file) #直接擼數(shù)據(jù)
getRunTimes(readwrite2,input_file,output_file1) #使用dataframe讀寫數(shù)據(jù)

讀寫運行時間： 976 ms

讀寫運行時間： 777 ms

input_file 大概有27萬的數(shù)據(jù)，dataframe的效率比for循環(huán)效率還是要快一點的，如果數(shù)據(jù)量更大些，效果是否更明顯呢？

下面試下增加input_file記錄的數(shù)量試試，有如下結(jié)果

input_file	readwrite1	readwrite2
27W	976	777
55W	1989	1509
110W	4312	3158

從上面測試結(jié)果來看,dataframe的效率提高大約30%左右。

以上這篇Python讀csv文件去掉一列后再寫入新的文件實例就是小編分享給大家的全部內(nèi)容了，希望能給大家一個參考，也希望大家多多支持腳本之家。

您可能感興趣的文章:

Python自動重新加載模塊詳解(autoreload module)
這篇文章主要介紹了Python自動重新加載模塊詳解(autoreload module)，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2020-04-04
python超時重新請求解決方案
這篇文章主要介紹了python超時重新請求解決方案,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2019-10-10
Python面向?qū)ο蟪绦蛟O計之靜態(tài)方法、類方法、屬性方法原理與用法分析
這篇文章主要介紹了Python面向?qū)ο蟪绦蛟O計之靜態(tài)方法、類方法、屬性方法,結(jié)合實例形式分析了Python靜態(tài)方法、類方法、屬性方法相關概念、原理、用法及相關操作注意事項,需要的朋友可以參考下
2020-03-03
Python生成器實現(xiàn)簡單"生產(chǎn)者消費者"模型代碼實例
這篇文章主要介紹了Python生成器實現(xiàn)簡單"生產(chǎn)者消費者"模型代碼實例,文中通過示例代碼介紹的非常詳細，對大家的學習或者工作具有一定的參考學習價值,需要的朋友可以參考下
2020-03-03
Python3如何根據(jù)函數(shù)名動態(tài)調(diào)用函數(shù)
這篇文章主要介紹了Python3如何根據(jù)函數(shù)名動態(tài)調(diào)用函數(shù)問題,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
2023-11-11
python_tkinter彈出對話框創(chuàng)建2
這篇文章主要介紹了python_tkinter彈出對話框創(chuàng)建，上以篇文章我們簡單的對對話框創(chuàng)建做了簡單介紹，本文將繼續(xù)更多相關內(nèi)容，需要的小伙伴可以參考一下
2022-03-03
python的幾種開發(fā)工具介紹
python的幾種開發(fā)工具介紹...
2007-03-03
批標準化層 tf.keras.layers.Batchnormalization()解析
這篇文章主要介紹了批標準化層 tf.keras.layers.Batchnormalization()，具有很好的參考價值，希望對大家有所幫助。如有錯誤或未考慮完全的地方，望不吝賜教
2023-02-02
mac 安裝python網(wǎng)絡請求包requests方法
今天小編就為大家分享一篇mac 安裝python網(wǎng)絡請求包requests方法，具有很好的參考價值，希望對大家有所幫助。一起跟隨小編過來看看吧
2018-06-06
Python利用Beautiful Soup模塊搜索內(nèi)容詳解
這篇文章主要給大家介紹了python中 Beautiful Soup 模塊的搜索方法函數(shù)。方法不同類型的過濾參數(shù)能夠進行不同的過濾，得到想要的結(jié)果。文中介紹的非常詳細，對大家具有一定的參考價值，需要的朋友們下面來一起看看吧。
2017-03-03