python 讀取.csv文件數(shù)據(jù)到數(shù)組(矩陣)的實(shí)例講解
利用numpy庫
(缺點(diǎn):有缺失值就無法讀?。?/strong>
讀:
import numpy my_matrix = numpy.loadtxt(open("1.csv","rb"),delimiter=",",skiprows=0)
寫:
numpy.savetxt('2.csv', my_matrix, delimiter = ',')
可能遇到的問題:
SyntaxError: (unicode error) 'unicodeescape' codec can't decode bytes in position
原因是文件路徑名中含有轉(zhuǎn)義字符,將路徑中的\換成\即可。
利用pandas庫
讀:(可以處理缺失值)
>>> import pandas as pd >>> df = pd.read_csv('D:\Python\\l\B_train1.csv') >>> df.values >>> df.as_matrix(columns=None)
寫:(將dataFrame直接寫入)
>>> testB = test[test.intersection_id.isin(["B"])] >>> pd.DataFrame.to_csv(testB,"D:\Python\\k\\t5B.csv") #testB是個(gè)dataFrame
利用sklearn包中的Imputer處理缺失值
>>> m = df.as_matrix(columns=None) >>> from sklearn.preprocessing import Imputer >>> imp = Imputer(missing_values='NaN', strategy='mean', axis=0) >>> imp.fit(m) Imputer(axis=0, copy=True, missing_values='NaN', strategy='mean', verbose=0) >>> imp.transform(m)
以上這篇python 讀取.csv文件數(shù)據(jù)到數(shù)組(矩陣)的實(shí)例講解就是小編分享給大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python進(jìn)程Multiprocessing模塊原理解析
這篇文章主要介紹了Python進(jìn)程Multiprocessing模塊原理解析,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-02-02Python實(shí)現(xiàn)XGBoost算法的應(yīng)用實(shí)戰(zhàn)
XGBoost(Extreme Gradient Boosting)是一種高效且廣泛使用的集成學(xué)習(xí)算法,它屬于梯度提升樹(GBDT)模型的一種改進(jìn),本文將結(jié)合實(shí)際案例,詳細(xì)介紹如何在Python中使用XGBoost算法進(jìn)行模型訓(xùn)練和預(yù)測,需要的朋友可以參考下2024-08-08手把手教你如何使python變?yōu)榭蓤?zhí)行文件
對于exe可執(zhí)行文件,相信大家都不陌生,下面這篇文章主要給大家介紹了關(guān)于如何使python變?yōu)榭蓤?zhí)行文件的相關(guān)資料,文中通過圖文介紹的非常詳細(xì),需要的朋友可以參考下2023-02-02python批量生成身份證號到Excel的兩種方法實(shí)例
這篇文章主要給大家介紹了關(guān)于python批量生成身份證號到Excel的兩種方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01Django {{ MEDIA_URL }}無法顯示圖片的解決方式
這篇文章主要介紹了Django {{ MEDIA_URL }}無法顯示圖片的解決方式,具有很好的參考價(jià)值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-04-04