python數(shù)據(jù)分析之文件讀取詳解
前言:
如果你使用的是Anaconda中的Jupyter,則不需要下載Pands和Numpy庫;如果你使用的是pycharm或其他集成環(huán)境,則需要Pands和Numpy庫
一·Numpy庫中操作文件
1.操作csv文件
import numpy as np a=np.random.randint(0,10,size=(3,4)) np.savetext("score.csv",a,deliminter=",")
a:自己隨便創(chuàng)建的數(shù)組,deliminter:分隔符,score:要讀取的文件名
或者
import numpy as np data=np.loadtxt("score.csv",delimiter=",",skiprows=1,dtype=str)
skiprows:跳過第一行,dtype:數(shù)據(jù)讀出的類型為字符型
2.在pycharm中操作csv文件
import csv with open("score.csv",'r')as fp: reader=csv.reader(fp) for x in reader: print(x)
reader:迭代器
3.其他情況(.npy類型文件)
import numpy as np c=np.random.randint(0,10,size=(2,3)) np.save("文件名",c) c1=np.load("文件名.npy")
二·Pandas庫中操作文件
1.操作csv文件
import pandas as pd df=pd.read_csv("exl.csv")
或者
import pandas as pd pd.read_table("exl.csv",sep=',')
sep:分隔符
2.從剪貼板上復(fù)制數(shù)據(jù)
import pandas as pd BS=pd.read_clipboard
3.讀取excel或xlsx文件
import pandas as pd df=read_excel("exl.xlsx")
三·補(bǔ)充
1.常用
import osos.chdir()
chdir()中寫上你想讀取文件的目錄,表示將目錄轉(zhuǎn)化到你想讀取文件的目錄.
2.pandas中讀取文件的函數(shù)
read_csv? 從文件,URL,文件型對象中加載帶分隔符的數(shù)據(jù)。默認(rèn)分隔符為逗號
read_table? ?同上,但默認(rèn)分隔符為制表符(“t”)
read_fwf? 讀取定寬列格式數(shù)據(jù)(無分隔符)
read_clipboard? 讀取剪貼板中的數(shù)據(jù)
read_excel? 從Excel 或xlsx文件中讀取表格數(shù)據(jù)
read_hdf? ?讀取pandas寫的HDF5文件
read_html? 讀取html文檔中的所以表格
read_json? ? 讀取json字符串中的數(shù)據(jù)
read_msgpack 二進(jìn)制格式編碼的pandas數(shù)據(jù)
read_pickle? 讀取python pickle 格式中存儲(chǔ)的任意對象
read_sas? ?讀取存儲(chǔ)于SAS系統(tǒng)自定義存儲(chǔ)格式為SAS數(shù)據(jù)集
read_sql? ?讀取SQL查詢結(jié)果為pandas的DataFrame
read_stata 讀取stata文件格式的數(shù)據(jù)集
總結(jié)
到此這篇關(guān)于python數(shù)據(jù)分析之文件讀取詳解的文章就介紹到這了,更多相關(guān)python文件讀取內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
matplotlib繪制多個(gè)子圖(subplot)的方法
這篇文章主要介紹了matplotlib繪制多個(gè)子圖(subplot)的方法,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-12-12python用分?jǐn)?shù)表示矩陣的方法實(shí)例
這篇文章主要給大家介紹了關(guān)于python如何利用分?jǐn)?shù)表示矩陣的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01Python opencv醫(yī)學(xué)處理的實(shí)現(xiàn)過程
這篇文章主要介紹了Python opencv醫(yī)學(xué)處理的實(shí)現(xiàn)過程,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-05-05Python基于動(dòng)態(tài)規(guī)劃算法解決01背包問題實(shí)例
這篇文章主要介紹了Python基于動(dòng)態(tài)規(guī)劃算法解決01背包問題,結(jié)合實(shí)例形式分析了Python動(dòng)態(tài)規(guī)劃算法解決01背包問題的原理與具體實(shí)現(xiàn)技巧,需要的朋友可以參考下2017-12-12Python3.7安裝PyQt5 運(yùn)行配置Pycharm的詳細(xì)教程
這篇文章主要介紹了Python3.7成功安裝心得PyQt5 PyQt5-tools QT designer.exe運(yùn)行配置Pycharm 將.ui文件翻譯成.py文件,本文給大家介紹的非常詳細(xì),需要的朋友可以參考下2020-10-10pandas中DataFrame檢測重復(fù)值的實(shí)現(xiàn)
本文主要介紹了pandas DataFrame檢測重復(fù)值,主要包括了檢查整行整列的檢測,以及多列是否重復(fù),需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2021-05-05