python 使用pandas讀取csv文件的方法
在這里記錄一下,python使用pandas讀取文件的方法
用到pandas庫的read_csv函數(shù)
# -*- coding: utf-8 -*-
"""
Created on Mon Jan 24 16:48:32 2022
@author: zxy
"""
# 導(dǎo)入包
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import matplotlib.gridspec as gridspec
import seaborn as sns; plt.style.use('ggplot')
import sklearn
from sklearn.preprocessing import StandardScaler
from sklearn.model_selection import train_test_split
from sklearn.utils import shuffle
from sklearn.metrics import confusion_matrix
from sklearn.manifold import TSNE
# 導(dǎo)入并查看數(shù)據(jù)
crecreditcard_data=pd.read_csv('./creditcard.csv')
crecreditcard_data.shape,crecreditcard_data.info()
crecreditcard_data.describe()
crecreditcard_data.head()
# 看看欺詐與非欺詐的比例如何
count_classes=pd.value_counts(crecreditcard_data['Class'],sort=True).sort_index()
# 統(tǒng)計(jì)下具體數(shù)據(jù)
count_classes.value_counts()
# 也可以用count_classes[0],count_classes[1]看分別數(shù)據(jù)
count_classes.plot(kind='bar')
plt.show()
知識點(diǎn)擴(kuò)展:
pandas讀取csv文件的操作
1. 讀取csv文件
import pandas as pd
import numpy as np
# 讀取整個csv文件
csv_data = pd.read_csv("./stock_day.csv")
# 讀取指定列索引字段的數(shù)據(jù)
csv_data = pd.read_csv("./stock_day.csv", usecols=['open', 'close'])
# 將我們修改完的csv的文件保存到新的路徑下
csv_data.to_csv('demo.csv')觀察我們保存的文件的格式(行索引為我們的日期, 列索引為 open close) :

# 查看新保存的文件
new_data = read_csv('./demo.csv')觀察新保存的文件(我們在讀取的時候默認(rèn)給我們添加了新的行索引, 及Unnamed:0):

使用to_csv的時候, 我們可以給他傳入幾個參數(shù):
csv_data.to_csv('demo.csv', header=True, index=False)
to_csv這個方法中可以傳遞一些參數(shù):
DataFrame.to_csv(path_or_buf=None, sep=', ’, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None)
- path_or_buf :文件保存的路徑;
- sep :默認(rèn)是以 , 進(jìn)行分割 , 也可以自己制定;
- columns : 保存索引列和指定列;
- index:是否寫進(jìn)行索引 0或者1;
- header :boolean or list of string, default True,是否寫進(jìn)列索引值 0或者 1;
- na_rep=NaN: 缺失值保存為Na 如果不寫 默認(rèn)為空;
- float_format='%.2f' :保留兩位小數(shù);
再來回顧一下將我們的行索引裝成日期格式的方法:
# 生成一個時間的序列,略過周末非交易日
date = pd.date_range('2018-02-27', periods=new_data.shape[1], freq='B')
# index代表行索引,columns代表列索引
new_data = pd.DataFrame(new_data, index=date)到此這篇關(guān)于python 使用pandas讀取csv文件的方法的文章就介紹到這了,更多相關(guān)python 讀取csv文件內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- Python pymysql連接數(shù)據(jù)庫并將查詢結(jié)果轉(zhuǎn)化為Pandas dataframe
- Python Pandas創(chuàng)建Dataframe數(shù)據(jù)框的六種方法匯總
- python中pandas庫的iloc函數(shù)用法解析
- Python實(shí)踐之使用Pandas進(jìn)行數(shù)據(jù)分析
- 如何使用?Python?Pandas?更新行和列
- Python?中?Pandas?文件操作和讀取?CSV?參數(shù)詳解
- Python使用Pandas處理測試數(shù)據(jù)的方法
- Python?pandas中read_csv參數(shù)示例詳解
- Python使用pandas導(dǎo)入xlsx格式的excel文件內(nèi)容操作代碼
- python使用pandas讀取json文件并進(jìn)行刷選導(dǎo)出xlsx文件的方法示例
相關(guān)文章
在Python 3中緩存Exception對象會造成什么后果?
這篇文章主要介紹了在Python 3中緩存Exception對象到底會造成什么后果?下面帶著這個問題一起看看文章的解析,需要的朋友可以參考一下2021-12-12
解決pyecharts運(yùn)行后產(chǎn)生的html文件用瀏覽器打開空白
這篇文章主要介紹了解決pyecharts運(yùn)行后產(chǎn)生的html文件用瀏覽器打開空白,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-03-03
如何用Python和JS實(shí)現(xiàn)的Web SSH工具
這篇文章主要介紹了如何用Python和JS實(shí)現(xiàn)的Web SSH工具,本文給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價(jià)值,需要的朋友可以參考下2021-02-02
python的scipy.stats模塊中正態(tài)分布常用函數(shù)總結(jié)
在本篇內(nèi)容里小編給大家整理的是一篇關(guān)于python的scipy.stats模塊中正態(tài)分布常用函數(shù)總結(jié)內(nèi)容,有興趣的朋友們可以學(xué)習(xí)參考下。2021-02-02
如何導(dǎo)出python安裝的所有模塊名稱和版本號到文件中
Python 模塊(Module),是一個 Python 文件,以 .py 結(jié)尾,包含了 Python 對象定義和Python語句。這篇文章主要介紹了如何導(dǎo)出python安裝的所有模塊名稱和版本號到文件中,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),需要的朋友可以參考下2020-06-06
如何把外網(wǎng)python虛擬環(huán)境遷移到內(nèi)網(wǎng)
這篇文章主要介紹了如何把外網(wǎng)python虛擬環(huán)境遷移到內(nèi)網(wǎng),文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05
Python數(shù)據(jù)模型與Python對象模型的相關(guān)總結(jié)
這篇文章主要介紹了Python數(shù)據(jù)模型與Python對象模型的相關(guān)總結(jié),幫助大家更好的理解和學(xué)習(xí)python,感興趣的朋友可以了解下2021-01-01

