Python從csv文件中讀取數(shù)據(jù)及提取數(shù)據(jù)的方法
數(shù)據(jù)保存在csv文件中

1.從csv文件中讀取數(shù)據(jù)
參數(shù)header=None的有無
(1)沒有header=None——直接將csv表中的第一行當(dāng)作表頭
# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv")
print(data)
打印結(jié)果為:

(2)有header=None——自動(dòng)添加第一行當(dāng)作表頭
# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv",header=None)
print(data)
打印結(jié)果為:

2.數(shù)據(jù)切割
(這里根據(jù)csv表的格式,將header=None不寫)
(1)獲取所有列,并存入一個(gè)數(shù)組中
# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv")
# print(data)
# ①獲取所有列,并存入一個(gè)數(shù)組中
import numpy as np
data = np.array(data)
print(data) # 用戶編號(hào) 性別 年齡(歲) 年收入(元) 是否購(gòu)買
# [[15624510 1 19 19000 0]
# [15810944 1 35 20000 0]
# [15668575 2 26 43000 0]
# [15603246 2 27 57000 0]
# [ ... ... ... ... ...]]
(2)獲取指定列的數(shù)據(jù),并存入一個(gè)數(shù)組中
方法一:從csv文件獲取data,data[ ] ——需要考慮數(shù)據(jù)的維度問題
# 讀取數(shù)據(jù)
import pandas as pd
data = pd.read_csv("data1.csv")
print(data) # 用戶編號(hào) 性別 年齡(歲) 年收入(元) 是否購(gòu)買
# (1)獲取第1列,并存入一個(gè)數(shù)組中
import numpy as np
col_1 = data["用戶編號(hào)"] #獲取一列,用一維數(shù)據(jù)
data_1 = np.array(col_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
# 15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
# 15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
# 15705113 15631159 15792818 15633531 15744529]
# (2)獲取第1,2列
col_12 = data[["用戶編號(hào)","性別"]] #獲取兩列,要用二維數(shù)據(jù)
data_12 = np.array(col_12)
print(data_12)
# [[15624510 1]
# [15810944 1]
# [15668575 2]
# [15603246 2]
# [ ... ..]]
方法二:usecols=[ ] —— 直接寫入獲取的列數(shù)
import pandas as pd
import numpy as np
data_1 = pd.read_csv("data1.csv",usecols=["用戶編號(hào)"])
data_1 = np.array(data_1)
print(data_1)
# [[15624510]
# [15810944]
# [15668575]
# [15603246]
# [ ... ]]
# (2)如獲取第1,2列
data_12 = pd.read_csv("data1.csv",usecols=["用戶編號(hào)","性別"])
data_12 = np.array(data_12)
print(data_12)
# [[15624510 1]
# [15810944 1]
# [15668575 2]
# [15603246 2]
# [ ... ..]]
方法三:iloc[ ] ——實(shí)質(zhì)就是切片操作
import pandas as pd
import numpy as np
data = pd.read_csv("data1.csv")
# (1)獲取第1列
data_1 = data.iloc[:,0]
data_1 =np.array(data_1)
print(data_1)
# [15624510 15810944 15668575 15603246 15804002 15728773 15598044 15694829
# 15600575 15727311 15570769 15606274 15746139 15704987 15628972 15697686
# 15733883 15617482 15704583 15621083 15649487 15736760 15714658 15599081
# 15705113 15631159 15792818 15633531 15744529]
# (2)獲取第1,2列
data_12 = data.iloc[:,0:2]
data_12 = np.array(data_12)
print(data_12)
# [[15624510 1]
# [15810944 1]
# [15668575 2]
# [15603246 2]
# [ ... ..]]
# 獲取最后兩列
data_last = data.iloc[:,-2:]
data_last = np.array(data_last)
print(data_last)
# [[ 19000 0]
# [ 20000 0]
# [ 26 43000 0]
# [ 27 57000 0]
# [ ... ... ...]]
到此這篇關(guān)于Python從csv文件中讀取數(shù)據(jù)并提取數(shù)據(jù)的方法的文章就介紹到這了,更多相關(guān)Python csv文件中讀取數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
python中time模塊指定格式時(shí)間字符串轉(zhuǎn)為時(shí)間戳
本文主要介紹了python中time模塊指定格式時(shí)間字符串轉(zhuǎn)為時(shí)間戳,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02
Python中super()的理解以及應(yīng)用場(chǎng)景實(shí)例
在python中關(guān)于類的定義可以分為兩種:老式類&新式類,在新式類中有這么一種方法super( ),下面這篇文章主要給大家介紹了關(guān)于Python中super()的理解以及應(yīng)用場(chǎng)景的相關(guān)資料,需要的朋友可以參考下2021-09-09
Python實(shí)戰(zhàn)之利用Geopandas算出每個(gè)省面積
GeoPandas是一個(gè)基于pandas,針對(duì)地理數(shù)據(jù)做了特別支持的第三方模塊。本文將利用GeoPandas計(jì)算出每個(gè)省的面積,感興趣的小伙伴快跟隨小編一起學(xué)習(xí)一下吧2021-12-12
django xadmin action兼容自定義model權(quán)限教程
這篇文章主要介紹了django xadmin action兼容自定義model權(quán)限教程,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2020-03-03
Python xlrd excel文件操作代碼實(shí)例
這篇文章主要介紹了Python xlrd excel文件操作代碼實(shí)例,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-03-03

