Python實(shí)現(xiàn)從文件中加載數(shù)據(jù)的方法詳解
前幾篇都是手動(dòng)錄入或隨機(jī)函數(shù)產(chǎn)生的數(shù)據(jù)。實(shí)際有許多類型的文件,以及許多方法,用它們從文件中提取數(shù)據(jù)來圖形化。
比如之前python基礎(chǔ)(12)介紹打開文件的方式,可直接讀取文件中的數(shù)據(jù),擴(kuò)大了我們的數(shù)據(jù)來源。下面,將展示幾種方法。
我們將使用內(nèi)置的 csv 模塊加載CSV文件
CSV文件是一種特殊的文本文件,文件中的數(shù)據(jù)以逗號(hào)作為分隔符,很適合進(jìn)行數(shù)據(jù)的解析。先用excle建立如下表格和數(shù)據(jù),另存為csv格式文件,放到代碼目錄下。
包含在Python標(biāo)準(zhǔn)庫中自帶CSV 模塊,我們只需要import進(jìn)來就能使用。比如我們需要將上面的CSV文件都打印出來,代碼 如下:
import csv #import csv 用來導(dǎo)入csv模塊 filename = 'E:\WorkSpace\python\coding\score.csv' #文件保存的絕對路徑 with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲(chǔ)在file_csv中 reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容 for row in reader: # 用for循環(huán)打印每一行 print(row)
運(yùn)行結(jié)果如下:
['Name', 'Grade', 'Class', 'Age', 'mathscore', 'Englishscore']
['Lucy', '7', '2', '14', '95', '86']
['bush', '8', '1', '15', '80', '75']
['lily', '7', '3', '14', '93', '95']
['Jack', '8', '2', '14', '87', '84']
['Mary', '9', '1', '15', '85', '86']
['philip', '7', '3', '14', '90', '92']
['Liming', '9', '2', '16', '99', '87']
打印文件頭及其位置
讀入文件,是為了獲取其中的數(shù)據(jù),需要將相關(guān)信息進(jìn)行分離,先看看如何讀出頭即文件的第一行, next()返回文件中的下一行。
import csv #import csv 用來導(dǎo)入csv模塊 filename = 'E:\WorkSpace\python\coding\score.csv' #文件保存的絕對路徑 with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲(chǔ)在file_csv中 reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容 header_row = next(reader) #模塊csv包含函數(shù) next() ,調(diào)用它并將閱讀器對象傳遞給它時(shí),它將返回文件中的下一行。 #調(diào)用了next()一次,因此得到的是文件的第一行,其中包含文件頭 ? ? ? #for row in reader: # 用for循環(huán)打印每一行? ? ? # print(row) for index, column_header in enumerate(header_row): #對列表調(diào)用了enumerate()來獲取每個(gè)元素的索引及其值 print(index, column_header)
運(yùn)行后的結(jié)果如下所示:
0 Name
1 Grade
2 Class
3 Age
4 mathscore
5 Englishscore
提取其中索引,即name的索引為0,Grade的索引為1,知道了索引便可以讀取其中的任何數(shù)據(jù),比如我們要打印出mathscore,索引為4,于是代碼如下:
scores =[] 定義一個(gè)空的list for row in reader: scores.append(int(row[4])) #讀取的文件,默認(rèn)為字符串,用int()轉(zhuǎn)換為數(shù)字。 print(scores)
運(yùn)行結(jié)果:
[95, 80, 93, 87, 85, 90, 99]
接下來,制作圖表展示一下,先把mathscore和englishscore分?jǐn)?shù)做個(gè)柱狀對比。代碼如下:
import matplotlib.pyplot as plt import csv #import csv 用來導(dǎo)入csv模塊 filename = 'E:\WorkSpace\python\coding\score.csv' #文件保存的絕對路徑 with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲(chǔ)在file_csv中 reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容 header_row = next(reader) #模塊csv包含函數(shù) next() ,調(diào)用它并將閱讀器對象傳遞給它時(shí),它將返回文件中的下一行。 #調(diào)用了 next() 一次,因此得到的是文件的第一行,其中包含文件頭 mathscores =[] #定義兩個(gè)列表 englishscores=[] for row in reader: mathscores.append(int(row[4])) #讀取索引為4的數(shù)據(jù),默認(rèn)為字符串,用int()轉(zhuǎn)換為數(shù)字。 englishscores.append(int(row[5])) #讀取索引為5的數(shù)據(jù),用int()轉(zhuǎn)換為數(shù)字。 plt.bar([1,3,5,7,9,11,13],mathscores,label='math',color='#FF2204') plt.bar([2,4,6,8,10,12,14],englishscores, label='englis', color='g') plt.legend() plt.title('scores') plt.show()
已將那些打印相關(guān)代碼刪除??催\(yùn)行結(jié)果:
接下來,我們讀取文件 ,并根據(jù)文件中的時(shí)間來繪制圖表
新建一個(gè)年份的數(shù)據(jù)(真的是胡編亂造的數(shù)據(jù)),第一列是年份,第二列每年畢業(yè)的人數(shù),第三列是每年申請人數(shù),如圖所示:
要求:
1,按年份分別顯示出每年兩者的人數(shù),并用不同的顏色表示;
2、兩者間也用其他顏色進(jìn)行填充。
完成代碼如下:
import matplotlib.pyplot as plt import csv #import csv 用來導(dǎo)入csv模塊 from datetime import datetime #引入時(shí)間相關(guān)模塊 filename = 'E:\WorkSpace\python\coding\graduatesNumbers.csv' #文件保存的絕對路徑 with open(filename) as file_csv: #是不是忘記了如何打開文件?打開文件,并將結(jié)果文件對象存儲(chǔ)在file_csv中 reader = csv.reader(file_csv) #直接調(diào)讀取 用csv.read()讀取文件內(nèi)容 header_row = next(reader) dates=[] numbers=[] application_numbers=[] for row in reader: current_date = datetime.strptime(row[0], "%Y/%m/%d") #年份,strptime()日期格式轉(zhuǎn)化為字符串格式的函數(shù) dates.append(current_date) numbers.append(int(row[1])) #讀取索引為1的數(shù)據(jù),默認(rèn)為字符串,用int()轉(zhuǎn)換為數(shù)字,即Numbers of graduates 。 application_numbers.append(int(row[2])) #讀取索引為2的數(shù)據(jù),即Number of applicants plt.plot(dates,numbers,label='Numbers of graduate', c='red') #顯示第一條線 plt.plot(dates,application_numbers,label='Number of applicant', c='green') #顯示第二條線application_numbers折線 plt.fill_between(dates,numbers, application_numbers, facecolor='blue', alpha=0.5) #在兩線之間填充顏色 alpha透明度 plt.title("The numbers of graduate",fontsize=24) plt.xlabel('Years', fontsize=16) plt.ylabel("The numbers", fontsize=16) plt.legend() plt.show()
實(shí)際運(yùn)行結(jié)果如下:
以上就是Python實(shí)現(xiàn)從文件中加載數(shù)據(jù)的方法詳解的詳細(xì)內(nèi)容,更多關(guān)于Python 加載數(shù)據(jù)的資料請關(guān)注腳本之家其它相關(guān)文章!
- Python 保存加載mat格式文件的示例代碼
- python3+selenium獲取頁面加載的所有靜態(tài)資源文件鏈接操作
- python GUI庫圖形界面開發(fā)之PyQt5動(dòng)態(tài)加載QSS樣式文件
- 解決Python 使用h5py加載文件,看不到keys()的問題
- python用pandas數(shù)據(jù)加載、存儲(chǔ)與文件格式的實(shí)例
- Python加載帶有注釋的Json文件實(shí)例
- Python實(shí)現(xiàn)加載及解析properties配置文件的方法
- python web基礎(chǔ)之加載靜態(tài)文件實(shí)例
- python:關(guān)于文件加載及處理方式
相關(guān)文章
Python如何通過手肘法實(shí)現(xiàn)k_means聚類詳解
K-means聚類算法是一種常見的無監(jiān)督學(xué)習(xí)算法,用于將數(shù)據(jù)集分成k個(gè)不同的簇,下面這篇文章主要給大家介紹了關(guān)于Python如何通過手肘法實(shí)現(xiàn)k_means聚類的相關(guān)資料,需要的朋友可以參考下2023-04-04pycharm轉(zhuǎn)移緩存目錄的實(shí)現(xiàn)
Pycharm在使用過程中,Pycharm會(huì)生成大量緩存文件,而這些緩存文件默認(rèn)存儲(chǔ)在C盤的用戶目錄里面,導(dǎo)致C盤空間被占用,本文主要介紹了pycharm轉(zhuǎn)移緩存目錄,感興趣的可以了解一下2023-10-10一文帶你深入理解Flask中的Session和Cookies
Flask,作為一個(gè)靈活的微型 web 框架,提供了會(huì)話(Session)和 Cookies 管理的能力,本文將深入探討 Flask 中的會(huì)話和 Cookies 的概念、工作機(jī)制以及應(yīng)用實(shí)例,希望對大家有所幫助2023-12-12Python的Django框架中消息通知的計(jì)數(shù)器實(shí)現(xiàn)教程
通知的計(jì)數(shù)器非常有用,新通知時(shí)+1和讀過通知后的-1是最基本的功能,這里我們就來看一下Python的Django框架中消息通知的計(jì)數(shù)器實(shí)現(xiàn)教程2016-06-06

Python實(shí)現(xiàn)刪除排序數(shù)組中重復(fù)項(xiàng)的兩種方法示例

詳解python腳本自動(dòng)生成需要文件實(shí)例代碼