使用Python第三方庫(kù)xlrd讀取Excel中的數(shù)據(jù)的流程步驟
1. 安裝 xlrd 庫(kù)
Python 讀取 Excel 中的數(shù)據(jù)主要用到 xlrd 第三方庫(kù)。xlrd 其實(shí)就是兩個(gè)單詞的簡(jiǎn)化拼接,我們可以把它拆開來(lái)看,xl 代表 excel, rd 代表 read, 合并起來(lái)就是 xlrd, 意思就是讀 excel 的第三方庫(kù)。 這種命名風(fēng)格也正是我們推薦使用的,要做到 “顧名思義”,不要使用晦澀難懂,與所實(shí)現(xiàn)的功能毫無(wú)關(guān)聯(lián)的名稱。 OK, 廢話不多說(shuō)了,下面我們就著手安裝 xlrd 庫(kù),pip 命令如下:
pip install xlrd==1.2.0 -i https://mirrors.aliyun.com/pypi/simple
值得注意的是,我在安裝 xlrd 庫(kù)的時(shí)候,指定了 xlrd 的版本,即 xlrd==1.2.0
, 這也是在實(shí)踐中積累的經(jīng)驗(yàn)哦,因?yàn)椴恢付ò姹究偸菚?huì)有各種狀況,為了確保不出錯(cuò),大家盡量按照我這樣安裝吧。否則,出錯(cuò)可別找我哦!
2. 使用 xlrd 庫(kù)
2.1 打開 Excel 工作表對(duì)象
(咳咳,戰(zhàn)術(shù)咳嗽!) 首先,我們先梳理一下思路,把概念搞清楚。什么概念呢?就是大家知道什么是工作簿,什么是工作表,什么是單元格嗎? 平時(shí)我們說(shuō)的 Excel 工作表文件,其實(shí)嚴(yán)格來(lái)說(shuō)它是個(gè)工作簿。然后打開工作簿,里面有多個(gè) Sheet, 我們把這個(gè)稱作 ”工作表“。之后,我們的數(shù)據(jù)是放在單元格里面的。 下面,讓我們?cè)儆脠D片的形式展示,一起要分清概念。
工作簿:
工作表:
單元格:
好的,那么使用 xlrd 讀取 Excel 表中的數(shù)據(jù)的時(shí)候也應(yīng)按照:工作簿 -> 工作表 -> 單元格,這樣的過(guò)程去讀取數(shù)據(jù)的。 那么,打開工作對(duì)象的代碼如下:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 三種方式獲取工作表 # worksheet = workbook.sheet_by_index(0) # worksheet = workbook.sheets()[0] worksheet = workbook.sheet_by_name('Sheet1')
代碼解析:
- 首先導(dǎo)入安裝的第三方庫(kù) xlrd.
- 之后,使用 xlrd 庫(kù)下的方法 open_workbook(), 打開一個(gè)工作簿,方法里的參數(shù)為工作簿的路徑。
- 最后,根據(jù)拿到的工作簿對(duì)象,指定獲取的工作表。當(dāng)然了,獲取工作表的方法有三種,分別是根據(jù)索引和根據(jù)工作表名稱獲取,索引是從0開始的。只要使用一種方式即可,這里我推薦使用根據(jù)工作表名稱獲取。
2.2 讀取單個(gè)單元格數(shù)據(jù)
那么我們?cè)谏弦恍」?jié)打開了工作表對(duì)象之后,下面就要獲取表里的單元格數(shù)據(jù)了呀!如何獲取單元格數(shù)據(jù)呢?請(qǐng)看下面的代碼:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 獲取單元格數(shù)據(jù)的兩種方式 # cell_value = worksheet.cell(0, 0).value cell_value = worksheet.cell_value(0, 0) print(cell_value)
代碼解析: 獲取單元格數(shù)據(jù)的方法也很簡(jiǎn)單。這里提供了兩種方法,都可以獲取單元格數(shù)據(jù),大家只要根據(jù)自己習(xí)慣,掌握一種即可。例如,我這里使用的是 cell_value() 方法,方法里傳遞的是單元格的索引。單元格的索引是二維的,第一個(gè)參數(shù)是所在行,第二個(gè)參數(shù)是所在列。需要注意的是,所有的索引都是從 0 開始計(jì)數(shù)的。
2.3 讀取多個(gè)單元格數(shù)據(jù)
上一小節(jié)中,我們使用了 cell_value() 方法獲取單個(gè)單元格數(shù)據(jù),但是這種方式未免效率過(guò)于低下了,現(xiàn)在我們想一次性獲取整行或者整列的數(shù)據(jù),該如何去做呢 ?請(qǐng)看下面的代碼:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 獲取第一行所有單元格數(shù)據(jù) row_value = workbookt.row(0) # 獲取第一列所有單元格數(shù)據(jù) col_value = workbook.col(0)
代碼解析: 與 2.2 小節(jié)不同的是,我們通過(guò)調(diào)用方法 row() 和 col() 分別獲取某行和某列所有單元格數(shù)據(jù),row() 和 col() 內(nèi)傳入的參數(shù)為索引,索引從 0 開始計(jì)數(shù)。例如,row(0) 表示獲取第一行所有單元格數(shù)據(jù),row(1) 表示獲取第二行所有單元格數(shù)據(jù)。 那么我們運(yùn)行上面的代碼段,運(yùn)行結(jié)果如下所示:
[text:'班級(jí)', text:'學(xué)號(hào)', text:'姓名', text:'成績(jī)'] # row(0) 的結(jié)果值
[text:'班級(jí)'] # col(0) 的結(jié)果值
通過(guò)觀察運(yùn)行結(jié)果,我們發(fā)現(xiàn)運(yùn)行的結(jié)果都是以列表的形式展示的。值得注意的是,列表的數(shù)值并不是字典格式,盡管這和 Python 中字典格式完全一樣,實(shí)際上列表中元素的類型應(yīng)該是 <class 'xlrd.sheet.Cell'>
, 這是 xlrd 中的 cell 對(duì)象,即單元格對(duì)象。單元格對(duì)象有 value 屬性,因此我們可以通過(guò)遍歷列表獲得每一個(gè) cell 對(duì)象,然后通過(guò) value 屬性取出每一個(gè) cell 的值。 改造后的代碼如下所示:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') for i in worksheet.row(0): print(i.value) # 獲取單元格數(shù)據(jù) for i in worksheet.col(0): print(i.value) # 獲取單元格數(shù)據(jù)
2.4 讀取所有單元格數(shù)據(jù)
在上一小節(jié)中,我們學(xué)習(xí)了獲取多個(gè)單元格數(shù)據(jù),也就是整行或整列獲取數(shù)據(jù),這樣獲取數(shù)據(jù)的粒度更大,效率自然也更高。那么如果說(shuō),我想獲取 Sheet 表中所有的數(shù)據(jù)又該怎么做呢? 要想獲取 Sheet 表中所有單元格數(shù)據(jù),就得知道 Sheet 表有多少行以及多少列。這樣,我們根據(jù)行數(shù)和列數(shù),才能獲取 Sheet 表所有數(shù)據(jù)啊。xlrd 中 worksheet 對(duì)象有兩個(gè)屬性 nrows 和 ncols, 它們分別表示當(dāng)前的 Sheet 表的行數(shù)和列數(shù)。 獲取所有單元格數(shù)據(jù)的代碼如下所示:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 根據(jù)行獲取所有單元格數(shù)據(jù) for row in range(worksheet.nrows): for i in worksheet.row(row): print(i.value) # 根據(jù)列獲取單元格數(shù)據(jù) for col in range(worksheet.ncols): for i in worksheet.col(col): print(i.value)
代碼解析: 上面的代碼中,輸出的結(jié)果應(yīng)該都是所有單元格數(shù)據(jù),只不過(guò)分別從行和列的角度出發(fā)獲取單元格數(shù)據(jù)。其實(shí),還可以用 cell_value() 方法結(jié)合 nrows 和 ncols 屬性獲取所有單元格數(shù)據(jù),這種方法留給大家自己去嘗試吧!
3. 總結(jié)
通過(guò)上面的學(xué)習(xí),相信大家對(duì) xlrd 第三方庫(kù)的安裝以及使用第三方庫(kù)讀取 Excel 中的數(shù)據(jù)的方法有了一定的掌握。
到此這篇關(guān)于使用Python第三方庫(kù)xlrd讀取Excel中的數(shù)據(jù)的流程步驟的文章就介紹到這了,更多相關(guān)Python xlrd讀取Excel數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python爬取智聯(lián)招聘數(shù)據(jù)分析師崗位相關(guān)信息的方法
這篇文章主要介紹了Python爬取智聯(lián)招聘數(shù)據(jù)分析師崗位相關(guān)信息的方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08使用Python對(duì)MySQL數(shù)據(jù)操作
本文介紹Python3使用PyMySQL連接數(shù)據(jù)庫(kù),并實(shí)現(xiàn)簡(jiǎn)單的增刪改查。具有很好的參考價(jià)值。下面跟著小編一起來(lái)看下吧2017-04-04pandas創(chuàng)建DataFrame對(duì)象失敗的解決方法
本文主要介紹了pandas創(chuàng)建DataFrame對(duì)象失敗的解決方法,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-01-01Python實(shí)現(xiàn)UDP程序通信過(guò)程圖解
這篇文章主要介紹了Python實(shí)現(xiàn)UDP程序通信過(guò)程圖解,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05