使用Python第三方庫xlrd讀取Excel中的數(shù)據(jù)的流程步驟
1. 安裝 xlrd 庫
Python 讀取 Excel 中的數(shù)據(jù)主要用到 xlrd 第三方庫。xlrd 其實就是兩個單詞的簡化拼接,我們可以把它拆開來看,xl 代表 excel, rd 代表 read, 合并起來就是 xlrd, 意思就是讀 excel 的第三方庫。 這種命名風格也正是我們推薦使用的,要做到 “顧名思義”,不要使用晦澀難懂,與所實現(xiàn)的功能毫無關(guān)聯(lián)的名稱。 OK, 廢話不多說了,下面我們就著手安裝 xlrd 庫,pip 命令如下:
pip install xlrd==1.2.0 -i https://mirrors.aliyun.com/pypi/simple
值得注意的是,我在安裝 xlrd 庫的時候,指定了 xlrd 的版本,即 xlrd==1.2.0
, 這也是在實踐中積累的經(jīng)驗哦,因為不指定版本總是會有各種狀況,為了確保不出錯,大家盡量按照我這樣安裝吧。否則,出錯可別找我哦!
2. 使用 xlrd 庫
2.1 打開 Excel 工作表對象
(咳咳,戰(zhàn)術(shù)咳嗽!) 首先,我們先梳理一下思路,把概念搞清楚。什么概念呢?就是大家知道什么是工作簿,什么是工作表,什么是單元格嗎? 平時我們說的 Excel 工作表文件,其實嚴格來說它是個工作簿。然后打開工作簿,里面有多個 Sheet, 我們把這個稱作 ”工作表“。之后,我們的數(shù)據(jù)是放在單元格里面的。 下面,讓我們再用圖片的形式展示,一起要分清概念。
工作簿:
工作表:
單元格:
好的,那么使用 xlrd 讀取 Excel 表中的數(shù)據(jù)的時候也應按照:工作簿 -> 工作表 -> 單元格,這樣的過程去讀取數(shù)據(jù)的。 那么,打開工作對象的代碼如下:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 三種方式獲取工作表 # worksheet = workbook.sheet_by_index(0) # worksheet = workbook.sheets()[0] worksheet = workbook.sheet_by_name('Sheet1')
代碼解析:
- 首先導入安裝的第三方庫 xlrd.
- 之后,使用 xlrd 庫下的方法 open_workbook(), 打開一個工作簿,方法里的參數(shù)為工作簿的路徑。
- 最后,根據(jù)拿到的工作簿對象,指定獲取的工作表。當然了,獲取工作表的方法有三種,分別是根據(jù)索引和根據(jù)工作表名稱獲取,索引是從0開始的。只要使用一種方式即可,這里我推薦使用根據(jù)工作表名稱獲取。
2.2 讀取單個單元格數(shù)據(jù)
那么我們在上一小節(jié)打開了工作表對象之后,下面就要獲取表里的單元格數(shù)據(jù)了呀!如何獲取單元格數(shù)據(jù)呢?請看下面的代碼:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 獲取單元格數(shù)據(jù)的兩種方式 # cell_value = worksheet.cell(0, 0).value cell_value = worksheet.cell_value(0, 0) print(cell_value)
代碼解析: 獲取單元格數(shù)據(jù)的方法也很簡單。這里提供了兩種方法,都可以獲取單元格數(shù)據(jù),大家只要根據(jù)自己習慣,掌握一種即可。例如,我這里使用的是 cell_value() 方法,方法里傳遞的是單元格的索引。單元格的索引是二維的,第一個參數(shù)是所在行,第二個參數(shù)是所在列。需要注意的是,所有的索引都是從 0 開始計數(shù)的。
2.3 讀取多個單元格數(shù)據(jù)
上一小節(jié)中,我們使用了 cell_value() 方法獲取單個單元格數(shù)據(jù),但是這種方式未免效率過于低下了,現(xiàn)在我們想一次性獲取整行或者整列的數(shù)據(jù),該如何去做呢 ?請看下面的代碼:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 獲取第一行所有單元格數(shù)據(jù) row_value = workbookt.row(0) # 獲取第一列所有單元格數(shù)據(jù) col_value = workbook.col(0)
代碼解析: 與 2.2 小節(jié)不同的是,我們通過調(diào)用方法 row() 和 col() 分別獲取某行和某列所有單元格數(shù)據(jù),row() 和 col() 內(nèi)傳入的參數(shù)為索引,索引從 0 開始計數(shù)。例如,row(0) 表示獲取第一行所有單元格數(shù)據(jù),row(1) 表示獲取第二行所有單元格數(shù)據(jù)。 那么我們運行上面的代碼段,運行結(jié)果如下所示:
[text:'班級', text:'學號', text:'姓名', text:'成績'] # row(0) 的結(jié)果值
[text:'班級'] # col(0) 的結(jié)果值
通過觀察運行結(jié)果,我們發(fā)現(xiàn)運行的結(jié)果都是以列表的形式展示的。值得注意的是,列表的數(shù)值并不是字典格式,盡管這和 Python 中字典格式完全一樣,實際上列表中元素的類型應該是 <class 'xlrd.sheet.Cell'>
, 這是 xlrd 中的 cell 對象,即單元格對象。單元格對象有 value 屬性,因此我們可以通過遍歷列表獲得每一個 cell 對象,然后通過 value 屬性取出每一個 cell 的值。 改造后的代碼如下所示:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') for i in worksheet.row(0): print(i.value) # 獲取單元格數(shù)據(jù) for i in worksheet.col(0): print(i.value) # 獲取單元格數(shù)據(jù)
2.4 讀取所有單元格數(shù)據(jù)
在上一小節(jié)中,我們學習了獲取多個單元格數(shù)據(jù),也就是整行或整列獲取數(shù)據(jù),這樣獲取數(shù)據(jù)的粒度更大,效率自然也更高。那么如果說,我想獲取 Sheet 表中所有的數(shù)據(jù)又該怎么做呢? 要想獲取 Sheet 表中所有單元格數(shù)據(jù),就得知道 Sheet 表有多少行以及多少列。這樣,我們根據(jù)行數(shù)和列數(shù),才能獲取 Sheet 表所有數(shù)據(jù)啊。xlrd 中 worksheet 對象有兩個屬性 nrows 和 ncols, 它們分別表示當前的 Sheet 表的行數(shù)和列數(shù)。 獲取所有單元格數(shù)據(jù)的代碼如下所示:
import xlrd # 打開工作簿 workbook = xlrd.open_workbook(r'C:\Users\Desktop\工作簿1.xlsx') # 獲取工作表 worksheet = workbook.sheet_by_name('Sheet1') # 根據(jù)行獲取所有單元格數(shù)據(jù) for row in range(worksheet.nrows): for i in worksheet.row(row): print(i.value) # 根據(jù)列獲取單元格數(shù)據(jù) for col in range(worksheet.ncols): for i in worksheet.col(col): print(i.value)
代碼解析: 上面的代碼中,輸出的結(jié)果應該都是所有單元格數(shù)據(jù),只不過分別從行和列的角度出發(fā)獲取單元格數(shù)據(jù)。其實,還可以用 cell_value() 方法結(jié)合 nrows 和 ncols 屬性獲取所有單元格數(shù)據(jù),這種方法留給大家自己去嘗試吧!
3. 總結(jié)
通過上面的學習,相信大家對 xlrd 第三方庫的安裝以及使用第三方庫讀取 Excel 中的數(shù)據(jù)的方法有了一定的掌握。
到此這篇關(guān)于使用Python第三方庫xlrd讀取Excel中的數(shù)據(jù)的流程步驟的文章就介紹到這了,更多相關(guān)Python xlrd讀取Excel數(shù)據(jù)內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python爬取智聯(lián)招聘數(shù)據(jù)分析師崗位相關(guān)信息的方法
這篇文章主要介紹了Python爬取智聯(lián)招聘數(shù)據(jù)分析師崗位相關(guān)信息的方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2019-08-08pandas創(chuàng)建DataFrame對象失敗的解決方法
本文主要介紹了pandas創(chuàng)建DataFrame對象失敗的解決方法,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2023-01-01