python 使用openpyxl讀取excel數(shù)據(jù)
openpyxl介紹
openpyxl是一個開源項目,它是一個用于讀取/寫入Excel 2010文檔(如xlsx 、xlsm 、xltx 、xltm文件 )的Python庫,如果要處理更早格式的Excel文檔(xls),需要用到其它庫(如:xlrd、xlwt等),這是openpyxl比較其他模塊的不足之處。openpyxl是一款比較綜合的工具,不僅能夠同時讀取和修改Excel文檔,而且可以對Excel文件內(nèi)單元格進行詳細設(shè)置,包括單元格樣式等內(nèi)容,甚至還支持圖表插入、打印設(shè)置等內(nèi)容。
python中與excel操作相關(guān)的模塊:
- 📔 xlrd庫:從excel中讀取數(shù)據(jù),支持xls、xlsx格式
- 📔 xlwt庫:對excel進行修改操作,但不支持對xlsx格式的修改
- 📔 xlutils庫:在xlwt和xlrd中,對一個已存在文件進行修改
- 📘 openpyxl庫:主要針對xlsx格式的excel進行讀取和編輯
openpyxl安裝
pip install openpyxl
openpyxl基本概念
- WorkBook:工作簿對象
- Sheet:表單對象
- Cell:表格對象
也就是我們使用excel時可以看到的三個對象,我們操作excel的步驟是打開工作簿,選中表單,對單元格進行操作,而openpyxl的工作原理也是如此。
openpyxl對excel進行操作
新建excel
import openpyxl # 創(chuàng)建一個工作簿 workbook = openpyxl.Workbook() # 創(chuàng)建一個表單 sheet = workbook.create_sheet('表單1') # 寫入一個數(shù)據(jù) sheet.cell(row=1, column=1, value="python") # 保存 workbook.save('test.xlsx')
🎈 注意點:如果保存的文件名已存在,將會覆蓋原來的文件
打開已存在的文件
- 打開已存在的文件:load_workbook()
- 獲取表單:workbook['表單名']
- 讀取指定表格:cell(row, column).value
import openpyxl # 打開工作簿 workbook = openpyxl.load_workbook('test.xlsx') # 獲取表單 sheet = workbook['表單1'] # 讀取指定的單元格數(shù)據(jù) cell = sheet.cell(row=1, column=1).value print(cell)
運行結(jié)果:
C:\software\python\python.exe D:/learn/python24/python_base/test.py python Process finished with exit code 0
讀取單個單元格
# 方式一:讀取A6單元格的值 cell1 = sheet['A6'].value # 方式二:讀取第3行,第4列單元格的值 cell2 = sheet.cell(row=3, column=4).value
讀取多個單元格
# 方式一:讀取A6單元格的值 cell1 = sheet['A6'].value # 方式二:讀取第3行,第4列單元格的值 cell2 = sheet.cell(row=3, column=4).value
讀取多個單元格時,都是以元組的形式返回
其他相關(guān)操作
關(guān)鍵代碼 | 相關(guān)描述 |
---|---|
cell(row, column, value) | 寫入數(shù)據(jù),三個參數(shù)分別是行,列,值 |
cell(row, column).value | 獲取指定單元格的值,兩個參數(shù)分別是行,列 |
workbook.remove('表單名') | 刪除表單 |
del workbook['表單名'] | 刪除表單 |
workbook.save('文件名') | 保存工作簿 |
sheet.max_row | 獲取表單數(shù)據(jù)的總行數(shù) |
sheet.max_column | 獲取表單數(shù)據(jù)的總列數(shù) |
sheet.rows | 獲取按行所有的數(shù)據(jù) |
sheet.columns | 獲取按列所有的數(shù)據(jù) |
🎈 注意點:
- openpyxl中列和行的起始標識都是1,不是從0開始
- 從excel中讀取出來的數(shù)據(jù)只有兩種類型,即數(shù)值類型和字符串類型
- 不要隨便在表格中敲空格,會影響判斷最大行數(shù)和最大列數(shù)
- 運行操作excel的代碼時,要先關(guān)閉在操作系統(tǒng)中打開的相關(guān)excel表,否則可能會無法讀取/寫入數(shù)據(jù)
- 寫入數(shù)據(jù)時要執(zhí)行保存
import openpyxl # 打開工作簿 wb = openpyxl.load_workbook('test.xlsx') # 獲取表單 sh = wb['表單1'] # 讀取指定的單元格數(shù)據(jù) res1 = sh.cell(row=1, column=1).value print(res1) # 獲取最大行數(shù) print(sh.max_row) # 獲取最大列數(shù) print(sh.max_column) # 按列讀取所有數(shù)據(jù),每一列的單元格放入一個元組中 print(sh.columns) # 直接打印,打印結(jié)果是一個可迭代對象,我們可以轉(zhuǎn)換成列表來查看 # 按行讀取所有數(shù)據(jù),每一行的單元格放入一個元組中 rows = sh.rows # print(list(rows)) # 轉(zhuǎn)換成列表之后打印結(jié)果為具體的單元格,如下 # [(<Cell '表單1'.A1>, <Cell '表單1'.B1>, <Cell '表單1'.C1>, <Cell '表單1'.D1>, <Cell '表單1'.E1>, <Cell '表單1'.F1>, <Cell '表單1'.G1>), # (<Cell '表單1'.A2>, <Cell '表單1'.B2>, <Cell '表單1'.C2>, <Cell '表單1'.D2>, <Cell '表單1'.E2>, <Cell '表單1'.F2>, <Cell '表單1'.G2>), # (<Cell '表單1'.A3>, <Cell '表單1'.B3>, <Cell '表單1'.C3>, <Cell '表單1'.D3>, <Cell '表單1'.E3>, <Cell '表單1'.F3>, <Cell '表單1'.G3>)] # 我們可以通過for循環(huán)以及value來查看單元格的值 for row in list(rows): # 遍歷每行數(shù)據(jù) case = [] # 用于存放一行數(shù)據(jù) for c in row: # 把每行的每個單元格的值取出來,存放到case里 case.append(c.value) print(case)
運行結(jié)果:
C:\software\python\python.exe D:/learn/python24/python_base/test.py case_id 3 7 <generator object Worksheet._cells_by_col at 0x0000012FEF90D8B8> ['case_id', 'interface', 'title', 'method', 'url', 'data', 'expected'] [1, 'login', '登錄成功', 'post', '/member/login', '{"mobile_phone":"15692004245","pwd":"miki12345"}', "{'code': 0, 'msg': 'OK'}"] [2, 'login', '登錄失敗-手機號為空', 'post', '/member/login', '{"mobile_phone":"","pwd":"miki12345"}', "{'code': 2, 'msg': '手機號碼為空'}"]
excel表中的原數(shù)據(jù)如下圖:
openpyxl封裝
在測試過程中,我們會經(jīng)常需要訪問excel讀取測試數(shù)據(jù),如果毎訪問一次我們就調(diào)用一次openpyxl,進行打開excel,選取表單,讀取數(shù)據(jù)等操作,將會增加我們的工作量和代碼量。凡是需要重復(fù)使用的,我們都可以對它進行二次封裝,寫成我們自己的版本,還可以在封裝過程中加入我們想要的內(nèi)容,使用的時候直接調(diào)用即可。
在封裝openpyxl時,讀取excel時我寫了兩種實現(xiàn)方法,第一種是讀取數(shù)據(jù)后,把每條測試數(shù)據(jù)的鍵值保存到一個字典中,再把字典存到一個列表,這種方式比較容易理解,但是調(diào)用的時候需要多敲幾個括號或者引號;第二種是把每條測試數(shù)據(jù)的鍵值存到一個實例對象的屬性中,再把每個實例存到一個列表。實際上他們的作用是一樣,只是第二種方式調(diào)用時更簡單。
# read_excel.py import openpyxl class CasesData: """用于保存測試用例數(shù)據(jù)""" pass class ReadExcel: def __init__(self, file_name, sheet_name): self.file_name = file_name self.sheet_name = sheet_name def open(self): self.wb = openpyxl.load_workbook(self.file_name) self.sh = self.wb[self.sheet_name] def close(self): self.wb.close() def read_data(self): """按行讀取數(shù)據(jù),最后返回一個存儲字典的列表""" self.open() rows = list(self.sh.rows) titles = [] for t in rows[0]: title = t.value titles.append(title) cases = [] for row in rows[1:]: case = [] for r in row: case.append(r.value) cases.append(dict(zip(titles, case))) # 通過zip聚合打包用例的標題和數(shù)據(jù) self.close() return cases def read_data_obj(self): """按行讀取數(shù)據(jù),最后返回的是一個存儲實例對象的列表""" self.open() rows = list(self.sh.rows) titles = [] for t in rows[0]: title = t.value titles.append(title) cases = [] for row in rows[1:]: case_obj = CasesData() # 創(chuàng)建一個對象用來保存該行用例數(shù)據(jù) case = [] for r in row: case.append(r.value) case_info = dict(zip(titles, case)) for k, v in case_info.items(): setattr(case_obj, k, v) cases.append(case_obj) self.close() return cases def write_data(self, row, column, msg): self.open() self.sh.cell(row=row, column=column, value=msg) self.wb.save(self.file_name) self.close() if __name__ == '__main__': # 直接運行本文件時執(zhí)行,下面是一個應(yīng)用實例 # 需要讀取excel時直接調(diào)用ReadExcel類 test = ReadExcel('cases.xlsx', 'login') res = test.read_data_obj() # 最后返回的是一個存儲實例對象的列表 print(res[0].case_id) # 打印第1個用例的case_id print(res[3].title) # 打印第4個用例的title test2 = ReadExcel('cases.xlsx', 'login') res2 = test2.read_data() # 最后返回一個存儲字典的列表 print(res2[0]['case_id']) # 打印第1個用例的case_id print(res2[3]['title']) # 打印第4個用例的title
上面封裝的openpyxl中,應(yīng)用實例的excel表結(jié)構(gòu)如下:
以上就是python 使用openpyxl讀取excel數(shù)據(jù)的詳細內(nèi)容,更多關(guān)于python openpyxl讀取excel數(shù)據(jù)的資料請關(guān)注腳本之家其它相關(guān)文章!
相關(guān)文章
pandas.DataFrame Series排序的使用(sort_values,sort_index)
本文主要介紹了pandas.DataFrame Series排序的使用(sort_values,sort_index),文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02使用wxPython和pandas模塊生成Excel文件的代碼實現(xiàn)
在Python編程中,有時我們需要根據(jù)特定的數(shù)據(jù)生成Excel文件,本文將介紹如何使用wxPython和pandas模塊來實現(xiàn)這個目標,文中通過代碼示例給大家講解的非常詳細,具有一定的參考價值,需要的朋友可以參考下2024-05-05小學(xué)生也能看懂的python語法之循環(huán)語句精解
這篇文章主要介紹了詳解Python中的條件,循環(huán)語句,包括while循環(huán)for循環(huán),循環(huán)語句是學(xué)習(xí)各個編程語言的最基本的基礎(chǔ)知識,需要的朋友可以參考下2021-09-09Python concurrent.futures模塊使用實例
這篇文章主要介紹了Python concurrent.futures模塊使用實例,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友可以參考下2019-12-12