Python使用pandas和openpyxl讀取Excel表格的方法詳解
前言
Python 提供了多種讀取 Excel 文件的方式,最常用的庫是 pandas 和 openpyxl。下面我將詳細(xì)介紹如何使用這兩個(gè)庫來讀取 Excel 文件,并包含一些實(shí)用示例,幫助你撰寫博客。
1. 安裝必要的依賴
首先,需要確保安裝了 pandas 和 openpyxl 庫,這兩個(gè)庫可以幫助我們輕松讀取 Excel 文件。
你可以使用以下命令安裝它們:
pip install pandas openpyxl
pandas:用于數(shù)據(jù)處理和分析,它內(nèi)置了讀取 Excel 文件的功能。openpyxl:一個(gè)讀寫 Excel 2007 及以上版本的 Excel 文件的庫。
2. 讀取Excel文件
假設(shè)你有一個(gè)Excel文件data.xlsx,包含如下數(shù)據(jù):
| Name | Age | City |
|---|---|---|
| John | 25 | New York |
| Alice | 30 | London |
| Bob | 22 | Tokyo |
你可以使用 pandas 來讀取文件的內(nèi)容。
import pandas as pd
# 讀取Excel文件
df = pd.read_excel('data.xlsx')
# 顯示數(shù)據(jù)
print(df)輸出:
Name Age City
0 John 25 New York
1 Alice 30 London
2 Bob 22 Tokyo
3. 讀取特定的工作表
Excel 文件通常包含多個(gè)工作表。可以通過指定 sheet_name 來讀取特定的工作表。例如,假設(shè) data.xlsx 文件中有一個(gè)名為 Sheet2 的工作表:
df = pd.read_excel('data.xlsx', sheet_name='Sheet2')
print(df)
你也可以通過索引來指定工作表:
df = pd.read_excel('data.xlsx', sheet_name=0) # 讀取第一個(gè)工作表
4. 讀取多張工作表
如果你想一次性讀取 Excel 文件中的所有工作表,可以使用 sheet_name=None,它會(huì)返回一個(gè)包含多個(gè) DataFrame 的字典。
dfs = pd.read_excel('data.xlsx', sheet_name=None)
# 遍歷所有工作表
for sheet, data in dfs.items():
print(f"工作表名: {sheet}")
print(data)5. 只讀取特定列
有時(shí),你只需要讀取 Excel 文件中的部分列??梢酝ㄟ^ usecols 參數(shù)指定需要讀取的列。
df = pd.read_excel('data.xlsx', usecols=['Name', 'City'])
print(df)
輸出:
Name City
0 John New York
1 Alice London
2 Bob Tokyo
你也可以使用列的索引來讀取特定列,例如:
df = pd.read_excel('data.xlsx', usecols=[0, 2]) # 讀取第一和第三列
print(df)
6. 處理缺失數(shù)據(jù)
在讀取 Excel 數(shù)據(jù)時(shí),可能會(huì)遇到空白單元格。你可以使用 pandas 處理這些缺失數(shù)據(jù)。例如,可以通過 na_values 參數(shù)將特定的值識(shí)別為 NaN,或者使用 fillna() 方法填充缺失值。
# 將特定值識(shí)別為NaN
df = pd.read_excel('data.xlsx', na_values=['N/A', 'NA'])
# 填充缺失數(shù)據(jù)
df.fillna(value={'Age': 0, 'City': 'Unknown'}, inplace=True)
print(df)7. 將Excel數(shù)據(jù)轉(zhuǎn)換為其他格式
有時(shí)你可能需要將讀取的 Excel 數(shù)據(jù)保存為其他格式,例如 CSV 文件或 JSON 文件。pandas 允許你輕松實(shí)現(xiàn)這一點(diǎn)。
# 保存為CSV文件
df.to_csv('data.csv', index=False)
# 保存為JSON文件
df.to_json('data.json', orient='records')8. 讀取大文件和優(yōu)化性能
如果 Excel 文件非常大,可能會(huì)導(dǎo)致內(nèi)存不足或讀取速度較慢。pandas 提供了一些方法來優(yōu)化性能,例如使用 chunksize 分塊讀取數(shù)據(jù)。
# 分塊讀取Excel文件,每次讀取100行
chunks = pd.read_excel('large_data.xlsx', chunksize=100)
for chunk in chunks:
print(chunk)9. 使用openpyxl讀取Excel
openpyxl 更適合需要對(duì) Excel 文件進(jìn)行更底層操作的場景,如讀取和修改單元格樣式、公式等。以下是一個(gè)簡單的讀取示例:
from openpyxl import load_workbook
# 加載Excel工作簿
wb = load_workbook('data.xlsx')
# 選擇工作表
sheet = wb['Sheet1']
# 讀取指定單元格的值
for row in sheet.iter_rows(min_row=1, max_row=sheet.max_row, values_only=True):
print(row)10. 更多的Excel讀取功能
你可以使用 pandas 提供的更多選項(xiàng),例如:
skiprows: 跳過特定行數(shù)nrows: 讀取指定行數(shù)header: 設(shè)置自定義標(biāo)題行
# 跳過前兩行并讀取5行數(shù)據(jù)
df = pd.read_excel('data.xlsx', skiprows=2, nrows=5)
print(df)
總結(jié)
通過 pandas 和 openpyxl,你可以輕松讀取 Excel 文件,并進(jìn)行各種數(shù)據(jù)處理操作。pandas 更適合快速、簡單的數(shù)據(jù)分析,而 openpyxl 則適合需要對(duì) Excel 文件進(jìn)行更深入控制的場景。
到此這篇關(guān)于Python讀取Excel表格數(shù)據(jù)的方法詳解的文章就介紹到這了,更多相關(guān)Python讀取Excel內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
- python使用openpyxl打開及讀取excel表格過程
- python使用openpyxl實(shí)現(xiàn)對(duì)excel表格相對(duì)路徑的超鏈接的創(chuàng)建方式
- python openpyxl提取Excel圖片實(shí)現(xiàn)原理技巧
- python?openpyxl操作Excel的安裝使用
- python使用openpyxl庫處理Excel文件詳細(xì)教程
- Python通過OpenPyXL處理Excel的完整教程
- python使用openpyxl庫讀取Excel文件數(shù)據(jù)
- python如何通過openpyxl讀寫Excel文件
- Python?Excel操作從零學(xué)習(xí)掌握openpyxl用法
- 使用python中的openpyxl操作excel詳解
- python操作Excel神器openpyxl看這一篇就夠了
- python使用Openpyxl操作Excel文件的實(shí)現(xiàn)
相關(guān)文章
python re庫的正則表達(dá)式入門學(xué)習(xí)教程
這篇文章主要給大家介紹了關(guān)于python re庫的正則表達(dá)式的相關(guān)資料,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者使用python具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面來一起學(xué)習(xí)學(xué)習(xí)吧2019-03-03
利用tkinter改變下拉列表(Combobox)的選項(xiàng)值
這篇文章主要介紹了利用tkinter改變下拉列表(Combobox)的選項(xiàng)值,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-01-01
Python內(nèi)存管理精準(zhǔn)釋放與延遲拷貝技術(shù)探究
這篇文章主要為大家介紹了Python內(nèi)存管理精準(zhǔn)釋放與延遲拷貝技術(shù)探究,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進(jìn)步,早日升職加薪2024-01-01
用python爬蟲批量下載pdf的實(shí)現(xiàn)
這篇文章主要介紹了用python爬蟲批量下載pdf的實(shí)現(xiàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2020-12-12
Python 靜態(tài)導(dǎo)入與動(dòng)態(tài)導(dǎo)入的實(shí)現(xiàn)示例
Python靜態(tài)導(dǎo)入和動(dòng)態(tài)導(dǎo)入是指導(dǎo)入模塊或模塊內(nèi)部函數(shù)的兩種方式,本文主要介紹了Python 靜態(tài)導(dǎo)入與動(dòng)態(tài)導(dǎo)入的實(shí)現(xiàn)示例,具有一定的參考價(jià)值,感興趣的可以了解一下2024-05-05
python如何使用socketserver模塊實(shí)現(xiàn)并發(fā)聊天
這篇文章主要介紹了python如何使用socketserver模塊實(shí)現(xiàn)并發(fā)聊天,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-12-12
講解Python的Scrapy爬蟲框架使用代理進(jìn)行采集的方法
這篇文章主要介紹了講解Python的Scrapy爬蟲框架使用代理進(jìn)行采集的方法,并介紹了隨機(jī)使用預(yù)先設(shè)好的user-agent來進(jìn)行爬取的用法,需要的朋友可以參考下2016-02-02

