快捷導(dǎo)航

Python實(shí)現(xiàn)批量提取Excel數(shù)據(jù)

更新時(shí)間：2024年12月17日 15:33:42 作者：Sitin濤哥

在數(shù)據(jù)處理和分析的過(guò)程中,Excel 是一種廣泛使用的數(shù)據(jù)存儲(chǔ)格式,本文將詳細(xì)介紹如何使用 pandas、openpyxl 和 xlrd 三種庫(kù)來(lái)批量提取 Excel 數(shù)據(jù),并提供相應(yīng)的示例代碼,需要的可以參考下

在數(shù)據(jù)處理和分析的過(guò)程中，Excel 是一種廣泛使用的數(shù)據(jù)存儲(chǔ)格式。使用 Python 可以高效地從多個(gè) Excel 文件中提取數(shù)據(jù)，進(jìn)行匯總和分析。本文將詳細(xì)介紹如何使用 pandas、openpyxl 和 xlrd 三種庫(kù)來(lái)批量提取 Excel 數(shù)據(jù)，并提供相應(yīng)的示例代碼。

使用 pandas 批量提取 Excel 數(shù)據(jù)

pandas 是一個(gè)強(qiáng)大的數(shù)據(jù)分析庫(kù)，它提供了直接讀取和處理 Excel 文件的功能。

1. 安裝 pandas

首先，確保已安裝 pandas 和 openpyxl：

pip install pandas openpyxl

2. 讀取單個(gè) Excel 文件

import pandas as pd

# 讀取 Excel 文件
df = pd.read_excel('data.xlsx')

# 顯示前幾行數(shù)據(jù)
print(df.head())

3. 批量讀取多個(gè) Excel 文件

假設(shè)有多個(gè) Excel 文件存放在一個(gè)文件夾中，文件名格式為 data_1.xlsx, data_2.xlsx，以此類(lèi)推。

import os

# 存放 Excel 文件的文件夾路徑
folder_path = 'path_to_folder'

# 獲取所有 Excel 文件路徑
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一個(gè)空的 DataFrame
all_data = pd.DataFrame()

# 逐個(gè)讀取并合并
for file in file_list:
    df = pd.read_excel(file)
    all_data = all_data.append(df, ignore_index=True)

# 顯示合并后的數(shù)據(jù)
print(all_data.head())

使用 openpyxl 批量提取 Excel 數(shù)據(jù)

openpyxl 是一個(gè)專(zhuān)門(mén)處理 Excel 文件的庫(kù)，適用于處理 .xlsx 格式的文件。

1. 安裝 openpyxl

pip install openpyxl

2. 讀取單個(gè) Excel 文件

from openpyxl import load_workbook

# 加載 Excel 文件
wb = load_workbook('data.xlsx')

# 選擇活動(dòng)工作表
ws = wb.active

# 讀取所有數(shù)據(jù)
data = []
for row in ws.iter_rows(values_only=True):
    data.append(row)

# 打印數(shù)據(jù)
for row in data:
    print(row)

3. 批量讀取多個(gè) Excel 文件

import os
from openpyxl import load_workbook

# 存放 Excel 文件的文件夾路徑
folder_path = 'path_to_folder'

# 獲取所有 Excel 文件路徑
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xlsx')]

# 初始化一個(gè)空的列表
all_data = []

# 逐個(gè)讀取并合并
for file in file_list:
    wb = load_workbook(file)
    ws = wb.active
    for row in ws.iter_rows(values_only=True):
        all_data.append(row)

# 打印合并后的數(shù)據(jù)
for row in all_data:
    print(row)

使用 xlrd 批量提取 Excel 數(shù)據(jù)

xlrd 是一個(gè)用于讀取 Excel 文件的庫(kù)，適用于 .xls 和 .xlsx 格式的文件。

1. 安裝 xlrd

pip install xlrd

2. 讀取單個(gè) Excel 文件

import xlrd

# 打開(kāi) Excel 文件
workbook = xlrd.open_workbook('data.xls')

# 選擇工作表
sheet = workbook.sheet_by_index(0)

# 讀取所有數(shù)據(jù)
data = []
for row_idx in range(sheet.nrows):
    row = sheet.row_values(row_idx)
    data.append(row)

# 打印數(shù)據(jù)
for row in data:
    print(row)

3. 批量讀取多個(gè) Excel 文件

import os
import xlrd

# 存放 Excel 文件的文件夾路徑
folder_path = 'path_to_folder'

# 獲取所有 Excel 文件路徑
file_list = [os.path.join(folder_path, f) for f in os.listdir(folder_path) if f.endswith('.xls') or f.endswith('.xlsx')]

# 初始化一個(gè)空的列表
all_data = []

# 逐個(gè)讀取并合并
for file in file_list:
    workbook = xlrd.open_workbook(file)
    sheet = workbook.sheet_by_index(0)
    for row_idx in range(sheet.nrows):
        row = sheet.row_values(row_idx)
        all_data.append(row)

# 打印合并后的數(shù)據(jù)
for row in all_data:
    print(row)

總結(jié)

本文詳細(xì)介紹了如何使用 pandas、openpyxl 和 xlrd 三種庫(kù)批量提取 Excel 數(shù)據(jù)，并提供了相應(yīng)的示例代碼。通過(guò)這些方法，可以高效地處理多個(gè) Excel 文件，提高數(shù)據(jù)處理的效率。希望這些內(nèi)容能夠幫助大家在實(shí)際開(kāi)發(fā)中更好地處理 Excel 數(shù)據(jù)。

到此這篇關(guān)于Python實(shí)現(xiàn)批量提取Excel數(shù)據(jù)的文章就介紹到這了,更多相關(guān)Python批量提取Excel數(shù)據(jù)內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: