快捷導(dǎo)航

使用Pandas實現(xiàn)Excel中的數(shù)據(jù)透視表的項目實踐

更新時間：2025年05月02日 11:18:49 作者：Bruce_xiaowei

數(shù)據(jù)透視表是一種非常強(qiáng)大的工具,它可以幫助我們快速匯總、分析和可視化大量數(shù)據(jù),本文主要介紹了使用Pandas實現(xiàn)Excel中的數(shù)據(jù)透視表的項目實踐,感興趣的可以了解一下

引言
準(zhǔn)備工作
創(chuàng)建模擬銷售數(shù)據(jù)
代碼實現(xiàn)及輸出
原始數(shù)據(jù)
示例1: 按地區(qū)和銷售員匯總銷售額
示例2: 按地區(qū)匯總銷售額，并顯示每個地區(qū)的總銷售額
示例3: 按地區(qū)和銷售員匯總銷售額，并顯示每個組合的平均銷售額
示例4: 按地區(qū)和銷售員匯總銷售額，并顯示每個組合的最大銷售額
結(jié)論

引言

在數(shù)據(jù)分析中，數(shù)據(jù)透視表是一種非常強(qiáng)大的工具，它可以幫助我們快速匯總、分析和可視化大量數(shù)據(jù)。雖然Excel提供了內(nèi)置的數(shù)據(jù)透視表功能，但對于需要進(jìn)行更復(fù)雜操作或自動化處理的場景，Python中的Pandas庫提供了一個靈活且強(qiáng)大的替代方案。本文將通過具體的示例，展示如何使用Pandas實現(xiàn)類似Excel中的數(shù)據(jù)透視表功能。

準(zhǔn)備工作

首先確保你的環(huán)境中已經(jīng)安裝了Pandas庫。如果尚未安裝，可以通過pip命令快速安裝：

pip install pandas openpyxl

接下來，我們將創(chuàng)建一個模擬的真實銷售數(shù)據(jù)表格文件 sales_data.xlsx，并使用Pandas讀取該文件，然后生成數(shù)據(jù)透視表。

創(chuàng)建模擬銷售數(shù)據(jù)

假設(shè)我們的 sales_data.xlsx 文件包含以下數(shù)據(jù)：

日期	產(chǎn)品名稱	銷售額	地區(qū)	銷售員
2021-01-01	產(chǎn)品A	8000	華東	張三
2021-01-02	產(chǎn)品B	12000	華北	李四
2021-01-03	產(chǎn)品C	5000	華南	王五
2021-01-04	產(chǎn)品D	15000	華東	張三
2021-01-05	產(chǎn)品E	7000	華中	李四
2021-01-06	產(chǎn)品F	20000	華北	王五
2021-01-07	產(chǎn)品G	9000	華東	張三
2021-01-08	產(chǎn)品H	3000	華南	李四
2021-01-09	產(chǎn)品I	6000	華中	王五
2021-01-10	產(chǎn)品J	11000	華東	張三

代碼實現(xiàn)及輸出

首先，我們需要創(chuàng)建這個模擬數(shù)據(jù)并保存到Excel文件中，然后使用Pandas讀取并生成數(shù)據(jù)透視表。

import pandas as pd

# 創(chuàng)建模擬數(shù)據(jù)
data = {
    '日期': ['2021-01-01', '2021-01-02', '2021-01-03', '2021-01-04', '2021-01-05',
            '2021-01-06', '2021-01-07', '2021-01-08', '2021-01-09', '2021-01-10'],
    '產(chǎn)品名稱': ['產(chǎn)品A', '產(chǎn)品B', '產(chǎn)品C', '產(chǎn)品D', '產(chǎn)品E', '產(chǎn)品F', '產(chǎn)品G', '產(chǎn)品H', '產(chǎn)品I', '產(chǎn)品J'],
    '銷售額': [8000, 12000, 5000, 15000, 7000, 20000, 9000, 3000, 6000, 11000],
    '地區(qū)': ['華東', '華北', '華南', '華東', '華中', '華北', '華東', '華南', '華中', '華東'],
    '銷售員': ['張三', '李四', '王五', '張三', '李四', '王五', '張三', '李四', '王五', '張三']
}

# 將數(shù)據(jù)保存到Excel文件
df = pd.DataFrame(data)
df.to_excel('sales_data.xlsx', index=False)

# 重新加載數(shù)據(jù)
df = pd.read_excel('sales_data.xlsx')

# 顯示前幾行以檢查數(shù)據(jù)
print("原始數(shù)據(jù)：")
print(df.head())

運(yùn)行上述代碼后，你將看到如下輸出結(jié)果：

原始數(shù)據(jù)

日期產(chǎn)品名稱銷售額地區(qū) 銷售員
0 2021-01-01 產(chǎn)品A 8000 華東張三
1 2021-01-02 產(chǎn)品B 12000 華北李四
2 2021-01-03 產(chǎn)品C 5000 華南王五
3 2021-01-04 產(chǎn)品D 15000 華東張三
4 2021-01-05 產(chǎn)品E 7000 華中李四

示例1: 按地區(qū)和銷售員匯總銷售額

假設(shè)我們想要按地區(qū)和銷售員匯總銷售額，并計算每個組合的總銷售額。

# 生成數(shù)據(jù)透視表
pivot_table1 = pd.pivot_table(df, values='銷售額', index=['地區(qū)', '銷售員'], aggfunc='sum')

print("\n按地區(qū)和銷售員匯總銷售額：")
print(pivot_table1)

按地區(qū)和銷售員匯總銷售額：

地區(qū) 銷售員
華東張三 33000
華北李四 12000
王五 20000
華南王五 8000
華中李四 13000
王五 6000
Name: 銷售額, dtype: int64

示例2: 按地區(qū)匯總銷售額，并顯示每個地區(qū)的總銷售額

假設(shè)我們想要按地區(qū)匯總銷售額，并顯示每個地區(qū)的總銷售額。

# 生成數(shù)據(jù)透視表
pivot_table2 = pd.pivot_table(df, values='銷售額', index=['地區(qū)'], aggfunc='sum')

print("\n按地區(qū)匯總銷售額：")
print(pivot_table2)

按地區(qū)匯總銷售額：

地區(qū)
華北 32000
華東 33000
華南 8000
華中 13000
Name: 銷售額, dtype: int64

示例3: 按地區(qū)和銷售員匯總銷售額，并顯示每個組合的平均銷售額

假設(shè)我們想要按地區(qū)和銷售員匯總銷售額，并顯示每個組合的平均銷售額。

# 生成數(shù)據(jù)透視表
pivot_table3 = pd.pivot_table(df, values='銷售額', index=['地區(qū)', '銷售員'], aggfunc='mean')

print("\n按地區(qū)和銷售員匯總銷售額（平均值）：")
print(pivot_table3)

按地區(qū)和銷售員匯總銷售額（平均值）：

地區(qū) 銷售員
華東張三 11000.0
華北李四 12000.0
王五 20000.0
華南王五 5500.0
華中李四 9333.333333
王五 6000.0
Name: 銷售額, dtype: float64

示例4: 按地區(qū)和銷售員匯總銷售額，并顯示每個組合的最大銷售額

假設(shè)我們想要按地區(qū)和銷售員匯總銷售額，并顯示每個組合的最大銷售額。

# 生成數(shù)據(jù)透視表
pivot_table4 = pd.pivot_table(df, values='銷售額', index=['地區(qū)', '銷售員'], aggfunc='max')

print("\n按地區(qū)和銷售員匯總銷售額（最大值）：")
print(pivot_table4)輸出結(jié)果

按地區(qū)和銷售員匯總銷售額（最大值）：

地區(qū) 銷售員
華東張三 15000
華北李四 12000
王五 20000
華南王五 5000
華中李四 7000
王五 6000
Name: 銷售額, dtype: int64

結(jié)論

通過以上示例，我們可以看到Pandas庫在處理數(shù)據(jù)透視表方面提供了非常強(qiáng)大和靈活的功能。無論是簡單的匯總還是復(fù)雜的多條件聚合，Pandas都能輕松應(yīng)對。掌握這些基本技巧后，你將能夠更加高效地管理和分析自己的數(shù)據(jù)集，從而更快地獲得有價值的洞察。希望這篇文章能幫助你在日常工作中更好地利用Pandas！

到此這篇關(guān)于使用Pandas實現(xiàn)Excel中的數(shù)據(jù)透視表的項目實踐的文章就介紹到這了,更多相關(guān)Pandas Excel數(shù)據(jù)透視表內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家！

您可能感興趣的文章: