Pandas 內(nèi)置的十種畫圖方法
前言
Pandas
是非常常見的數(shù)據(jù)分析工具,我們一般都會處理好處理數(shù)據(jù)然后使用searbon
或matplotlib
來進行繪制。但在Pandas
內(nèi)部就已經(jīng)集成了matplotlib
,本文將展示Pandas
內(nèi)部的畫圖方法。
畫圖類型
在Pandas
中內(nèi)置的畫圖方法如下幾類,基本上都是常見的畫圖方法。每種方法底層也是使用的matplotlib
。
line
: line plot (default)
bar
: vertical bar plot
barh
: horizontal bar plot
hist
: histogram
box
: boxplot
density/kde
: Density Estimation
area
: area plot
pie
: pie plot
scatter
: scatter plot
hexbin
: hexbin plot
在進行畫圖時我們有兩種調(diào)用方法:
df = pd.DataFrame({ 'sales': [3, 3, 3, 9, 10, 6], 'signups': [4, 5, 6, 10, 12, 13], 'visits': [20, 42, 28, 62, 81, 50], }, index=pd.date_range(start='2018/01/01', end='2018/07/01', freq='M')) # 方法1,這種方法是高層API,需要制定kind df.plot(kind='area') # 方法2,這種方法是底層API df.plot.area()
面積圖(area)
面積圖直觀地顯示定量數(shù)據(jù)下面的區(qū)域面積,該函數(shù)包裝了 matplotlib 的area函數(shù)。
# 默認為面積堆疊 df.plot(kind='area')
# 設(shè)置面積不堆疊 df.plot.area(stacked=False)
# 手動指定坐標(biāo)軸 df.plot.area(y='sales', x='signups')
條形圖(bar)
條形圖是一種用矩形條顯示分類數(shù)據(jù)的圖,矩形條的長度與它們所代表的值成比例。條形圖顯示離散類別之間的比較。圖的一個軸顯示比較的特定類別,另一個軸表示測量值。
df = pd.DataFrame({'lab':['A', 'B', 'C'], 'val':[10, 30, 20]}) # 手動設(shè)置坐標(biāo)軸 ax = df.plot.bar(x='lab', y='val', rot=0)
# 并排繪制 df.plot.bar(rot=0)
# 堆疊繪制 df.plot.bar(stacked=True)
# 分圖繪制 axes = df.plot.bar(rot=0, subplots=True) axes[0].legend(loc=2) axes[1].legend(loc=2)
水平條形圖(barh)
水平條形圖是用矩形條形表示定量數(shù)據(jù)的圖表,矩形條形的長度與它們所代表的值成正比。條形圖顯示離散類別之間的比較。
# 并排繪制 df.plot.barh(rot=0)
# 堆疊繪制 df.plot.barh(stacked=True)
箱線圖(boxplot)
箱線圖是一種通過四分位數(shù)以圖形方式描繪數(shù)值數(shù)據(jù)組的方法。該框從數(shù)據(jù)的 Q1 到 Q3 四分位值延伸,在中位數(shù) (Q2) 處有一條線。
age_list = [8, 10, 12, 14, 72, 74, 76, 78, 20, 25, 30, 35, 60, 85] df = pd.DataFrame({"gender": list("MMMMMMMMFFFFFF"), "age": age_list}) ax = df.plot.box(column="age", by="gender", figsize=(10, 8))
密度圖(density)
核密度估計 (KDE) 是一種估計隨機變量的概率密度函數(shù) (PDF) 的非參數(shù)方法。
s = pd.Series([1, 2, 2.5, 3, 3.5, 4, 5]) ax = s.plot.kde()
df = pd.DataFrame({ 'x': [1, 2, 2.5, 3, 3.5, 4, 5], 'y': [4, 4, 4.5, 5, 5.5, 6, 6], }) ax = df.plot.kde()
六邊形圖(hexbin)
和熱力圖類似,具體的顏色按照密度來進行展示。但形狀使用六邊形圖代替。
n = 10000 df = pd.DataFrame({'x': np.random.randn(n), 'y': np.random.randn(n)}) ax = df.plot.hexbin(x='x', y='y', gridsize=20)
直方圖(hist)
df = pd.DataFrame( np.random.randint(1, 7, 6000), columns = ['one']) df['two'] = df['one'] + np.random.randint(1, 7, 6000) ax = df.plot.hist(bins=12, alpha=0.5)
折線圖(line)
s = pd.Series([1, 3, 2]) s.plot.line()
df = pd.DataFrame({ 'pig': [20, 18, 489, 675, 1776], 'horse': [4, 25, 281, 600, 1900] }, index=[1990, 1997, 2003, 2009, 2014]) lines = df.plot.line()
餅圖(pie)
df = pd.DataFrame({'mass': [0.330, 4.87 , 5.97], 'radius': [2439.7, 6051.8, 6378.1]}, index=['Mercury', 'Venus', 'Earth']) plot = df.plot.pie(y='mass', figsize=(5, 5))
# 默認使用index進行分組 df.plot.pie(subplots=True, figsize=(11, 6))
散點圖(scatter)
df = pd.DataFrame([[5.1, 3.5, 0], [4.9, 3.0, 0], [7.0, 3.2, 1], [6.4, 3.2, 1], [5.9, 3.0, 2]], columns=['length', 'width', 'species']) ax1 = df.plot.scatter(x='length',y='width', c='DarkBlue')
到此這篇關(guān)于Pandas 內(nèi)置的十種畫圖方法的文章就介紹到這了,更多相關(guān)Pandas 內(nèi)置畫圖方法內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Python從入門到實戰(zhàn)之?dāng)?shù)據(jù)結(jié)構(gòu)篇
數(shù)據(jù)結(jié)構(gòu)中有很多樹的結(jié)構(gòu),其中包括二叉樹、二叉搜索樹、2-3樹、紅黑樹等等。本文中對數(shù)據(jù)結(jié)構(gòu)進行了總結(jié),不求嚴格精準(zhǔn),但求簡單易懂2021-11-11python直接調(diào)用和使用swig法方調(diào)用c++庫
這篇文章主要介紹了python直接調(diào)用和使用swig法方調(diào)用c++庫,c++運算速度快于python,python簡單易寫。很多時候?qū)τ谝延械腸++代碼也不想用python重寫,此時就自然而然地想到用python調(diào)用c或者c++,兩全其美,需要的朋友可以參考一下2022-03-03詳解Python中命令行參數(shù)argparse的常用命令
這篇文章主要為大家詳細介紹了Python中命令行參數(shù)argparse的一些常用命令,文中的示例代碼講解詳細,具有一定的學(xué)習(xí)價值,需要的可以了解一下2023-01-01Python實現(xiàn)的合并兩個有序數(shù)組算法示例
這篇文章主要介紹了Python實現(xiàn)的合并兩個有序數(shù)組算法,涉及Python針對數(shù)組的遍歷、計算、追加等相關(guān)操作技巧,需要的朋友可以參考下2019-03-03在pandas中遍歷DataFrame行的實現(xiàn)方法
這篇文章主要介紹了在pandas中遍歷DataFrame行的實現(xiàn)方法,文中通過示例代碼介紹的非常詳細,對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-10-10