欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

一篇文章讓你快速掌握Pandas可視化圖表

 更新時間:2021年08月11日 10:21:47   作者:可以叫我才哥  
大家都知道Pandas是基于Python平臺的大數(shù)據(jù)分析與處理的利器,它可以把十分復雜的可視化過程,變得簡單一點,這篇文章主要給大家介紹了關于Pandas可視化圖表的相關資料,需要的朋友可以參考下

前言

今天簡單介紹一下Pandas可視化圖表的一些操作,Pandas其實提供了一個繪圖方法plot(),可以很方便的將Series和Dataframe類型數(shù)據(jù)直接進行數(shù)據(jù)可視化。

1. 概述

這里我們引入需要用到的庫,并做一些基礎設置。

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt

# 設置 可視化風格
plt.style.use('tableau-colorblind10') 

# 以下代碼從全局設置字體為SimHei(黑體),解決顯示中文問題【W(wǎng)indows】
plt.rcParams['font.sans-serif'] = ['SimHei']

# 解決中文字體下坐標軸負數(shù)的負號顯示問題
plt.rcParams['axes.unicode_minus'] = False 

plot方法默認是折線圖,而它還支持以下幾類圖表類型:

‘line' : 折線圖 (default)

‘bar' : 柱狀圖

‘barh' : 條形圖

‘hist' : 直方圖

‘box' : 箱型圖

‘kde' : 密度圖

‘density' : 同密度圖

‘a(chǎn)rea' : 面積圖

‘pie' : 餅圖

‘scatter' : 散點圖 (DataFrame only)

‘hexbin' : 六邊形箱體圖 (DataFrame only)

# 隨機種子
np.random.seed(1)
ts = pd.Series(np.random.randn(100), index=pd.date_range("1/1/2020", periods=100))
ts = ts.cumsum()
ts.plot()

2. 圖表元素設置

圖表元素設置主要是指 數(shù)據(jù)源選擇、圖大小、標題、坐標軸文字、圖例、網(wǎng)格線、圖顏色、字體大小、線條樣式、色系、多子圖、圖形疊加與繪圖引擎等等。

數(shù)據(jù)源選擇

這里是指坐標軸的x、y軸數(shù)據(jù),對于Series類型數(shù)據(jù)來說其索引就是x軸,y軸則是具體的值;對于Dataframe類型數(shù)據(jù)來說,其索引同樣是x軸的值,y軸默認為全部,不過可以進行指定選擇。

# 隨機種子
np.random.seed(1)
df = pd.DataFrame(np.random.randn(100, 4), index=ts.index, columns=list("ABCD"))
df = df.cumsum()
df.head()

對于案例數(shù)據(jù),直接繪圖效果如下(顯示全部列)

df.plot()

我們可以指定數(shù)據(jù)源,比如指定列A的數(shù)據(jù)

df.plot(y='A')

我們還可以指定x軸和多列為y,我這里先構建一列X,然后進行數(shù)據(jù)源選取

df["X"] = list(range(len(df)))
df.head()

選擇X列為x軸,B、C列為y軸數(shù)據(jù)

# 指定多個Y
df.plot(x='X',y=['B','C'])

圖大小

通過參數(shù)figsize傳入一個元組,指定圖的長寬(英寸)

注意:以下我們以柱狀圖為例做演示

np.random.seed(1)
df = pd.DataFrame(np.random.rand(10, 3), columns=["a", "b", "c"])
df.head()

# 圖像大小
df.plot.bar(figsize=(10,5))

除了在繪圖時定義圖像大小外,我們還可以通過matplotlib的全局參數(shù)設置圖像大小

plt.rcParams['figure.figsize'] = (10,5)

標題

通過參數(shù)title設置圖表標題,需要注意的是如果想要顯示中文,需要提前設置相關字體參數(shù),參考此前推文《》

# 標題
df.plot.bar(title='標題',)

圖例

通過參數(shù)legend可以設置圖例,默認是顯示圖例的,可以不顯示或者顯示的圖例順序倒序

# 圖例不顯示
df.plot.bar(legend=False)

# 圖例倒序
df.plot.bar(legend='reverse')

坐標軸文字

細心的朋友可能會發(fā)現(xiàn),在上圖中x軸標簽數(shù)字顯示是躺著的,怎么坐起來呢?

那么可以通過參數(shù)rot設置文字的角度

# x軸標簽旋轉(zhuǎn)角度
df.plot.bar(rot=0)

網(wǎng)格線

默認情況下圖表是不顯示網(wǎng)格線的,我們可以通過參數(shù)grid來設置其顯隱

# 網(wǎng)格線
df.plot.bar(grid=True)

圖顏色

通過color參數(shù)可以設定填充顏色,edgecolor可以設置邊框顏色

# 指定顏色
df.plot.bar(color=['red','orange','yellow'], edgecolor='grey')

字體大小

通過fontsize可以設置字體大小

# 字體大小
df.plot.bar(fontsize=20)

線條樣式

對于折線圖來說,還可以設置線條樣式style

df.plot(style = ['.-','--','*-'] # 圓點、虛線、星星
       )

色系

通過colormap參數(shù)可以指定色系,色系選擇可以參考matplotlib庫的色系表

# 指定色系
x = df.plot.bar(colormap='rainbow')

多子圖

通過subplots參數(shù)決定是否以多子圖形式輸出顯示圖表

# 多子圖
x = df.plot.line(title ='多子圖',
             fontsize =16,
             subplots =True, # 分列
             style = ['.-','--','*-','^-'] # 圓點、虛線、星星
            )

圖像疊加

不同的圖表類型組合在一起

df.a.plot.bar()
df.b.plot(color='r')

繪圖引擎

通過backend可以指定不同的繪圖引擎,目前默認是matplotlib,還支持bokeh、plotlyAltair等等。當然,在使用新的引擎前需要先安裝對應的庫。

# 繪圖引擎
import pandas_bokeh

pandas_bokeh.output_notebook()
df.plot.bar(backend='pandas_bokeh')

# 繪圖引擎 plotly
df.plot.bar(backend='plotly',
            barmode='group',
            height=500, # 圖表高度
            width=800, # 圖表寬度
           )

3. 常見圖表類型

在介紹完圖表元素設置后,我們演示一下常見的幾種圖表類型。

柱狀圖

柱狀圖主要用于數(shù)據(jù)的對比,通過柱形的高低來表達數(shù)據(jù)的大小。

# 柱狀圖bar
df.plot.bar()

(這里不做展示,前面案例中有)

此外我們還可以繪制堆疊柱狀圖,通過設置參數(shù)stacked來搞定

# 堆疊柱狀圖
df.plot.bar(stacked=True)

柱狀圖多子圖

# 柱狀圖多子圖
df.plot.bar(subplots=True, rot=0)

條形圖

條形圖和柱狀圖其實差不多,條形圖就是柱狀圖的橫向展示

# 條形圖barh
df.plot.barh(figsize=(6,8))

堆疊條形圖

# 堆疊條形圖
df.plot.barh(stacked=True)

直方圖

直方圖又稱為質(zhì)量分布圖,主要用于描述數(shù)據(jù)在不同區(qū)間內(nèi)的分布情況,描述的數(shù)據(jù)量一般比較大。

# 直方圖
np.random.seed(1)
df = pd.DataFrame(
    {
        "a": np.random.randn(1000) + 1,
        "b": np.random.randn(1000),
        "c": np.random.randn(1000) - 1,
    },
     columns=["a", "b", "c"],
)
df.head()

df.plot.hist(alpha=0.5) # alpha設置透明度

單直方圖

# 單直方圖
df.a.plot.hist()

堆疊并指定分箱數(shù)(默認為 10)

# 堆疊并指定分箱數(shù)(默認為 10)
df.plot.hist(stacked=True, bins=20)

橫向展示

# 可以通過orientation='horizontal'和 cumulative=True 繪制橫向和累積直方圖
df["a"].plot.hist(orientation="horizontal", cumulative=True)

多子圖展示

# 繪制多子圖
df.hist(color="k", alpha=0.5, bins=50)

單個直方圖(自定義分箱+透明度)

# 以下2種方式效果一致
df.hist('a', bins = 20, alpha=0.5)
# df.a.hist(bins = 20, alpha=0.5)

分組

# by 分組
np.random.seed(1)
data = pd.Series(np.random.randn(1000))
data.hist(by=np.random.randint(0, 4, 1000), figsize=(6, 4))

箱線圖

箱線圖又稱盒須圖、箱型圖等,用于顯示一組數(shù)據(jù)分布情況的統(tǒng)計圖。

np.random.seed(1)
df = pd.DataFrame(np.random.rand(10, 5), columns=["A", "B", "C", "D", "E"])
df.head()

df.boxplot()

指定元素顏色

# 指定元素顏色
color = {
  "boxes": "Green", # 箱體顏色
  "whiskers": "Orange", # 連線顏色
  "medians": "Blue", # 中位數(shù)顏色
  "caps": "Gray", # 極值顏色
}

df.boxplot(color=color, sym="r+")

橫向展示

df.boxplot(vert=False, positions=[1, 4, 5, 6, 8])

面積圖

面積圖又稱區(qū)域圖,是將折線圖與坐標軸之間的區(qū)域使用顏色填充,填充顏色可以很好地突出趨勢信息,一般顏色帶有透明度會更合適于觀察不同序列之間的重疊關系。

np.random.seed(1)
df = pd.DataFrame(np.random.rand(10, 4), columns=["a", "b", "c", "d"])
df.head()

默認情況下,面積圖是堆疊的

# 默認是堆疊
df.plot.area()

單個面積圖

df.a.plot.area()

取消堆疊

# 取消堆疊
df.plot.area(stacked=False)

散點圖

散點圖就是將數(shù)據(jù)點展示在直角坐標系上,可以很好地反應變量之間的相互影響程度

np.random.seed(1)
df = pd.DataFrame(np.random.rand(50, 4), columns=["a", "b", "c", "d"])

df["species"] = pd.Categorical(
  ["setosa"] * 20 + ["versicolor"] * 20 + ["virginica"] * 10
)

df.head()

指定一組數(shù)據(jù)

df.plot.scatter(x="a", y="b")

多組數(shù)據(jù)并用不同顏色標注

ax = df.plot.scatter(x="a", y="b", color="Blue", label="Group 1")
df.plot.scatter(x="c", y="d", color="red", label="Group 2", ax=ax)

一組數(shù)據(jù),x/y及z,其中x/y表示位置、z的值用于顏色區(qū)分

df.plot.scatter(x="a", y="b", c="c", s=50) # 參數(shù)s代表散點大小

一組數(shù)據(jù),然后分類并用不同顏色(色系下)表示

df.plot.scatter(x="a", y="b", c="species", cmap="viridis", s=50)

氣泡圖

df.plot.scatter(x="a", y="b", color="red", s=df["c"] * 200)

餅圖

餅圖主要用于不同分類的數(shù)據(jù)占總體的比例情況

np.random.seed(8)
series = pd.Series(3 * np.random.rand(4), index=["a", "b", "c", "d"], name="series")
series

series.plot.pie(figsize=(6, 6), fontsize=20)

多子圖展示

np.random.seed(8)
df = pd.DataFrame(
     3 * np.random.rand(4, 2), index=["a", "b", "c", "d"], columns=["x", "y"]
 )
df

df.plot.pie(subplots=True, figsize=(8, 4), fontsize=16)

指定顯示樣式

series.plot.pie(
     labels=["AA", "BB", "CC", "DD"], # 標簽
     colors=["r", "g", "b", "c"], # 指定顏色
     autopct="%.2f", # 數(shù)字格式(百分比)
     fontsize=20,
     figsize=(6, 6),
 )

如果數(shù)據(jù)總和小于1,可以繪制扇形

series = pd.Series([0.1] * 4, index=["a", "b", "c", "d"], name="series2")
series.plot.pie(figsize=(6, 6), normalize=False)

4. 其他圖表類型

在常見圖表中,有密度圖和六邊形箱型圖 繪制過程報錯,暫時沒有解決(本機環(huán)境:pandas1.3.1)

本節(jié)主要介紹散點矩形圖、安德魯曲線等,更多資料大家可以查閱官方文檔了解

https://pandas.pydata.org/pandas-docs/stable/user_guide/visualization.html

散點矩形圖

from pandas.plotting import scatter_matrix

df = pd.DataFrame(np.random.randn(1000, 4), columns=["a", "b", "c", "d"])
scatter_matrix(df, alpha=0.2, figsize=(6, 6), diagonal="kde")

安德魯曲線

from pandas.plotting import andrews_curves

data = pd.read_csv("iris.csv")
andrews_curves(data, "Name")

總結

到此這篇關于Pandas可視化圖表的文章就介紹到這了,更多相關Pandas可視化圖表內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關文章希望大家以后多多支持腳本之家!

相關文章

  • python實現(xiàn)不同文件夾下的函數(shù)相互調(diào)用

    python實現(xiàn)不同文件夾下的函數(shù)相互調(diào)用

    這篇文章主要介紹了python實現(xiàn)不同文件夾下的函數(shù)相互調(diào)用方式,具有很好的參考價值,希望對大家有所幫助,如有錯誤或未考慮完全的地方,望不吝賜教
    2023-08-08
  • 解決一個pandas執(zhí)行模糊查詢sql的坑

    解決一個pandas執(zhí)行模糊查詢sql的坑

    這篇文章主要介紹了解決一個pandas執(zhí)行模糊查詢sql的坑,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2021-03-03
  • pytorch 獲取層權重,對特定層注入hook, 提取中間層輸出的方法

    pytorch 獲取層權重,對特定層注入hook, 提取中間層輸出的方法

    今天小編就為大家分享一篇pytorch 獲取層權重,對特定層注入hook, 提取中間層輸出的方法,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2019-08-08
  • JMETER如何隨機請求參數(shù)

    JMETER如何隨機請求參數(shù)

    作者分享了在業(yè)務場景中如何優(yōu)化接口查詢的實踐經(jīng)驗,主要面臨的問題是需要隨機獲取上游查詢接口的結果,提出了兩種方案,方案一是反復查詢并隨機獲取查詢結果;方案二是查詢一次,然后隨機從查詢結果中獲取,通過實測比較,方案二的性能提升較大
    2024-10-10
  • python案例中Flask全局配置示例詳解

    python案例中Flask全局配置示例詳解

    這篇文章主要為大家介紹了python案例中Flask全局配置示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助,祝大家多多進步,早日升職加薪
    2022-12-12
  • pytorch實現(xiàn)梯度下降和反向傳播圖文詳細講解

    pytorch實現(xiàn)梯度下降和反向傳播圖文詳細講解

    這篇文章主要介紹了pytorch實現(xiàn)梯度下降和反向傳播,反向傳播的目的是計算成本函數(shù)C對網(wǎng)絡中任意w或b的偏導數(shù)。一旦我們有了這些偏導數(shù),我們將通過一些常數(shù)α的乘積和該數(shù)量相對于成本函數(shù)的偏導數(shù)來更新網(wǎng)絡中的權重和偏差
    2023-04-04
  • python接口自動化測試之接口數(shù)據(jù)依賴的實現(xiàn)方法

    python接口自動化測試之接口數(shù)據(jù)依賴的實現(xiàn)方法

    這篇文章主要介紹了python接口自動化測試之接口數(shù)據(jù)依賴的實現(xiàn)方法,小編覺得挺不錯的,現(xiàn)在分享給大家,也給大家做個參考。一起跟隨小編過來看看吧
    2019-04-04
  • 利用Python實現(xiàn)智能合約的示例詳解

    利用Python實現(xiàn)智能合約的示例詳解

    智能合約是一種由計算機程序編寫的自動化合約,它可以在沒有第三方干預的情況下執(zhí)行交易和契約條款。這篇文章主要介紹了如何利用Python實現(xiàn)智能合約,需要的可以參考一下
    2023-04-04
  • Pandas DataFrame求差集的示例代碼

    Pandas DataFrame求差集的示例代碼

    這篇文章主要介紹了Pandas DataFrame求差集的示例代碼,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧
    2020-12-12
  • 詳解Python如何通過文件后綴整理文件夾

    詳解Python如何通過文件后綴整理文件夾

    這篇文章主要為大家詳細介紹了Python如何通過文件后綴實現(xiàn)整理文件夾功能,文中的示例代碼講解詳細,感興趣的小伙伴可以跟隨小編一起學習一下
    2024-02-02

最新評論