手把手教你用Matplotlib實現(xiàn)數(shù)據(jù)可視化
介紹
在使用機器學習方法解決問題的過程中,一定會遇到需要針對數(shù)據(jù)進行繪圖的場景。
Matplotlib 是支持 Python 語言的開源繪圖庫,因為其支持豐富的繪圖類型、簡單的繪圖方式以及完善的接口文檔,深受 Python 工程師、科研學者、數(shù)據(jù)工程師等各類人士的喜歡
Matplotlib 擁有著十分活躍的社區(qū)以及穩(wěn)定的版本迭代,當我們在學習機器學習的課程時,掌握 Matplotlib 的使用無疑是最重要的準備工作之一
在使用 Notebook 環(huán)境繪圖時,需要先運行 Jupyter Notebook 的魔術命令 %matplotlib inline
這條命令的作用是將 Matplotlib 繪制的圖形嵌入在當前頁面中。而在桌面環(huán)境中繪圖時,不需要添加此命令,而是在全部繪圖代碼之后追加 plt.show()
簡單圖形繪制
使用 Matplotlib 提供的面向?qū)ο?API,需要導入 pyplot
模塊,并約定簡稱為 plt
快速上手
import matplotlib.pyplot as plt %matplotlib inline plt.plot([1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1])
前面,我們從 Matplotlib 中導入了 pyplot
繪圖模塊,并將其簡稱為 plt
pyplot
模塊是 Matplotlib 最核心的模塊,幾乎所有樣式的 2D 圖形都是經(jīng)過該模塊繪制出來的
自定義X/Y軸
plt.plot()
是 pyplot
模塊下面的直線繪制(折線圖)方法類. 示例中包含了一個 [1, 2, 3, 2, 1, 2, 3, 4, 5, 6, 5, 4, 3, 2, 1]
列表,Matplotlib 會默認將該列表作為 y 值,而 x 值會從 0 開始依次遞增。
當然,如果你需要自定義橫坐標值,只需要傳入兩個列表即可
plt.plot([1,2,3], [1, 2, 3])
圖表實現(xiàn)
匯總
上面演示了如何繪制一個簡單的折線圖
那么,除了折線圖,我們平常還要繪制柱狀圖、散點圖、餅狀圖等等. 這些圖應該怎樣繪制呢?
pyplot
模塊中 pyplot.plot
方法是用來繪制折線圖的
你應該會很容易聯(lián)想到,更改后面的方法類名就可以更改圖形的樣式。
的確,在 Matplotlib 中,大部分圖形樣式的繪制方法都存在于 pyplot 模塊中。例如:
方法 | 含義 |
---|---|
matplotlib.pyplot.plot | 折線圖 |
matplotlib.pyplot.angle_spectrum | 電子波譜圖 |
matplotlib.pyplot.bar | 柱狀圖 |
matplotlib.pyplot.barh | 直方圖 |
matplotlib.pyplot.broken_barh | 水平直方圖 |
matplotlib.pyplot.contour | 等高線圖 |
matplotlib.pyplot.errorbar | 誤差線 |
matplotlib.pyplot.hexbin | 六邊形圖案 |
matplotlib.pyplot.hist | 柱形圖 |
matplotlib.pyplot.hist2d | 水平柱狀圖 |
matplotlib.pyplot.pie | 餅狀圖 |
matplotlib.pyplot.quiver | 量場圖 |
matplotlib.pyplot.scatter | 散點圖 |
matplotlib.pyplot.specgram | 光譜圖 |
下面,我們參考折線圖的繪制方法,嘗試繪制幾個簡單的圖形。
正弦曲線圖
matplotlib.pyplot.plot(*args, **kwargs)
方法嚴格來講可以繪制線形圖或者樣本標記
其中,*args
允許輸入單個 y 值或 x,y 值
例如,我們這里繪制一張自定義 x,y 的正弦曲線圖
import numpy as np # 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標 X = np.linspace(-2*np.pi, 2*np.pi, 1000) # 計算 y 坐標 y = np.sin(X) # 向方法中 `*args` 輸入 X,y 坐標 plt.plot(X, y)
正弦曲線就繪制出來了。但值得注意的是,pyplot.plot
在這里繪制的正弦曲線,實際上不是嚴格意義上的曲線圖,而在兩點之間依舊是直線。
這里看起來像曲線是因為樣本點相互挨得很近。
柱狀圖
柱形圖 matplotlib.pyplot.bar(*args, **kwargs)
大家應該都非常了解了
這里,我們直接用上面的代碼,僅把 plt.plot(X, y)
改成 plt.bar(X, y)
試一下
plt.bar([1,2,3],[1,2,3])
散點圖
散點圖 matplotlib.pyplot.scatter(*args, **kwargs)
就是呈現(xiàn)在二維平面的一些點,這種圖像的需求也是非常常見的
比如,我們通過 GPS 采集的數(shù)據(jù)點,它會包含經(jīng)度以及緯度兩個值,這樣的情況就可以繪制成散點圖
# X,y 的坐標均有 numpy 在 0 到 1 中隨機生成 1000 個值 X = np.random.ranf(1000) y = np.random.ranf(1000) # 向方法中 `*args` 輸入 X,y 坐標 plt.scatter(X, y)
餅圖
餅狀圖 matplotlib.pyplot.pie(*args, **kwargs)
在有限列表以百分比呈現(xiàn)時特別有用,你可以很清晰地看出來各類別之間的大小關系,以及各類別占總體的比例。
plt.pie([1, 2, 3, 4, 5])
量場圖
量場圖 matplotlib.pyplot.quiver(*args, **kwargs)
就是由向量組成的圖像,在氣象學等方面被廣泛應用
從圖像的角度來看,量場圖就是帶方向的箭頭符號
X, y = np.mgrid[0:10, 0:10] plt.quiver(X, y)
等高線圖
中學學習地理的時候,我們就知道等高線了
等高線圖 matplotlib.pyplot.contourf(*args, **kwargs)
是工程領域經(jīng)常接觸的一類圖,它的繪制過程稍微復雜一些
# 生成網(wǎng)格矩陣 x = np.linspace(-5, 5, 500) y = np.linspace(-5, 5, 500) X, Y = np.meshgrid(x, y) # 等高線計算公式 Z = (1 - X / 2 + X ** 3 + Y ** 4) * np.exp(-X ** 2 - Y ** 2) plt.contourf(X, Y, Z)
圖形樣式
上面,我們繪制了簡單的基礎圖形,但這些圖形都不美觀
我們已經(jīng)知道了,線形圖通過 matplotlib.pyplot.plot(*args, **kwargs)
方法繪出
其中,args
代表數(shù)據(jù)輸入,而 kwargs 的部分就是用于設置樣式參數(shù)了。
折線圖
二維線形圖 包含的參數(shù) 超過 40 余項,其中常用的也有 10 余項,選取一些比較有代表性的參數(shù)列舉如下:
參數(shù) | 含義 |
---|---|
alpha= | 設置線型的透明度,從 0.0 到 1.0 |
color= | 設置線型的顏色 |
fillstyle= | 設置線型的填充樣式 |
linestyle= | 設置線型的樣式 |
linewidth= | 設置線型的寬度 |
marker= | 設置標記點的樣式 |
…… | …… |
至于每一項參數(shù)包含的設置選項,大家需要通過 官方文檔 詳細了解
下面,我們重新繪制一個三角函數(shù)圖形
# 在 -2PI 和 2PI 之間等間距生成 1000 個值,也就是 X 坐標 X = np.linspace(-2 * np.pi, 2 * np.pi, 1000) # 計算 sin() 對應的縱坐標 y1 = np.sin(X) # 計算 cos() 對應的縱坐標 y2 = np.cos(X) # 向方法中 `*args` 輸入 X,y 坐標 plt.plot(X, y1, color='r', linestyle='--', linewidth=2, alpha=0.8) plt.plot(X, y2, color='b', linestyle='-', linewidth=2)
散點圖
散點圖也是相似的,它們的很多樣式參數(shù)都是大同小異,需要大家閱讀 官方文檔 詳細了解。
參數(shù) | 含義 |
---|---|
s= | 散點大小 |
c= | 散點顏色 |
marker= | 散點樣式 |
cmap= | 定義多類別散點的顏色 |
alpha= | 點的透明度 |
edgecolors= | 散點邊緣顏色 |
# 生成隨機數(shù)據(jù) x = np.random.rand(1000) y = np.random.rand(1000) colors = np.random.rand(1000) size = np.random.normal(50, 60, 1000) # 繪制散點圖 plt.scatter(x, y, s=size, c=colors)
餅圖
餅狀圖通過 matplotlib.pyplot.pie()
繪出
我們也可以進一步設置它的顏色、標簽、陰影等各類樣式
# 各類別標簽 label = 'a','b','c','d' # 各類別顏色 color = 'r', 'g', 'r', 'g' # 各類別占比 size = [1, 2, 3, 4] # 各類別的偏移半徑 explode = (0, 0, 0, 0, 0.2) # 繪制餅狀圖 plt.pie(size, colors=color, explode=explode, labels=label, shadow=True, autopct='%1.1f%%') # 餅狀圖呈正圓 plt.axis('equal')
組合圖形樣式
上面演示了單個簡單圖像的繪制
實際上,我們往往會遇到將幾種類型的一樣的圖放在一張圖內(nèi)顯示,也就是組合圖的繪制。
其實很簡單,你只需要將所需圖形的代碼放置在一起就可以了,比如繪制一張包含柱形圖和折線圖的組合圖。
x = [1, 3, 5, 7, 9, 11, 13, 15, 17, 19] y_bar = [3, 4, 6, 8, 9, 10, 9, 11, 7, 8] y_line = [2, 3, 5, 7, 8, 9, 8, 10, 6, 7] plt.bar(x, y_bar) plt.plot(x, y_line, '-o', color='y')
圖形位置
figure對象
在圖形的繪制過程中,你可能需要調(diào)整圖形的位置,或者把幾張單獨的圖形拼接在一起
此時,我們就需要引入 plt.figure
圖形對象了
# 生成數(shù)據(jù) x = np.linspace(0, 10, 20) y = x * x + 2 # 新建圖形對象 fig = plt.figure() # 控制畫布的左, 下, 寬度, 高度 axes = fig.add_axes([0.5, 0.5, 0.8, 0.8]) axes.plot(x, y, 'r')
上面的繪圖代碼中,你可能會對 figure
和 axes
產(chǎn)生疑問
Matplotlib 的 API 設計的非常符合常理,在這里,figure
相當于繪畫用的畫板,而 axes
則相當于鋪在畫板上的畫布
我們將圖像繪制在畫布上,于是就有了 plot
,set_xlabel
等操作。
借助于圖形對象,我們可以實現(xiàn)大圖套小圖的效果
# 新建畫板 fig = plt.figure() # 大畫布 axes1 = fig.add_axes([0.1,0.1,0.8,0.8]) # 小畫布 axes2 = fig.add_axes([0.2,0.5,0.4,0.3]) # 大畫布 axes1.plot(x,y,'r') # 小畫布 axes2.plot(x,y,'g')
上面的繪圖代碼中,使用了 add_axes()
方法向我們設置的畫板 figure
中添加畫布 axes
subplots對象
在 Matplotlib 中,還有一種添加畫布的方式,那就是 plt.subplots()
,它和 axes
都等同于畫布
flg,axes = plt.subplots() axes.plot(x,y,'r')
借助于 plt.subplots()
,我們就可以實現(xiàn)子圖的繪制,也就是將多張圖按一定順序拼接在一起
# 子圖為 1 行,2 列 flg,axes = plt.subplots(nrows=1,ncols=2) for ax in axes: ax.plot(x,y,'r')
或者:
x = [1,2,3] y = [1,2,3] flg,axes = plt.subplots(nrows=1,ncols=2) axes[0].plot(x,y,'r') axes[1].plot(x[::-1],y,'r')
通過設置 plt.subplots
的參數(shù),可以實現(xiàn)調(diào)節(jié)畫布尺寸和顯示精度
fig, axes = plt.subplots( # 通過 figsize 調(diào)節(jié)尺寸, dpi 調(diào)節(jié)顯示精度 figsize=(16, 9), dpi=50 ) axes.plot(x, y, 'r')
規(guī)范繪圖方法
首先,任何圖形的繪制,都建議通過 plt.figure()
或者 plt.subplots()
管理一個完整的圖形對象
而不是簡單使用一條語句,例如 plt.plot(...)
來繪圖
管理一個完整的圖形對象,有很多好處, 在圖形的基礎上,給后期添加圖例,圖形樣式,標注等預留了很大的空間, 除此之外代碼看起來也更加規(guī)范,可讀性更強.
接下來,我們就通過幾組例子來演示規(guī)范的繪圖方法.
添加圖標題/圖例
繪制包含圖標題、坐標軸標題以及圖例的圖形,舉例如下:
fig, axes = plt.subplots() # 橫軸名稱 axes.set_xlabel('x label') axes.set_ylabel('y label') # 圖形名稱 axes.set_title('title') axes.plot(x, x**2) axes.plot(x, x**3) # 圖例 axes.legend(["y = x**2", "y = x**3"], loc=0)
圖例中的 loc
參數(shù)標記圖例位置,1,2,3,4
依次代表:右上角、左上角、左下角,右下角;0
代表自適應
線型、顏色、透明度
在 Matplotlib 中,你可以設置線的顏色、透明度等其他屬性
fig,axes = plt.subplots() axes.plot(x, x+1, color="red", alpha=0.5) axes.plot(x, x+2, color="#1155dd") axes.plot(x, x+3, color="#15cc55")
而對于線型而言,除了實線、虛線之外,還有很多豐富的線型可供選擇
fig, ax = plt.subplots(figsize=(12, 6)) # 線寬 ax.plot(x, x+1, color="blue", linewidth=0.25) ax.plot(x, x+2, color="blue", linewidth=0.50) ax.plot(x, x+3, color="blue", linewidth=1.00) ax.plot(x, x+4, color="blue", linewidth=2.00) # 虛線類型 ax.plot(x, x+5, color="red", lw=2, linestyle='-') ax.plot(x, x+6, color="red", lw=2, ls='-.') ax.plot(x, x+7, color="red", lw=2, ls=':') # 虛線交錯寬度 line, = ax.plot(x, x+8, color="black", lw=1.50) line.set_dashes([5, 10, 15, 10]) # 符號 ax.plot(x, x + 9, color="green", lw=2, ls='--', marker='+') ax.plot(x, x+10, color="green", lw=2, ls='--', marker='o') ax.plot(x, x+11, color="green", lw=2, ls='--', marker='s') ax.plot(x, x+12, color="green", lw=2, ls='--', marker='1') # 符號大小和顏色 ax.plot(x, x+13, color="purple", lw=1, ls='-', marker='o', markersize=2) ax.plot(x, x+14, color="purple", lw=1, ls='-', marker='o', markersize=4) ax.plot(x, x+15, color="purple", lw=1, ls='-', marker='o', markersize=8, markerfacecolor="red") ax.plot(x, x+16, color="purple", lw=1, ls='-', marker='s', markersize=8, markerfacecolor="yellow", markeredgewidth=2, markeredgecolor="blue")
畫布網(wǎng)格、坐標軸范圍
有些時候,我們可能需要顯示畫布網(wǎng)格或調(diào)整坐標軸范圍
設置畫布網(wǎng)格和坐標軸范圍
這里,我們通過指定 axes[0]
序號,來實現(xiàn)子圖的自定義順序排列
fig, axes = plt.subplots(1, 2, figsize=(10, 5)) # 顯示網(wǎng)格 axes[0].plot(x, x**2, x, x**3, lw=2) axes[0].grid(True) # 設置坐標軸范圍 axes[1].plot(x, x**2, x, x**3) axes[1].set_ylim([0, 60]) axes[1].set_xlim([2, 5])
除了折線圖,Matplotlib 還支持繪制散點圖、柱狀圖等其他常見圖形
下面,我們繪制由散點圖、梯步圖、條形圖、面積圖構(gòu)成的子圖
n = np.array([0, 1, 2, 3, 4, 5]) fig, axes = plt.subplots(1, 4, figsize=(16, 5)) axes[0].scatter(x, x + 0.25*np.random.randn(len(x))) axes[0].set_title("scatter") axes[1].step(n, n**2, lw=2) axes[1].set_title("step") axes[2].bar(n, n**2, align="center", width=0.5, alpha=0.5) axes[2].set_title("bar") axes[3].fill_between(x, x**2, x**3, color="green", alpha=0.5) axes[3].set_title("fill_between")
圖形標注方法
當我們繪制一些較為復雜的圖像時,閱讀對象往往很難全面理解圖像的含義。而此時,圖像標注往往會起到畫龍點睛的效果
圖像標注,就是在畫面上添加文字注釋、指示箭頭、圖框等各類標注元素
Matplotlib 中,文字標注的方法由 matplotlib.pyplot.text()
實現(xiàn)
最基本的樣式為 matplotlib.pyplot.text(x, y, s)
,其中 x, y 用于標注位置定位,s 代表標注的字符串
除此之外,你還可以通過 fontsize=
, horizontalalignment=
等參數(shù)調(diào)整標注字體的大小,對齊樣式等
下面,我們舉一個對柱形圖進行文字標注的示例
fig,axes = plt.subplots() # 柱形圖橫坐標 x_bar = [ 10,20,30,40,50 ] # 柱形圖縱坐標 y_bar = [ 0.5,0.6,0.3,0.4,0.8 ] # 繪制柱形圖 bars = axes.bar(x_bar,y_bar,color="blue",label=x_bar,width=2) for i,rect in enumerate(bars): # 獲取柱形圖縱坐標 x_text = rect.get_x() # 獲取柱子的高度并增加0.01 y_text = rect.get_height() + 0.01 # 標注文字 plt.text(x_text,y_text,'%.1f' % y_bar[i])
除了文字標注之外,還可以通過 matplotlib.pyplot.annotate()
方法向圖像中添加箭頭等樣式標注
接下來,我們向上面的例子中增添一行增加箭頭標記的代碼
for i, rect in enumerate(bars): # 獲取柱形圖縱坐標 x_text = rect.get_x() # 獲取柱子的高度并增加0.01 y_text = rect.get_height() + 0.01 # 標注文字 plt.text(x_text, y_text, '%.1f' % y_bar[i]) # 增加箭頭標注 plt.annotate( 'Min', xy=(32, 0.3), xytext=(36, 0.3), arrowprops=dict(facecolor='black', width=1, headwidth=7) )
上面的示例中,xy=()
表示標注終點坐標,xytext=()
表示標注起點坐標
在箭頭繪制的過程中,arrowprops=()
用于設置箭頭樣式,facecolor=
設置顏色,width=
設置箭尾寬度,headwidth=
設置箭頭寬度,可以通過 arrowstyle=
改變箭頭的樣式。
以上就是手把手教你用Matplotlib實現(xiàn)數(shù)據(jù)可視化的詳細內(nèi)容,更多關于Matplotlib數(shù)據(jù)可視化的資料請關注腳本之家其它相關文章!
相關文章
Python venv虛擬環(huán)境跨設備遷移的實現(xiàn)
本文主要介紹了Python venv虛擬環(huán)境跨設備遷移的實現(xiàn),文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧2022-06-06pycharm中keras導入報錯無法自動補全cannot?find?reference分析
這篇文章主要介紹了pycharm中keras導入報錯無法自動補全cannot?find?reference分析,文章圍繞主題展開分析,需要的小伙伴可以參考一下2022-07-07