欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

Python Matplotlib繪制箱線圖的全過程

 更新時間:2021年09月15日 11:21:34   作者:高成珍  
又稱箱形圖(boxplot)或盒式圖,數(shù)據(jù)大小、占比、趨勢等等的呈現(xiàn)其包含一些統(tǒng)計學的均值、分位數(shù)、極值等等統(tǒng)計量,因此該圖信息量較大,下面這篇文章主要給大家介紹了關(guān)于Python Matplotlib繪制箱線圖的相關(guān)資料,需要的朋友可以參考下

箱線圖介紹

箱線圖(Box-plot)又稱為盒式圖或箱型圖,是一種用來顯示一組數(shù)據(jù)分散情況的統(tǒng)計圖,它能顯示一組數(shù)據(jù)的上界、下界、中位數(shù)、上下四分位數(shù)以及異常值等。箱線圖的各部分組成及其含義如下圖所示。

 關(guān)鍵術(shù)語說明 四分位數(shù):

  • 四分位數(shù):就是把一組數(shù)據(jù)按照從小到大的順序進行排列,然后分成四等份,處于三個分割點位置的數(shù)字就是四分位數(shù);
  • 第一四分位數(shù)(q1):又稱“較小四分位數(shù)”或“下四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第25%的數(shù)字,q1的位置 = 1+(n-1)x 0.25;
  • 第二四分位數(shù)(q2):又稱“中位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第50%的數(shù)字,q2的位置= 1+(n-1)x 0.5;
  • 第三四分位數(shù)(q3),又稱“較大四分位數(shù)”或“上四分位數(shù)”,等于該樣本中所有數(shù)值由小到大排列后第75%的數(shù)字。q3的位置= 1+(n-1)x 0.75;
  • 四分位間距(InterQuartile Range,IQR):第三四分位數(shù)與第一四分位數(shù)的差距(q3數(shù)據(jù)- q1數(shù)據(jù));
  • Whiske上限(大于該值即為異常值):q3數(shù) + 1.5*IQR,(1.5表示超過的比例,是一個系數(shù),可根據(jù)實際情況調(diào)整);
  • Whisker下限(小于該值即為異常值):q1數(shù) - 1.5*IQR。

首先對這組數(shù)據(jù)進行排序得到:[12, 30, 36, 40, 45, 50, 80],數(shù)組長度n為7;

q1的位置 = 1+(n-1)x 0.25=1 + 6*0.25 =2.5,所以q1的值為:30 + (36 - 30)*0.5 = 33

q2的位置 = 1+(n-1)x 0.5=1 + 6*0.5 =4,所以q2的值為40

q3的位置 = 1+(n-1)x 0.75=1 + 6*0.75 =5.5,所以q3的值為:45 + (50 - 45)*0.5=47.5

例2:一組數(shù)據(jù)[12, 45, 30, 80, 36, 50, 40, 43],分別求出q1、q2、q3

首先對這組數(shù)據(jù)進行排序得到:[12, 30, 36, 40, 43, 45, 50, 80],數(shù)組長度n為8;

q1的位置 = 1+(n-1)x 0.25=1 + 7*0.25 =2.75,所以q1的值為:30 + (36 - 30)*0.75 = 34.5

q2的位置 = 1+(n-1)x 0.5=1 + 7*0.5 =4.5,所以q2的值為40 + (43-40)*0.5=41.5

q3的位置 = 1+(n-1)x 0.75=1 + 7*0.75 =6.25,所以q3的值為:45 + (50 - 45)*0.25=46.25

在numpy中提供了quantile()函數(shù),可以直接獲取四分位數(shù),例如np.quantile(x, 0.25)即可獲取數(shù)組x中的q1值。

Matplotlib中繪制箱線圖的方法:boxplot

boxplot(

        x, notch=None, sym=None, vert=None, whis=None,

        positions=None, widths=None, patch_artist=None,

        bootstrap=None, usermedians=None, conf_intervals=None,

        meanline=None, showmeans=None, showcaps=None, showbox=None,

        showfliers=None, boxprops=None, labels=None, flierprops=None,

        medianprops=None, meanprops=None, capprops=None,

        whiskerprops=None, manage_ticks=True, autorange=False,

        zorder=None, *, data=None):

關(guān)鍵參數(shù)含義說明如下:

  • x:指定要繪制箱線圖的數(shù)據(jù),可以是一組數(shù)據(jù)也可以是多組數(shù)據(jù);
  • notch:是否以凹口的形式展現(xiàn)箱線圖,默認非凹口;
  • sym:指定異常點的形狀,默認為藍色的+號顯示;
  • vert:是否需要將箱線圖垂直擺放,默認垂直擺放;
  • whis:指定上下須與上下四分位的距離,默認為1.5倍的四分位差;
  • positions:指定箱線圖的位置,默認為range(1, N+1),N為箱線圖的數(shù)量;
  • widths:指定箱線圖的寬度,默認為0.5;
  • patch_artist:是否填充箱體的顏色,默認為False;
  • meanline:是否用線的形式表示均值,默認用點來表示;
  • showmeans:是否顯示均值,默認不顯示;
  • showcaps:是否顯示箱線圖頂端和末端的兩條線,默認顯示;
  • showbox:是否顯示箱線圖的箱體,默認顯示;
  • showfliers:是否顯示異常值,默認顯示;
  • boxprops:設(shè)置箱體的屬性,如邊框色,填充色等;
  • labels:為箱線圖添加標簽,類似于圖例的作用;
  • filerprops:設(shè)置異常值的屬性,如異常點的形狀、大小、填充色等;
  • medianprops:設(shè)置中位數(shù)的屬性,如線的類型、粗細等;
  • meanprops:設(shè)置均值的屬性,如點的大小、顏色等;
  • capprops:設(shè)置箱線圖頂端和末端線條的屬性,如顏色、粗細等;
  • whiskerprops:設(shè)置須的屬性,如顏色、粗細、線的類型等;
  • manage_ticks:是否自適應(yīng)標簽位置,默認為True;
  • autorange:是否自動調(diào)整范圍,默認為False;

程序舉例

(1)繪制單個箱線圖

import matplotlib.pyplot as plt
import numpy as np
x = np.array([12, 45, 30, 70, 36, 50, 40, 26, 38])
print(sorted(x))
a = np.quantile(x, 0.75)  # 上四分之一數(shù)
b = np.quantile(x, 0.25)  # 下四分之一數(shù)
print("平均數(shù):", np.mean(x))  # 打印均值
print("中位數(shù):", np.median(x))  # 打印中位數(shù)
print("上四分之一數(shù):", a)  # 打印上四分之一數(shù)
print("下四分之一數(shù):", b)  # 打印下四分之一數(shù)
up = a + 1.5 * (a - b)  # 異常值判斷標準
down = b - 1.5 * (a - b)  # 異常值判斷標準
x = np.sort(x)  # 對原始數(shù)據(jù)排序
shangjie = x[x < up][-1]  # 除了異常值外的最大值
xiajie = x[x > down][0]  # 除了異常值外的最小值
print("上界:", shangjie)  # 打印上界
print("up:", up)
print("down:", down)
print("下界:", xiajie)  # 打印下界
plt.grid(True)  # 顯示網(wǎng)格
y = plt.boxplot(x, meanline=True, showmeans=True,
                flierprops={"marker": "o", "markerfacecolor": "red", "markersize": 15})  # 繪制箱形圖,設(shè)置異常點大小、樣式等
plt.show()  # 顯示圖

程序執(zhí)行效果圖:

 控制臺輸出結(jié)果為:

[12, 26, 30, 36, 38, 40, 45, 50, 70]
平均數(shù): 38.55555555555556
中位數(shù): 38.0
上四分之一數(shù): 45.0
下四分之一數(shù): 30.0
上界: 50
up: 67.5
down: 7.5
下界: 12

(2)繪制多個箱線圖

import matplotlib.pyplot as plt
import numpy as np
x = np.random.randint(10, 100, size=(5, 9))  # 隨機生成5行9列 [10, 100]之間的數(shù)
print(x)  # 打印數(shù)據(jù)
plt.grid(True)  # 顯示網(wǎng)格
plt.boxplot(x, labels=list("ABCDEFGHI"), sym="r+", showmeans=True)  # 繪制箱線圖
plt.show()  # 顯示圖片

程序執(zhí)行效果圖:

 注:圖中紅色+號表示異常點,綠色三角形表示平均數(shù)。

控制臺輸出的打印結(jié)果為:

 更多Python[[90 99 35 32 21 31 83 71 39]
 [24 95 63 50 92 41 89 16 79]
 [73 73 53 21 39 60 50 55 43]
 [64 94 66 26 20 73 40 68 45]
 [74 72 33 81 73 59 85 23 17]]

總結(jié)

到此這篇關(guān)于Python Matplotlib繪制箱線圖的文章就介紹到這了,更多相關(guān)Matplotlib繪制箱線圖內(nèi)容請搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!

相關(guān)文章

  • 使用Django實現(xiàn)文章與多個標簽關(guān)聯(lián)的示例詳解

    使用Django實現(xiàn)文章與多個標簽關(guān)聯(lián)的示例詳解

    在構(gòu)建一個博客或內(nèi)容管理系統(tǒng)時,經(jīng)常需要實現(xiàn)文章與標簽的關(guān)聯(lián),在 Django 中,我們可以利用 ManyToManyField 來實現(xiàn)文章與標簽的多對多關(guān)系,在本文中,我們將詳細探討如何使用 Django 模型實現(xiàn)文章與多個標簽的關(guān)聯(lián),需要的朋友可以參考下
    2023-11-11
  • Python中 map()函數(shù)的用法詳解

    Python中 map()函數(shù)的用法詳解

    map( )函數(shù)在算法題目里面經(jīng)常出現(xiàn),map( )會根據(jù)提供的函數(shù)對指定序列做映射,在寫返回值等需要轉(zhuǎn)換的時候比較常用。這篇文章主要介紹了Python中 map()的用法,需要的朋友可以參考下
    2018-07-07
  • python?動態(tài)導入模塊實現(xiàn)模塊熱更新的方法

    python?動態(tài)導入模塊實現(xiàn)模塊熱更新的方法

    這篇文章主要介紹了python?動態(tài)導入模塊,實現(xiàn)模塊熱更新,本文給大家介紹的非常詳細,對大家的學習或工作具有一定的參考借鑒價值,需要的朋友可以參考下
    2022-08-08
  • 基于K.image_data_format() == ''channels_first'' 的理解

    基于K.image_data_format() == ''channels_first'' 的理解

    這篇文章主要介紹了基于K.image_data_format() == 'channels_first' 的理解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • Pytorch實現(xiàn)將模型的所有參數(shù)的梯度清0

    Pytorch實現(xiàn)將模型的所有參數(shù)的梯度清0

    這篇文章主要介紹了Pytorch實現(xiàn)將模型的所有參數(shù)的梯度清0,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧
    2020-06-06
  • Django自定義用戶認證示例詳解

    Django自定義用戶認證示例詳解

    這篇文章主要給大家介紹了關(guān)于Django自定義用戶認證的相關(guān)資料,文中通過示例代碼介紹的非常詳細,對大家的學習或者工作具有一定的參考學習價值,需要的朋友們下面隨著小編來一起學習學習吧。
    2018-03-03
  • python scrapy簡單模擬登錄的代碼分析

    python scrapy簡單模擬登錄的代碼分析

    在本篇文章里小編給大家整理的是一篇關(guān)于python scrapy簡單模擬登錄的代碼分析,有興趣的朋友們可以學習參考下。
    2021-07-07
  • Jupyter?Notebook出現(xiàn)不是內(nèi)部或外部的命令解決方案

    Jupyter?Notebook出現(xiàn)不是內(nèi)部或外部的命令解決方案

    這篇文章主要介紹了Jupyter?Notebook出現(xiàn)不是內(nèi)部或外部的命令解決方案,具有很好的參考價值,希望對大家有所幫助。如有錯誤或未考慮完全的地方,望不吝賜教
    2023-06-06
  • Python中按值來獲取指定的鍵

    Python中按值來獲取指定的鍵

    今天小編就為大家分享一篇關(guān)于Python中按值來獲取指定的鍵,小編覺得內(nèi)容挺不錯的,現(xiàn)在分享給大家,具有很好的參考價值,需要的朋友一起跟隨小編來看看吧
    2019-03-03
  • Python減少循環(huán)層次和縮進的技巧分析

    Python減少循環(huán)層次和縮進的技巧分析

    這篇文章主要介紹了Python減少循環(huán)層次和縮進的技巧,結(jié)合實例形式較為詳細的分析了Python優(yōu)化代碼跳出循環(huán)以減少循環(huán)層次的技巧,具有一定參考借鑒價值,需要的朋友可以參考下
    2016-03-03

最新評論