Python?boxplot?用法詳解
詳解:
箱型圖提供了識(shí)別異常值的一個(gè)標(biāo)準(zhǔn):
異常值通常被定義為小于QL-1.5IQR或大于QU+1.5IQR的值。
QL稱為下四分位數(shù),表示全部觀察值中有四分之一的數(shù)據(jù)取值比它??;
QU稱為上四分位數(shù),表示全部觀察值中有四分之一的數(shù)據(jù)取值比它大;
IQR稱為四分位數(shù)間距,是上四分位數(shù)QU與下四分位數(shù)QL之差,其間包含了全部觀察值的一半。
最小值 (minimum);
下四分位數(shù) (first quartile, Q1);
中值或中位數(shù) (median), 或第二個(gè)四分位數(shù) (second quartile, Q2);
上四分位數(shù) (third quartile, Q3);
最大值 (maximum)。
四分位間距 (interquartile range, IQR), 表示下四分位數(shù)Q1和上四分位數(shù)Q3的間距;
離群值 (outliers),表示小于minimum的值和大于maximum的值。
箱型圖依據(jù)實(shí)際數(shù)據(jù)繪制,沒有對(duì)數(shù)據(jù)作任何限制性要求(如服從某種特定的分布形式),它只是真實(shí)直觀地表現(xiàn)數(shù)據(jù)分布的本來面貌;
另一方面,箱型圖判斷異常值的標(biāo)準(zhǔn)以四分位數(shù)和四分位距為基礎(chǔ),四分位數(shù)具有一定的魯棒性:多達(dá)25%的數(shù)據(jù)可以變得任意遠(yuǎn)而不會(huì)很大地?cái)_動(dòng)四分位數(shù),所以異常值不能對(duì)這個(gè)標(biāo)準(zhǔn)施加影響。
由此可見,箱型圖識(shí)別異常值的結(jié)果比較客觀,在識(shí)別異常值方面有一定的優(yōu)越性
boxplot(x, notch=None, sym=None, whis=None, positions=None, widths=None, patch_artist=None, bootstrap=None, usermedians=None, conf_intervals=None, meanline=None, showmeans=None, showcaps=None, showbox=None, showfliers=None, boxprops=None, labels=None, flierprops=None, medianpropos=None, meanprops=None, capprops=None, whiskerpropos=None, manage_ticks=True, autorange=False, zorder=None, *, data=None)
x:繪制箱型圖的數(shù)據(jù)。
·sym:表示異常值對(duì)應(yīng)的符號(hào),默認(rèn)為空心圓圈。
·vert:表示是否將箱形圖垂直擺放,默認(rèn)為垂直擺放。
·whis:表示箱形圖上下須與上下四分位的距離,默認(rèn)為1.5倍的四分位差。
·positions:表示箱體的位置。
·widths:表示箱體的寬度,默認(rèn)為0.5。
·patch_artist:表示是否填充箱體的顏色,默認(rèn)不填充。
·meanline:是否用橫跨箱體的線條標(biāo)出中位數(shù),默認(rèn)不使用。
·showcaps:表示是否顯示箱體頂部和底部的橫線,默認(rèn)顯示。
·showboxs:表示是否顯示箱形圖的箱體,默認(rèn)顯示。
·showfliers:表示是否顯示異常值,默認(rèn)顯示。
·labels:表示箱形圖的標(biāo)簽。
·boxpropos:表示控制箱體屬性的字典。
用法:
diamonds = pd.read_csv('./data/DiamondsPrices2022.csv') diamonds.boxplot(column=['price'], showmeans=True, return_type='axes', figsize=(8, 8)) plt.title("價(jià)格中的異常值", size=12) plt.show()
到此這篇關(guān)于Python boxplot 用法詳解的文章就介紹到這了,更多相關(guān)Python boxplot 用法內(nèi)容請(qǐng)搜索腳本之家以前的文章或繼續(xù)瀏覽下面的相關(guān)文章希望大家以后多多支持腳本之家!
相關(guān)文章
Jupyter notebook如何實(shí)現(xiàn)指定瀏覽器打開
這篇文章主要介紹了Jupyter notebook如何實(shí)現(xiàn)指定瀏覽器打開,文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-05-05Python之日期與時(shí)間處理模塊(date和datetime)
這篇文章主要介紹了Python之日期與時(shí)間處理模塊(date和datetime),小編覺得挺不錯(cuò)的,現(xiàn)在分享給大家,也給大家做個(gè)參考。一起跟隨小編過來看看吧2017-02-02Python XML轉(zhuǎn)Json之XML2Dict的使用方法
今天小編就為大家分享一篇Python XML轉(zhuǎn)Json之XML2Dict的使用方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-01-01pandas.DataFrame刪除/選取含有特定數(shù)值的行或列實(shí)例
今天小編就為大家分享一篇pandas.DataFrame刪除/選取含有特定數(shù)值的行或列實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2018-11-11Django admin實(shí)現(xiàn)TextField字段changelist頁面換行、空格正常顯示
本文主要介紹了Django admin實(shí)現(xiàn)TextField字段changelist頁面換行、空格正常顯示,文中通過示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2022-01-01PyQT5 QTableView顯示綁定數(shù)據(jù)的實(shí)例詳解
今天小編就為大家分享一篇PyQT5 QTableView顯示綁定數(shù)據(jù)的實(shí)例詳解,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧2019-06-06python3利用tcp實(shí)現(xiàn)文件夾遠(yuǎn)程傳輸
這篇文章主要為大家詳細(xì)介紹了python3利用tcp實(shí)現(xiàn)文件夾遠(yuǎn)程傳輸,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2018-07-07