Python箱型圖處理離群點(diǎn)的例子
首先我們簡單地區(qū)分一下離群點(diǎn)(outlier)以及異常值(anomaly):
離群點(diǎn):
異常值:
個人覺著異常值和離群點(diǎn)是兩個不同的概念,當(dāng)然大家在數(shù)據(jù)預(yù)處理時對于這兩個概念不做細(xì)致的區(qū)分,不如:姚明站在我們中間的時候,我覺著我們只能說他是一個離群點(diǎn),我們能說他異常嗎?異常的假設(shè)是姚明得了巨人癥,可是他不是。
箱型圖
代碼塊
餐飲銷售數(shù)據(jù)離群點(diǎn)檢測代碼:
#-*- coding: utf-8 -*- import pandas as pd catering_sale = '../data/catering_sale.xls' #餐飲數(shù)據(jù) data = pd.read_excel(catering_sale, index_col = u'日期') #讀取數(shù)據(jù),指定“日期”列為索引列 import matplotlib.pyplot as plt #導(dǎo)入圖像庫 plt.rcParams['font.sans-serif'] = ['SimHei'] #用來正常顯示中文標(biāo)簽 plt.rcParams['axes.unicode_minus'] = False #用來正常顯示負(fù)號 plt.figure() #建立圖像 p = data.boxplot(return_type='dict') #畫箱線圖,直接使用DataFrame的方法 x = p['fliers'][0].get_xdata() # 'fliers'即為離群點(diǎn)的標(biāo)簽 y = p['fliers'][0].get_ydata() y.sort() #從小到大排序,該方法直接改變原對象 #用annotate添加注釋 #其中有些相近的點(diǎn),注解會出現(xiàn)重疊,難以看清,需要一些技巧來控制。 #以下參數(shù)都是經(jīng)過調(diào)試的,需要具體問題具體調(diào)試。 for i in range(len(x)): if i > 0: plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.05 -0.8/(y[i]-y[i-1]),y[i])) else: plt.annotate(y[i], xy = (x[i],y[i]), xytext=(x[i]+0.08,y[i])) plt.show() #展示箱線圖
運(yùn)行結(jié)果:
以上這篇Python箱型圖處理離群點(diǎn)的例子就是小編分享給大家的全部內(nèi)容了,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關(guān)文章
python中關(guān)于數(shù)據(jù)類型的學(xué)習(xí)筆記
在本篇文章里小編給大家整理了關(guān)于python中關(guān)于數(shù)據(jù)類型的學(xué)習(xí)筆記內(nèi)容,需要的朋友們可以參考下。2020-07-07Python進(jìn)階篇之正則表達(dá)式常用語法總結(jié)
正則表達(dá)式是一個特殊的字符序列,它能幫助你方便的檢查一個字符串是否與某種模式匹配。本文為大家總結(jié)了一些正則表達(dá)式常用語法,希望有所幫助2022-08-08借助Paramiko通過Python實(shí)現(xiàn)linux遠(yuǎn)程登陸及sftp的操作
這篇文章主要介紹了借助Paramiko通過Python實(shí)現(xiàn)linux遠(yuǎn)程登陸及sftp,本文通過實(shí)例代碼給大家介紹的非常詳細(xì),對大家的學(xué)習(xí)或工作具有一定的參考借鑒價值,需要的朋友可以參考下2020-03-03TensorFlow dataset.shuffle、batch、repeat的使用詳解
今天小編就為大家分享一篇TensorFlow dataset.shuffle、batch、repeat的使用詳解,具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2020-01-01Python利用前序和中序遍歷結(jié)果重建二叉樹的方法
這篇文章主要介紹了Python利用前序和中序遍歷結(jié)果重建二叉樹的方法,實(shí)例分析了Python二叉樹的定義與遍歷操作技巧,需要的朋友可以參考下2016-04-04解決Pycharm 包已經(jīng)下載,但是運(yùn)行代碼提示找不到模塊的問題
今天小編就為大家分享一篇解決Pycharm 包已經(jīng)下載,但是運(yùn)行代碼提示找不到模塊的問題。具有很好的參考價值,希望對大家有所幫助。一起跟隨小編過來看看吧2019-08-08Python 利用高德地圖api實(shí)現(xiàn)經(jīng)緯度與地址的批量轉(zhuǎn)換
這篇文章主要介紹了Python 利用高德地圖api實(shí)現(xiàn)經(jīng)緯度與地址的批量轉(zhuǎn)換,文中通過示例代碼介紹的非常詳細(xì),對大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧2019-08-08