python實(shí)現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫水平條形圖案例
1、數(shù)據(jù)分組-->頻數(shù)分布表
環(huán)境配置:
import pandas as pd import numpy as np import matplotlib.pyplot as plt
按照你設(shè)定合適的間隔,把數(shù)據(jù)分為各個(gè)范圍的組,然后統(tǒng)計(jì)出在這個(gè)范圍內(nèi)的頻數(shù)有多少,我沒(méi)有找到合適的函數(shù),我就自己寫了一個(gè)函數(shù),類似直方圖的工作,這是畫水平條形圖的數(shù)據(jù)準(zhǔn)備。至于為什么要畫水平條形圖,當(dāng)類別太多,使用水平條形圖比較簡(jiǎn)潔,個(gè)人看法。下面給出代碼,就不解釋代碼含義了。
def data_count(dataa, r1, r2, step): r = pd.DataFrame(np.random.randn(1, 2)) r.drop(0, inplace=True) while r1+step <= r2: num = 0 for j in range(len(dataa)): if dataa[j] >= r1 and dataa[j] < r1+step: num = num + 1 f = "%s~%d" % (r1, r1+step) # r = r.append([[int(r1), num], ]) # 使用單數(shù)表示 r = r.append([[f, num], ]) # 使用范圍表示 r1 = r1 + step return r
要注意的數(shù)據(jù)范圍只包含上界不含下界,數(shù)據(jù)公式這樣子1⩽data<5,只含上界,這樣就可以做出不重不漏。
2、頻數(shù)計(jì)算
這是運(yùn)用data_count函數(shù)(上面代碼)進(jìn)行頻數(shù)計(jì)算的演示,首先看一下原數(shù)據(jù)長(zhǎng)什么樣,暫時(shí)麻煩就不公布了,你們自己按照自己的數(shù)據(jù)決定。
測(cè)試data_count函數(shù)代碼:
data_gap1 = data_count(g11[:], 1, 51, 1)
data_gap2 = data_count(g22[:], 1, 51, 1)
很簡(jiǎn)單啦,就是函數(shù)的調(diào)用,你們都會(huì)的,給大家看一下輸出結(jié)果,如下圖:
輸出結(jié)果
感覺(jué)相當(dāng)完美,函數(shù)也很萬(wàn)能,只要輸入最小值最大值和間隔,就能出頻數(shù)分布表
3、水平條形圖
def plot_bar(plot_data, title): plt.figure(figsize=(10, 15)) y = plot_data.iloc[:, 1].values tt = list(range(len(y))) index = plot_data.iloc[:, 0].values plt.bar(left=0, bottom=list(range(len(y))), width=y, color='blue', height=0.5, orientation='horizontal') # 水平對(duì)應(yīng)bottom&width, height表示bar的寬度 plt.yticks(tt, index) plt.ylabel('數(shù)據(jù)范圍') plt.xlabel('頻數(shù)') plt.title(title) plt.show()
上面中plt.bar(left=0, bottom=list(range(len(y))), width=y, color='blue', height=0.5,orientation='horizontal')這句代碼是最重要的,其中l(wèi)eft表示直方圖的開(kāi)始的位置(也就是最左邊的地方),height是指直方圖的高度,當(dāng)直方圖太粗時(shí),可以通過(guò)width來(lái)定義直方圖的寬度,注意多個(gè)直方圖要用元組,yerr這個(gè)參數(shù)是防止直方圖觸頂。orientation='horizontal'指得水平條形圖,使用barh方法可以省略這個(gè)參數(shù)得設(shè)定。
有個(gè)坑,如果直接用bottom=類別數(shù)據(jù),文本格式的類別會(huì)亂序,需要像我那樣先指定位置,在指定類別,如plt.yticks(tt, index)所作的工作。
水平條形圖
補(bǔ)充知識(shí):在ipython notebook中添加latex公式
1 MathJax 的安裝
ipython notebook中數(shù)學(xué)公式的渲染使用MathJax。一般網(wǎng)絡(luò)較好的情況下,MathJax可以在線使用,但是如果希望離線使用,需要將其安裝到本地磁盤中,常用的方法是在ipython notebook中使用以下命令:
from IPython.external.mathjax import install_mathjax
install_mathjax()
2.生成配置文件
安裝完mathjax之后可以正常import latex,但是執(zhí)行Latex(r'S\sqrt{x^2+y^2}$')后顯示的是‘$\sqrt{x^2+y^2}$'這樣字符串;
原來(lái)還需要生成配置文件,方法是:在命令行中運(yùn)行 ipython profile create,執(zhí)行完成會(huì)在./ipython/profile_default 目錄下生成
一系列的配置文件,其中包括ipython_notebook_config.py文件;有地方看到需要修改該配置文件,取消 c.NotebookApp.enable_mathjax=True;
的注釋,大家可以試一下,我自己沒(méi)有取消這行注釋,再打開(kāi)ipnb文件時(shí)公式都能正常渲染,耶~
第一次記錄blog,一方面跟大家一起學(xué)習(xí),一方面方便以后回顧,畢竟記性差了許多,哈哈~
以上這篇python實(shí)現(xiàn)讀取類別頻數(shù)數(shù)據(jù)畫水平條形圖案例就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
Python如何實(shí)用File文件的實(shí)現(xiàn)
本文主要介紹了Python如何實(shí)用File文件的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2023-02-02Python 轉(zhuǎn)換時(shí)間戳為指定格式日期
這篇文章主要為大家介紹了Python轉(zhuǎn)換時(shí)間戳,具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下,希望能夠給你帶來(lái)幫助2021-12-12Python實(shí)現(xiàn)滑塊拼圖驗(yàn)證碼詳解
驗(yàn)證碼作為一種自然人的機(jī)器人的判別工具,被廣泛的用于各種防止程序做自動(dòng)化的場(chǎng)景中。傳統(tǒng)的字符型驗(yàn)證安全性已經(jīng)名存實(shí)亡的情況下,各種新型的驗(yàn)證碼如雨后春筍般涌現(xiàn),今天給大家分享一篇Python實(shí)現(xiàn)滑塊驗(yàn)證碼2022-05-05Python實(shí)現(xiàn)的簡(jiǎn)單發(fā)送郵件腳本分享
這篇文章主要介紹了Python實(shí)現(xiàn)的簡(jiǎn)單發(fā)送郵件腳本分享,本文使用smtplib模塊實(shí)現(xiàn)郵件的發(fā)送,需要的朋友可以參考下2014-11-11如何基于Python代碼實(shí)現(xiàn)高精度免費(fèi)OCR工具
這篇文章主要介紹了如何基于Python代碼實(shí)現(xiàn)高精度免費(fèi)OCR工具,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2020-06-06Python?Pyinstaller庫(kù)安裝步驟以及使用方法
pyinstaller是一個(gè)非常簡(jiǎn)單的打包python的py文件的庫(kù),下面這篇文章主要給大家介紹了關(guān)于Python?Pyinstaller庫(kù)安裝步驟以及使用方法的相關(guān)資料,文中通過(guò)圖文介紹的非常詳細(xì),需要的朋友可以參考下2022-08-08python自動(dòng)化測(cè)試selenium核心技術(shù)等待條件教程
這篇文章主要為大家介紹了python自動(dòng)化測(cè)試selenium核心技術(shù)等待條件教程的示例詳解,有需要的朋友可以借鑒參考下,希望能夠有所幫助2021-11-11