基于python cut和qcut的用法及區(qū)別詳解
我就廢話不多說(shuō)了,直接上代碼吧:
from pandas import Series,DataFrame import pandas as pd import numpy as np from numpy import nan as NA from matplotlib import pyplot as plt ages = [20,22,25,27,21,23,37,31,61,45,41,32] #將所有的ages進(jìn)行分組 bins = [18,25,35,60,100] #使用pandas中的cut對(duì)年齡數(shù)據(jù)進(jìn)行分組 cats = pd.cut(ages,bins) #print(cats) #調(diào)用pd.value_counts方法統(tǒng)計(jì)每個(gè)區(qū)間的個(gè)數(shù) number=pd.value_counts(cats) #print(pd.value_counts(cats)) #顯示第幾個(gè)區(qū)間index值 index=pd.cut(ages,bins).codes #print(index) #為分類出來(lái)的每一組年齡加上標(biāo)簽 group_names = ["Youth","YouthAdult","MiddleAged","Senior"] personType=pd.cut(ages,bins,labels=group_names) #print(personType) plt.hist(personType) #plt.show() #cut和qcut的用法 data=[1,2,3,4,5,6,7,8,9,10] result=pd.qcut(data,4) print(' ',result)##qcut會(huì)將10個(gè)數(shù)據(jù)進(jìn)行排序,然后再將data數(shù)據(jù)均分成四組 #統(tǒng)計(jì)落在每個(gè)區(qū)間的元素個(gè)數(shù) print('dasdasdasdasdas: ',pd.value_counts(result)) #qcut : 跟cut一樣也可以自定義分位數(shù)(0到1之間的數(shù)值,包括端點(diǎn)) results=pd.qcut(data,[0,0.1,0.5,0.9,1]) print('results: ',results)
import numpy as np import pandas as pd data = np.random.rand(20) print(data) #用cut函數(shù)將一組數(shù)據(jù)分割成n份 #cut函數(shù)分割的方式:數(shù)據(jù)里的(最大值-最小值)/n=每個(gè)區(qū)間的間距 #利用數(shù)據(jù)中最大值和最小值的差除以分組數(shù)作為每一組數(shù)據(jù)的區(qū)間范圍的差值 result = pd.cut(data,4,precision=2) #precision保留小數(shù)點(diǎn)的有效位數(shù) print(result) res_data=pd.value_counts(result) print(res_data)
以上這篇基于python cut和qcut的用法及區(qū)別詳解就是小編分享給大家的全部?jī)?nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
python aiohttp創(chuàng)建很多線程的問(wèn)題及解決
這篇文章主要介紹了python aiohttp創(chuàng)建很多線程的問(wèn)題及解決,具有很好的參考價(jià)值,希望對(duì)大家有所幫助,如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2024-06-06python區(qū)塊及區(qū)塊鏈的開(kāi)發(fā)詳解
這篇文章主要介紹了python區(qū)塊及區(qū)塊鏈的開(kāi)發(fā)詳解的相關(guān)資料,文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友可以參考下2019-07-07Python2和3字符編碼的區(qū)別知識(shí)點(diǎn)整理
在本篇文章中小編給各位分享的是關(guān)于Python2和3字符編碼的區(qū)別知識(shí)點(diǎn),有需要的朋友們可以學(xué)習(xí)下。2019-08-08PyQt5中QSpinBox計(jì)數(shù)器的實(shí)現(xiàn)
這篇文章主要介紹了PyQt5中QSpinBox計(jì)數(shù)器的實(shí)現(xiàn),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2021-01-01把django中admin后臺(tái)界面的英文修改為中文顯示的方法
今天小編就為大家分享一篇把django中admin后臺(tái)界面的英文修改為中文顯示的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2019-07-07tkinter如何實(shí)現(xiàn)打開(kāi)文件對(duì)話框并獲取文件絕對(duì)路徑
這篇文章主要介紹了tkinter實(shí)現(xiàn)打開(kāi)文件對(duì)話框并獲取文件絕對(duì)路徑問(wèn)題,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教2023-01-01盤點(diǎn)十個(gè)超級(jí)好用的高級(jí)Python腳本
這篇文章主要介紹了盤點(diǎn)十個(gè)超級(jí)好用的高級(jí)Python腳本,我們經(jīng)常會(huì)遇到一些大小問(wèn)題,其中有很多的問(wèn)題,都是可以使用一些簡(jiǎn)單的Python代碼就能解決,需要的朋友可以參考下2023-04-04matplotlib畫(huà)混淆矩陣與正確率曲線的實(shí)例代碼
混淆矩陣也稱誤差矩陣,是表示精度評(píng)價(jià)的一種標(biāo)準(zhǔn)格式,下面這篇文章主要給大家介紹了關(guān)于matplotlib畫(huà)混淆矩陣與正確率曲線的相關(guān)資料,需要的朋友可以參考下2021-06-06使用sklearn進(jìn)行對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化、歸一化以及將數(shù)據(jù)還原的方法
今天小編就為大家分享一篇使用sklearn進(jìn)行對(duì)數(shù)據(jù)標(biāo)準(zhǔn)化、歸一化以及將數(shù)據(jù)還原的方法,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2018-07-07