欧美bbbwbbbw肥妇,免费乱码人妻系列日韩,一级黄片

關(guān)于pandas的離散化,面元?jiǎng)澐衷斀?/h1>
 更新時(shí)間:2019年11月22日 09:40:31   作者:路在亻壬走  
今天小編就為大家分享一篇關(guān)于pandas的離散化,面元?jiǎng)澐衷斀?,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過來看看吧

pd.cut

pandas.cut(x, bins, right=True, labels=None, retbins=False, precision=3, include_lowest=False)

x:要分箱的輸入數(shù)組,必須是一維的

bins:int或標(biāo)量序列

若bins是一個(gè)int,它定義在x范圍內(nèi)的等寬單元的數(shù)量。然而,在這種情況下,x的范圍在每一側(cè)延伸0.1%以包括x的最小值或最大值

若bins是一個(gè)序列,它定義了允許非均勻bin寬度的bin邊緣。在這種情況下不進(jìn)行x的范圍的擴(kuò)展

right:bool,可選:決定區(qū)間的開閉,如果right == True(默認(rèn)),則區(qū)間[1,2,3,4]指示(1,2],(2,3],(3,4]

labels:array或boolean,默認(rèn)值為無:用作生成的區(qū)間的標(biāo)簽。必須與生成的區(qū)間的長度相同。如果為False,則只返回bin的整數(shù)指示符

retbins:bool,可選:是否返回bin。如果bin作為標(biāo)量給出,則可能有用

precision:int:存儲(chǔ)和顯示容器標(biāo)簽的精度,默認(rèn)保留三位小數(shù)

include_lowest:bool:第一個(gè)間隔是否應(yīng)該包含左邊

import numpy as np
import pandas as pd
# 使用pandas的cut函數(shù)劃分年齡組
ages = [20,22,25,27,21,23,37,31,61,45,32]
bins = [18,25,35,60,100]
cats = pd.cut(ages,bins)
print(cats) # 分類時(shí),當(dāng)數(shù)據(jù)不在區(qū)間中將變?yōu)閚an
# 統(tǒng)計(jì)落在各個(gè)區(qū)間的值數(shù)量
print(pd.value_counts(cats))
# 使用codes為年齡數(shù)據(jù)進(jìn)行標(biāo)號(hào)
print(cats.codes)
# 設(shè)置自己想要的面元名稱
group_names = ['Youth','YoungAdult','MiddleAged','Senior']
print(pd.cut(ages, bins, labels=group_names))
# 設(shè)置區(qū)間數(shù)學(xué)符號(hào)為左閉右開
print(pd.cut(ages, bins, right=False))
# 向cut傳入面元的數(shù)量,則會(huì)根據(jù)數(shù)據(jù)的最小值和最大值計(jì)算等長面元
print(pd.cut(ages, 4, precision=2)) # precision=2表示設(shè)置的精度

pd.qcut

與cut類似,它可以根據(jù)樣本分位數(shù)對(duì)數(shù)據(jù)進(jìn)行面元?jiǎng)澐?/p>

pandas.qcut(x, q, labels=None, retbins=False, precision=3) 

x:ndarray或Series

q:整數(shù)或分位數(shù)陣列分位數(shù)。十分位數(shù)為10,四分位數(shù)為4或者,分位數(shù)陣列,例如[0,.25,.5,.75,1.]四分位數(shù)

labels:array或boolean,默認(rèn)值為無:用作生成的區(qū)間的標(biāo)簽。必須與生成的區(qū)間的長度相同。如果為False,則只返回bin的整數(shù)指示符。

retbins:bool,可選:是否返回bin。如果bin作為標(biāo)量給出,則可能有用。

precision:int:存儲(chǔ)和顯示容器標(biāo)簽的精度

import numpy as np
import pandas as pd

# qcut可以根據(jù)樣本分位數(shù)對(duì)數(shù)據(jù)進(jìn)行面元?jiǎng)澐?
# data = np.random.randn(20) # 正態(tài)分布
data = [1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20]
cats = pd.qcut(data, 4) # 按四分位數(shù)進(jìn)行切割
print(cats)
print(pd.value_counts(cats))
print("-------------------------------------------------")
# 通過指定分位數(shù)(0到1之間的數(shù)值,包含端點(diǎn))進(jìn)行面元?jiǎng)澐?
cats_2 = pd.qcut(data, [0, 0.5, 0.8, 0.9, 1])
print(cats_2)
print(pd.value_counts(cats_2))

以上這篇關(guān)于pandas的離散化,面元?jiǎng)澐衷斀饩褪切【幏窒斫o大家的全部內(nèi)容了,希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。

相關(guān)文章

  • Python實(shí)現(xiàn)希爾排序,歸并排序和桶排序的示例代碼

    Python實(shí)現(xiàn)希爾排序,歸并排序和桶排序的示例代碼

    希爾、歸并、快速排序算法可歸為同一類,它們的共同點(diǎn)都是建立在分治思想之上。把大問題分拆成小問題,解決所有小問題后,再合并每一個(gè)小問題的結(jié)果,最終得到對(duì)原始問題的解答。本文將介紹這三種算法的實(shí)現(xiàn)代碼,需要的可以參考一下
    2022-04-04
  • Python爬蟲實(shí)現(xiàn)抓取京東店鋪信息及下載圖片功能示例

    Python爬蟲實(shí)現(xiàn)抓取京東店鋪信息及下載圖片功能示例

    這篇文章主要介紹了Python爬蟲實(shí)現(xiàn)抓取京東店鋪信息及下載圖片功能,涉及Python頁面請(qǐng)求、響應(yīng)、解析等相關(guān)操作技巧,需要的朋友可以參考下
    2018-08-08
  • Python實(shí)現(xiàn)石頭剪刀布游戲

    Python實(shí)現(xiàn)石頭剪刀布游戲

    這篇文章主要為大家詳細(xì)介紹了Python實(shí)現(xiàn)石頭剪刀布游戲,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下
    2021-01-01
  • Python實(shí)現(xiàn)決策樹C4.5算法的示例

    Python實(shí)現(xiàn)決策樹C4.5算法的示例

    本篇文章主要介紹了Python實(shí)現(xiàn)決策樹C4.5算法的示例,詳解的介紹了決策樹C4.5算法的原理和實(shí)現(xiàn)代碼,非常具有實(shí)用價(jià)值,需要的朋友可以參考下
    2018-05-05
  • python Django框架快速入門教程(后臺(tái)管理)

    python Django框架快速入門教程(后臺(tái)管理)

    Django 是一個(gè)開放源代碼的 Web 應(yīng)用框架,由 Python 寫成,今天通過本文給大家介紹python Django框架快速入門教程,適用后臺(tái)管理,感興趣的朋友跟隨小編一起看看吧
    2021-07-07
  • python中使用docx模塊處理word文檔

    python中使用docx模塊處理word文檔

    這篇文章主要介紹了python中使用docx模塊處理word文檔的相關(guān)資料,需要的朋友可以參考下
    2023-01-01
  • Python入門教程(十一)Python中的運(yùn)算符

    Python入門教程(十一)Python中的運(yùn)算符

    這篇文章主要介紹了Python入門教程(十一)Python中的運(yùn)算符,Python是一門非常強(qiáng)大好用的語言,也有著易上手的特性,本文為入門教程,需要的朋友可以參考下
    2023-04-04
  • python3.4爬蟲demo

    python3.4爬蟲demo

    今天小編就為大家分享一篇關(guān)于python3.4爬蟲demo,小編覺得內(nèi)容挺不錯(cuò)的,現(xiàn)在分享給大家,具有很好的參考價(jià)值,需要的朋友一起跟隨小編來看看吧
    2019-01-01
  • 詳解Python GUI編程之PyQt5入門到實(shí)戰(zhàn)

    詳解Python GUI編程之PyQt5入門到實(shí)戰(zhàn)

    這篇文章主要介紹了詳解Python GUI編程之PyQt5入門到實(shí)戰(zhàn),文中通過示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來一起學(xué)習(xí)學(xué)習(xí)吧
    2020-12-12
  • pandas的排序、分組groupby及cumsum累計(jì)求和方式

    pandas的排序、分組groupby及cumsum累計(jì)求和方式

    這篇文章主要介紹了pandas的排序、分組groupby及cumsum累計(jì)求和方式,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。如有錯(cuò)誤或未考慮完全的地方,望不吝賜教
    2022-05-05

最新評(píng)論