關(guān)于數(shù)據(jù)分析之滾動(dòng)窗口pandas.DataFrame.rolling方法
本文使用pandas 1.3.5 , python 3, numpy 1.22.0庫(kù)
前言
pandas.DataFrame.rolling方法就是SQL中的 group by方法
唯一一點(diǎn)區(qū)別就是rolling方法的分組不是一成不變的
而是隨著窗口的移動(dòng)而不停更新新的分組
rolling使用公式
pandas.DataFrame.rolling(window = ).聚合函數(shù)
【注:rolling方法是向前取數(shù)據(jù)!?。 ?/strong>
聚合函數(shù)總結(jié)如下:
max
最大值min
最小值mean
平均值median
中位數(shù)sum
求和var
方差std
標(biāo)準(zhǔn)差skew
三階矩(又叫偏度,用于描述一組數(shù)據(jù)分布的對(duì)稱性)kurt
四截距 (又叫峰度, 用于描述一組數(shù)據(jù)在均值附近分布的集中度)cov
協(xié)方差corr
相關(guān)系數(shù)(對(duì)不同單位敏感性強(qiáng);通常使用pearson相關(guān)系數(shù),該系數(shù)對(duì)不同單位脫敏)quantile
百分?jǐn)?shù)
【注:scipy.stats的skew和kurtosis方法和 pandas中的skew和kurt方法計(jì)算算法不同】
python實(shí)現(xiàn)
比如,我想分別以2和4為滑動(dòng)窗口,計(jì)算dataFrame格式數(shù)據(jù)“C”列的和,并分別以“D”和 “E”命名
代碼如下,
import pandas as pd import numpy as np np.random.seed(0) date_DataFrame1 = pd.DataFrame(np.random.randn(10,3), index = pd.date_range("2020-05-01", periods = 10), columns = ["A","B","C"]) date_DataFrame1["D"] = date_DataFrame1["C"].rolling(window = 2).sum() date_DataFrame1["E"] = date_DataFrame1["C"].rolling(window = 4).sum()
結(jié)果如下,
總結(jié)
以上為個(gè)人經(jīng)驗(yàn),希望能給大家一個(gè)參考,也希望大家多多支持腳本之家。
相關(guān)文章
使用 Python 實(shí)現(xiàn)微信群友統(tǒng)計(jì)器的思路詳解
這篇文章主要介紹了使用 Python 實(shí)現(xiàn)微信群友統(tǒng)計(jì)器的思路詳解,需要的朋友可以參考下2018-09-09Python處理excel根據(jù)全稱自動(dòng)填寫簡(jiǎn)稱
這篇文章主要為大家詳細(xì)介紹了Python處理excel根據(jù)全稱自動(dòng)填寫簡(jiǎn)稱,文中示例代碼介紹的非常詳細(xì),具有一定的參考價(jià)值,感興趣的小伙伴們可以參考一下2021-03-03pytorch中圖像的數(shù)據(jù)格式實(shí)例
今天小編就為大家分享一篇pytorch中圖像的數(shù)據(jù)格式實(shí)例,具有很好的參考價(jià)值,希望對(duì)大家有所幫助。一起跟隨小編過(guò)來(lái)看看吧2020-02-02Python中字典和JSON互轉(zhuǎn)操作實(shí)例
這篇文章主要介紹了Python中字典和JSON互轉(zhuǎn)操作實(shí)例,本文給出了Dict轉(zhuǎn)JSON、讀取JSON并轉(zhuǎn)為Dict示例,需要的朋友可以參考下2015-01-01matplotlib繪制雷達(dá)圖的基本配置(萬(wàn)能模板案例)
本文主要介紹了matplotlib繪制雷達(dá)圖的基本配置(萬(wàn)能模板案例),文中通過(guò)示例代碼介紹的非常詳細(xì),對(duì)大家的學(xué)習(xí)或者工作具有一定的參考學(xué)習(xí)價(jià)值,需要的朋友們下面隨著小編來(lái)一起學(xué)習(xí)學(xué)習(xí)吧2022-04-04