關于數(shù)據(jù)分析之滾動窗口pandas.DataFrame.rolling方法
本文使用pandas 1.3.5 , python 3, numpy 1.22.0庫
前言
pandas.DataFrame.rolling方法就是SQL中的 group by方法
唯一一點區(qū)別就是rolling方法的分組不是一成不變的
而是隨著窗口的移動而不停更新新的分組
rolling使用公式
pandas.DataFrame.rolling(window = ).聚合函數(shù)
【注:rolling方法是向前取數(shù)據(jù)?。?!】
聚合函數(shù)總結如下:
max
最大值min
最小值mean
平均值median
中位數(shù)sum
求和var
方差std
標準差skew
三階矩(又叫偏度,用于描述一組數(shù)據(jù)分布的對稱性)kurt
四截距 (又叫峰度, 用于描述一組數(shù)據(jù)在均值附近分布的集中度)cov
協(xié)方差corr
相關系數(shù)(對不同單位敏感性強;通常使用pearson相關系數(shù),該系數(shù)對不同單位脫敏)quantile
百分數(shù)
【注:scipy.stats的skew和kurtosis方法和 pandas中的skew和kurt方法計算算法不同】
python實現(xiàn)
比如,我想分別以2和4為滑動窗口,計算dataFrame格式數(shù)據(jù)“C”列的和,并分別以“D”和 “E”命名
代碼如下,
import pandas as pd import numpy as np np.random.seed(0) date_DataFrame1 = pd.DataFrame(np.random.randn(10,3), index = pd.date_range("2020-05-01", periods = 10), columns = ["A","B","C"]) date_DataFrame1["D"] = date_DataFrame1["C"].rolling(window = 2).sum() date_DataFrame1["E"] = date_DataFrame1["C"].rolling(window = 4).sum()
結果如下,
總結
以上為個人經(jīng)驗,希望能給大家一個參考,也希望大家多多支持腳本之家。
相關文章
使用 Python 實現(xiàn)微信群友統(tǒng)計器的思路詳解
這篇文章主要介紹了使用 Python 實現(xiàn)微信群友統(tǒng)計器的思路詳解,需要的朋友可以參考下2018-09-09