Pandas 按时间间隔的滚动平均值
在这篇文章中,我们将研究如何使用Pandas在Python中按时间间隔计算一个数据框架的滚动平均值。
Pandas dataframe.rolling()是一个帮助我们在一个滚动窗口上进行计算的函数。换句话说,我们采取一个固定大小的窗口并对其进行一些数学计算。
语法: DataFrame.rolling(window, min_periods=None, center=False, win_type=None, on=None, axis=0)
参数 :
- window : 窗口的大小。这就是我们要为每个窗口的计算采取多少个观测值。
- min_periods :在一个窗口中需要有一个值的最小观察数(否则结果为NA)。
- center : 用来设置窗口中心的标签。
- win_type :它用于设置窗口类型。
- on:我们要计算滚动平均值的数据框架的日期列。
- axis:整数或字符串,默认为0
一步一步实现
第1步:导入库
第2步:导入数据
输出 :
我们将计算DataFrame中 “Close “列的滚动平均值。
第3步:计算滚动平均值。
输出:
MA30列的前29行将有一个NULL值,第一个非NULL值将在第30行。现在我们将计算滚动平均值,窗口为200。
输出 :
对于’MA200’来说,第一个非NULL将在第200行。现在让我们绘制’MA30’、’MA200’和’Close’,以获得更好的视觉效果
第4步:制图
输出: