Python Pandas 窗口函数
对于处理数值数据,Pandas提供了几种变体,如滚动、扩展和指数移动权重,用于窗口统计。其中包括 求和、均值、中位数、方差、协方差、相关系数 等等。
现在我们将学习如何在DataFrame对象上应用每一种函数。
.rolling() 函数
此函数可以应用于数据系列。指定 window=n 参数,并在其之上应用适当的统计函数。
它的 输出 如下:
注意 − 由于窗口大小为3,因此前两个元素为null,从第三个元素开始,值将为前 n , n-1 和 n-2 元素的平均值。因此,我们还可以应用上面提到的各种函数。
.expanding()函数
此函数可以应用于一系列数据。指定 min_periods=n 参数并在其上应用适当的统计函数。
它的 输出 如下−
ewm()函数
ewm 函数应用于一系列的数据。您可以通过指定com、span或 halflife 参数,并在其上应用适当的统计函数来赋予数据指数权重。
它的 输出 如下所示:
窗口函数主要用于通过平滑曲线来图形化地找出数据中的趋势。如果每天的数据有很大的变化并且有很多数据点可用,那么取样并绘制图表就是一种方法,应用窗口计算并绘制结果图表是另一种方法。通过这些方法,我们可以平滑曲线或趋势。