Python Pandas 窗口函数
对于数字数据的处理,Pandas提供了一些变体,如滚动、扩展和指数移动权重的窗口统计。其中包括 总和、平均数、中位数、方差、协方差、相关性 等。
现在我们将学习如何在DataFrame对象上应用这些功能。
.rolling()函数
这个函数可以应用于一系列的数据。指定 window=n 参数,并在其上应用适当的统计函数。
其 输出结果 如下 –
注意 - 由于窗口大小为3,前两个元素是空的,从第三个元素开始,数值将是 n 、 n-1 和 n-2 元素的平均值。因此,我们也可以应用上述的各种函数。
.expanding() 函数
这个函数可以应用于一系列的数据。指定 min_periods=n 参数,并在其上应用适当的统计函数。
其 输出结果 如下 –
.ewm()函数
ewm 应用于一系列的数据。指定com、span、 halflife 中的任何一个参数,并在其上应用适当的统计函数。它以指数方式分配权重。
其 输出结果 如下 –
窗口函数主要用于通过平滑曲线来寻找数据中的趋势。如果在日常数据中存在大量的变化,并且有大量的数据点可用,那么取样和绘图是一种方法,应用窗口计算并在结果上绘制图形是另一种方法。通过这些方法,我们可以平滑曲线或趋势。