如何在Pandas中计算滚动中位数
在这篇文章中,我们将看到如何在pandas中计算滚动中位数。
滚动指标通常在时间序列数据中计算。它通过对最后 “n “次出现的数值进行汇总来表示数值是如何变化的。n “被称为窗口大小。聚合值通常是平均值或简单平均值。然而,我们也可以使用中位数聚合来进行某些类型的分析。
在我们行动之前,让我们用pip安装Pandas的库:
pandas.core.window.rolling.Rolling.median()函数计算了滚动中值。对象pandas.core.window.rolling.Rolling是通过对数据帧或序列应用rolling()方法得到的。
示例 1:
在这个例子中,我们将使用pandas.core.window.rolling.Rolling.median()函数来计算给定数据帧的滚动中值。我们已经计算了窗口大小为1、2、3和4的滚动中值。我们将所有这些不同的窗口输出合并到原始数据框中,以便我们可以对它们进行比较。我们可以在输出中观察到,对于窗口大小为’n’的记录,我们将前n-1列作为NaN值。对于第5条记录,将考虑记录2-5的中值。同样,对于第10条记录,将考虑7-10之间的记录的中值。这个窗口大小可以在rolling()方法的窗口参数中定义。
输出:
示例 2:
在这个例子中,我们采取了塔塔汽车过去3周的股票价格。计算滚动中位数的窗口大小为7,也就是一周的时间范围。因此,w7_roll_median列中的每个值都代表一周的股价中值。由于窗口大小是7,如前所述,最初的6条记录是NaN。
输出: