机器学习 为什么时间序列在分析前必须是静止的
时间序列分析是一种有效的方法,用于识别和预测随时间收集的数据的趋势。时间序列中的每个数据点都代表一个特定的时间点,而数据是随着时间的推移而收集的。时间序列数据的例子包括股票价格数据、天气信息和网站流量。在一些学科中,包括经济学、金融学和天气预报,经常采用时间序列数据。
利用统计方法来理解一段时间内的数据并对其进行预测的做法被称为时间序列分析。在数据中发现模式、趋势和联系的能力,可以用来预测未来的结果,这使得时间序列分析至关重要。
当一个时间序列被说成是静止的,这意味着它的统计特征在一段时间内保持稳定。如果数据的平均值、方差和自相关结构不随时间变化,那么一个时间序列就被认为是静止的。换句话说,一个静止的时间序列的统计行为将在不同时期保持一致。在这篇博客文章中,我们将更仔细地研究时间序列在分析前必须是静止的,以及它实际上意味着什么。
什么是时间序列的静止性以及如何测试它的静止性
如果一个时间序列中的数据的统计特征在整个时间过程中保持稳定,就可以说是静止的。如果一个时间序列的平均数、方差和自相关结构不随时间变化,则被视为静止的。换句话说,一个静止的时间序列在不同时期会有一个稳定的统计趋势。
在静止的时间序列的特征中,有以下几点
- 恒定的平均数,即一个时间序列的平均值在时间过程中保持不变。
-
恒定的方差表明数据的离散性在不同时期是一致的。
-
缺乏趋势或季节性,表示数据中没有上升或下降的趋势,也没有在设定的时间段内重新出现的可预测模式。
确定时间序列中静止性的最流行的技术如下 −
- 一个可以用来检查静止性的统计检验是Augmented Dickey-Fuller检验(ADF)。
-
一种叫做Kwatkowski-Phillips-Schmidt-Shin检验(KPSS)的统计检验可以用来检查静止性。
-
从视觉上检查时间序列图,并将其分解为其趋势、季节性和残差部分。
这些测试在时间序列分析中经常被采用,可以用来评估一个时间序列是否是静止的。关键是要记住,除了测试结果之外,还要考虑到独特的问题和领域的专业知识。
但是,为什么时间序列在分析前必须是静止的
许多时间序列分析技术都以静止性为前提,这也是为什么时间序列在分析前必须是稳定的关键原因之一。例如,广泛使用的用于预测的ARIMA(自回归整合移动平均数)模型,其假设是数据是静止的。如果数据是非平稳的,该模型将无法忠实地反映数据中的基本模式,其结论将是错误的。
非平稳性可能导致不正确或误导性的结果,这是分析前时间序列必须是平稳的另一个理由。举例来说,一个非平稳的时间序列可能给人一种印象,即两个变量之间存在着高度的联系,但实际上,这种关联只是因为数据中的趋势或季节性因素而存在。
如何使时间序列成为静止的
可以用各种方法使时间序列静止,包括
- 差分法– 这种方法包括通过将连续的观测值相互减去,将趋势成分从数据中取出。
-
时间序列的季节性分解(STL)– 这种方法将一个时间序列分为趋势、季节和残差部分。
-
对数转换– 这种方法可以用来减少趋势成分并稳定方差。
重要的是要记住,保持一个时间序列的静止也是一种权衡,因为趋势或季节性成分会导致一些信息丢失。使一个系列静止的做法应该谨慎,因为它可能会增加偏见并提供不正确的结论。
结论
总而言之,在分析之前,时间序列必须是稳定的,因为许多时间序列分析技术依赖于静止性,非静止性可能导致不正确或误导性的结果。通过使用差分、STL和对数转换等方法,有可能使时间序列保持稳定。独特的问题、提供的数据的数量和口径以及选择的方法都会影响结果。