Python Pandas Series.diff()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas Series.diff()用于查找同一系列元素之间的差异。差异是有顺序的,取决于传递给diff()方法的周期参数。
语法: Series.diff(periods=1)
参数:
periods:整数值,从当前元素中减去前/后的元素周期。也接受负值
返回类型: Series
示例:
在这个例子中,从Python列表中创建了两个系列。对两个系列调用diff()方法,一次是正的周期,一次是传递给周期参数的负值。
# importing pandas module
import pandas as pd
# importing numpy module
import numpy as np
# creating list
list =[15, 2, 34, 12, 4, 0, 9, 7]
# creating series
series = pd.Series(list)
# calling method with period 2
period2 = series.diff(2)
# Passing Negative value to period
# passing period of -1
period_1 = series.diff(-1)
# display
print('Diff with period 2:\n{}\n\
Diff with period -1:\n{}'.format(period2, period_1))
输出:
Diff with period 2:
0 NaN
1 NaN
2 19.0
3 10.0
4 -30.0
5 -12.0
6 5.0
7 7.0
dtype: float64
Diff with period -1:
0 13.0
1 -32.0
2 22.0
3 8.0
4 4.0
5 -9.0
6 2.0
7 NaN
dtype: float64
解释: 在第一个周期为2的输出中,第i个位置的值从第(i+2)个位置减去,并存储在第(i+2)个位置。在第二个输出中,第i个位置的值被减去第(i-1)个位置的值并存储在第(i-1)个位置。
注意:输出系列中的第一个/最后一个数值是NaN,取决于周期的符号。(如果周期是正的,则第一个数值;如果是负的,则最后一个数值,其中n为周期)。