Python Pandas dataframe.diff()
Python是一种进行数据分析的伟大语言,主要是因为以数据为中心的Python包的奇妙生态系统。Pandas就是这些包中的一个,它使导入和分析数据变得更加容易。
Pandas dataframe.diff()用于查找对象在给定axis上的第一个离散差值。我们可以提供一个周期值来转移,以形成差异。
语法: DataFrame.diff(periods=1, axis=0)
参数:
periods:形成差异的时期,要进行转移。
axis:在行(0)或列(1)上取差。
返回: diffed : DataFrame
例子#1:使用diff()函数来查找周期值等于1的索引axis上的离散差。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[5, 3, 6, 4],
"B":[11, 2, 4, 3],
"C":[4, 3, 8, 5],
"D":[5, 4, 2, 8]})
# Print the dataframe
df
现在找出在索引axis上的离散差。
# To find the discrete difference
df.diff(axis = 0, periods = 1)
输出 :
输出是一个数据框架,其中的单元格包含索引axis上的离散差值。每个单元格中的值是当前单元格的值与前一行对应单元格的差。注意,第一行是NaN填充。这是因为上面没有任何一行可以找到差值,所以它被当作NaN处理。
例子#2:使用diff()函数查找周期值等于1的列axis上的离散差。
# importing pandas as pd
import pandas as pd
# Creating the dataframe
df = pd.DataFrame({"A":[5, 3, 6, 4],
"B":[11, 2, 4, 3],
"C":[4, 3, 8, 5],
"D":[5, 4, 2, 8]})
# To find the discrete difference
df.diff(axis = 1, periods = 1)
输出 :
输出是一个数据框架,其中的单元格包含列axis上的离散差异。每个单元格中的值是当前单元格的值与前一列对应单元格的差。注意,第一列是NaN填充。这是因为在它的左边没有一列可以找到差值,所以它被当作NaN处理。