如何在Pandas中查找两行之间的差异

如何在Pandas中查找两行之间的差异

在这篇文章中,我们将看到如何在Pandas中找到两行之间的差异。

Pandas DataFrame是一个带有标记轴的表格形式的二维数据结构。在数据分析过程中,人们可能需要计算两行之间的差异来进行比较。这可以通过pandas.DataFrame.diff()函数来完成。这个函数计算了两个连续的DataFrame元素之间的差异。

语法: pandas.DataFrame.diff(periods=1, axis=0)

参数:

  • periods:代表为计算差异而转移的时期,整数类型的值。默认值为1
  • axis: 代表在行或列上采取的差异。可以取两个值{0:行,1:列}。默认值为0

返回: 返回数据框架

例子1:为了测试这个函数,我们创建了一个有3列6行的假数据框架。现在,这个diff函数将找到每一行与前一行的差值,因为周期默认为1。

# Importing Pandas Library
import pandas as pd 
  
# Creating dummy DataFrame for testing
df = pd.DataFrame({ 'a': [1, 2, 3, 4, 5, 6],
                    'b': [8, 18, 27, 20, 33, 49],
                    'c': [2, 24, 6, 16, 20, 52]})
# Printing DataFrame before applying diff function
print(df)
  
# Printing DataFrame after applying diff function
print("Difference: ")
print(df.diff())

输出:

   a   b   c
0  1   8   2
1  2  18  24
2  3  27   6
3  4  20  16
4  5  33  20
5  6  49  52
Difference: 
     a     b     c
0  NaN   NaN   NaN
1  1.0  10.0  22.0
2  1.0   9.0 -18.0
3  1.0  -7.0  10.0
4  1.0  13.0   4.0
5  1.0  16.0  32.0

示例 2:

# Importing Pandas Library
import pandas as pd 
  
# Creating dummy DataFrame for testing
df = pd.DataFrame({ 'a': [1, 2, 3, 4, 5, 6],
                    'b': [8, 18, 27, 20, 33, 49],
                    'c': [2, 24, 6, 16, 20, 52]})
# Printing DataFrame before applying diff function
print(df)
  
# Printing DataFrame after applying diff function
print("Difference: ")
print(df.diff(periods=2))

输出:

   a   b   c
0  1   8   2
1  2  18  24
2  3  27   6
3  4  20  16
4  5  33  20
5  6  49  52
Difference: 
     a     b     c
0  NaN   NaN   NaN
1  NaN   NaN   NaN
2  2.0  19.0   4.0
3  2.0   2.0  -8.0
4  2.0   6.0  14.0
5  2.0  29.0  36.0

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程