Pandas 将一列除以另一列

Pandas 将一列除以另一列

在本文中,我们将探讨Pandas(Python数据分析库)中如何通过一列除以另一列,以及此操作的用途和示例。

在Pandas中,我们可以使用两列中的值进行运算,并将结果存储在一个新的列中。

阅读更多:Pandas 教程

创建数据框

为了演示如何将一个列除以另一个列,让我们首先创建一个简单的数据框:

import pandas as pd

data = {'A': [10, 20, 30, 40],
        'B': [5, 10, 15, 20]}

df = pd.DataFrame(data)
Python

这将创建以下数据框:

A B
0 10 5
1 20 10
2 30 15
3 40 20

列的除法

现在,我们可以使用Pandas中的div()方法通过A列除以B列,并将结果存储在一个新的列C中:

df['C'] = df['A'].div(df['B'])

print(df)
Python

这将输出以下数据框,其中列C是新创建的列:

A B C
0 10 5 2
1 20 10 2
2 30 15 2
3 40 20 2

如您所见,我们使用了div()方法,将A列除以B列,并将结果存储在新的C列中。

我们还可以使用其他操作符,例如乘法(*)、加法(+)和减法(-),对数据框进行类似的数学计算。

示例:计算销售额的增长率

让我们考虑一个示例,其中我们有一个包含每月销售额的数据框,我们想要计算每个月的增长率。

import pandas as pd

data = {'Month': ['Jan', 'Feb', 'Mar', 'Apr', 'May', 'Jun', 'Jul', 'Aug'],
        'Sales': [10000, 12000, 15000, 18000, 22000, 25000, 28000, 30000]}

df = pd.DataFrame(data)
Python

这将创建以下数据框:

Month Sales
0 Jan 10000
1 Feb 12000
2 Mar 15000
3 Apr 18000
4 May 22000
5 Jun 25000
6 Jul 28000
7 Aug 30000

现在,我们可以计算每个月的增长率,如下所示:

df['Growth Rate'] = df['Sales'].pct_change(periods=1)

print(df)
Python

这将输出以下数据框,其中列“增长率”是新创建的列:

Month Sales Growth Rate
0 Jan 10000 NaN
1 Feb 12000 0.200000
2 Mar 15000 0.250000
3 Apr 18000 0.200000
4 May 22000 0.222222
5 Jun 25000 0.136364
6 Jul 28000 0.12
7 Aug 30000 0.071429

我们使用了pct_change()方法,该方法可以计算每个时间点的值与其先前值之间的变化百分比。

我们还可以将periods参数设置为一个整数,以指定要计算的时间段。在这个例子中,我们将期间设置为1,以计算每个月的销售增长率。

总结

在Pandas中,我们可以通过一列除以另一列来执行数学运算,并将结果存储在一个新的列中。这对于计算增长率或比率等指标非常有用。

在本文中,我们介绍了如何通过使用div()方法和pct_change()方法来执行此操作,并给出了相应的示例。希望这篇文章能够帮助您在Pandas中执行高效的数据分析操作。

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程

登录

注册