使用Pandas查找给定Excel表格中的利润和损失
Pandas是一个广泛应用于数据科学家和分析师的Python流行数据处理和分析库,它提供了许多用于处理Excel表格中数据的功能。在分析财务数据时,查找给定Excel表格中的利润和损失是最常见的任务之一。
设置
要在Python中使用Python处理Excel文件,您需要安装 openpyxl 依赖项。为此,请打开终端并键入以下命令−
pip install openpyxl
成功安装后,您可以继续尝试Excel文件和电子表格。
**要下载下面练习中使用的Excel电子表格,请参考[ 此链接 ](https://docs.google.com/spreadsheets/d/1FJdeNE-jafjpDZfAGxqhcocToejvOg7W/edit?pli =1#gid=851799485) **
算法
要将数据从Excel文件中读取到Pandas DataFrame中,请使用内置于Pandas中的方法 read_excel() 。我们必须将整个成本从总收入中扣除,以计算得出利润和损失。以下是将Pandas用于计算利润和损失的算法的摘要−
- 使用 read_excel() 方法,将Excel表格读取到Pandas DataFrame中。
-
应在DataFrame中更新新的利润和损失列。
-
将总成本减去总收入,以确定每行的利润和损失。
-
在DataFrame中加总利润和损失列,以确定整体利润和损失。
示例1
以下代码读取名为 ‘sales.xlsx’ 的Excel表格并创建DataFrame。接着添加一个新列用于利润和损失并计算每行的利润和损失。
import pandas as pd
# 将Excel表格读取到pandas DataFrame中
df = pd.read_excel('sales.xlsx')
# 计算总成本
df['Total Cost'] = df['Units Purchased'] * df['Unit Cost']
# 计算总收入
df['Total Revenue'] = df['Units Sold'] * df['Unit Price']
# 计算利润/损失
df['Profit/Loss'] = df['Total Revenue'] - df['Total Cost']
# 打印结果数据帧
print(df)
# 将结果数据帧保存到新的Excel电子表格中
df.to_excel('sales_results.xlsx', index = False)
输出
Units Purchased Unit Cost Units Sold Unit Price Item Name Total Cost Total Revenue Profit/Loss
50 5.00 40 9.00 苹果 250.00 360.0 110.00
100 3.50 80 7.00 橙子 350.00 560.0 210.00
25 12.00 20 15.00 菠萝 300.00 300.0 0.00
75 1.75 60 3.50 香蕉 131.25 210.0 78.75
200 0.50 180 1.25 胡萝卜 100.00 225.0 125.00
450 2.00 120 4.50 土豆 900.00 540.0 -360.00
40 8.00 30 12.00 鳄梨 320.00 360.0 40.00
80 1.50 70 3.00 番茄 120.00 210.0 90.00
300 20.00 25 25.00 芒果 6000.00 625.0 -5375.00
60 4.00 45 8.00 葡萄 240.00 360.0 120.00
在本例中,我们首先导入Pandas库,然后使用 read_excel ()函数读取Excel工作表。我们然后在数据帧中创建新列以计算每个产品的总成本、总收入和利润/亏损。最后,我们打印包括新列和计算值的结果数据帧,并将其保存到新的Excel工作表以进行进一步处理。
示例2:使用过滤器计算利润和损失
import pandas as pd
# 将Excel工作表读取为Pandas数据帧
df = pd.read_excel('sales_results.xlsx')
# 过滤数据帧以仅包括利润产品
df_profit = df[df['Total Revenue'] > df['Total Cost']]
# 计算总利润
total_profit = df_profit['Total Revenue'].sum() - df_profit['Total Cost'].sum()
# 过滤数据帧以仅包括亏损产品
df_loss = df[df['Total Revenue'] < df['Total Cost']]
# 计算总亏损
total_loss = df_loss['Total Cost'].sum() - df_loss['Total Revenue'].sum()
# 打印总利润和总亏损
print(f"Total Profit: {total_profit}")
print(f"Total Loss: {total_loss}")
输出
Total Profit: 773.75
Total Loss: 5735.0
首先导入 Pandas 库,然后使用 read_excel() 函数读取来自上一个示例的保存的Excel工作表。我们然后 过滤 数据帧以仅包括具有利润的产品并计算总利润。同样,我们过滤数据帧以仅包括具有亏损的产品并计算总亏损。最后,我们使用打印()函数打印总利润和总亏损。
使用Pandas计算利润和损失的应用
- 金融数据分析 - 企业可以使用Pandas检查其财务信息,并确定各种货物和服务的利润和损失。
-
投资分析 - 使用Pandas,投资者可以检查公司的财务信息,以确定其是否具有利润。
-
商业预测 - 企业可以使用Pandas通过检查历史数据来预测未来收入和亏损。
结论
对于从Excel工作表分析和计算利润和损失,Pandas是一种强大的Python包。由于其简单的界面和强大的功能,Pandas对于任何数据分析师或金融专家都是重要的工具。开发人员可以使用Pandas分析其财务数据,并通过本文中提供的示例获取有关其业务成功的信息。