使用Python中的Matplotlib进行活跃产品销售分析
Python中的Matplotlib具有各种功能,如read_csv、sort_values、group_by等,可以执行销售数据分析。所有涉及任何类型产品销售的在线业务都使用产品销售数据分析来增加销售并更好地了解客户。参与任何类型电子商务业务的公司都使用其销售和客户数据来确定可以用于提高销售和收入的趋势、模式和见解。销售数据可用于确定哪个产品具有最高牵引力,哪个节日季节需求最大以及许多其他趋势,这些趋势可以帮助增加销售。
Python是一种用于数据分析和可视化的流行编程语言。Python提供了许多可用于有效进行产品销售分析的库和工具。在本文中,我们将使用Matplotlib,在Python中是一种流行的数据可视化库,进行活跃产品销售分析。
我们将使用numpy、pandas和matplotlib的样本销售数据进行活跃产品销售分析。可以在这里找到样本销售数据。
分步销售数据分析
数据读取和处理
用于分析的此示例数据具有以下列 −
Order_Number | Product_type | Quantity | Price_Each | Order_Date | Address |
---|---|---|---|---|---|
- Order Number − 每个放置的订单的唯一编号。
-
Product_Type − 产品类别
-
Quantity − 订购的产品数量
-
Price Each − 单价
-
Order Date − 下订单的日期和时间
-
Address − 产品交付的地址。
我们将不得不导入可以用于读取和处理样本销售数据的pandas和numpy。以下是读取数据的代码−
可以在Kaggle平台上找到样本销售数据这里。
示例
import pandas as pd
import numpy as np
import io
from google.colab import files
uploaded = files.upload()
# read csv data
Sales_data = pd.read_csv(io.BytesIO(uploaded['sample_sales_data.csv']), encoding='cp1252')
Sales_data.sort_values(by=['ORDER_NUMBER'])
输出
一旦我们读取了数据,我们必须对数据进行处理。订单日期列需要转换为DateTime对象,我们可以从订单日期中提取月份和年份,并为月份、年份和总销售额添加一个新列。数据清理和处理的代码如下所示−
示例
Sales_data['ORDER_DATE'] = pd.to_datetime(Sales_data['ORDER_DATE'])
Sales_data['MONTH'] = Sales_data['ORDER_DATE'].dt.month
Sales_data['YEAR'] = Sales_data['ORDER_DATE'].dt.year
Sales_data['TOTAL_SALES'] = Sales_data['QUANTITY'] * Sales_data['PRICE_EACH']
Sales_data.sort_values(by=['ORDER_NUMBER'])
输出
新的列month、year和toatal_sales将帮助我们分析随时间的销售趋势。现在,我们可以使用这些列在Python的Matplotlib库中绘制不同的绘图,以从样本销售数据中获取一些见解。
数据可视化
到目前为止,我们已经读取和处理了数据,以便在Python的Matplotlib库中使用它来绘制不同的绘图。Matplotlib提供了线条、条形图和散点图来可视化数据。
时间总销售额的可视化
为了可视化总销售额随时间的变化,我们可以使用matplotlib画折线图。进行此操作需要:
- 按年月对数据进行分组。
-
使用matplotlib创建一张线状图。
-
设置标题和轴标签。
-
显示图表。
示例
import matplotlib.pyplot as plt
# 按年月分组数据
sales_by_month = Sales_data.groupby(['YEAR', 'MONTH']).sum()['TOTAL_SALES'].reset_index()
# 创建一张折线图
plt.plot(sales_by_month.index, sales_by_month.values)
# 设置标题和轴标签
plt.title('Total Sales by Month')
plt.xlabel('Month')
plt.ylabel('Sales ($)')
# 显示图表
plt.show()
输出
年度营业额随时间的可视化
我们可以为每一年可视化年度营业额,并查看现在哪一年的营业额最高,哪一年的营业额最低。进行此操作需要:
- 按年对销售数据进行分组。
-
使用Seaborn创建一个柱状图,它在底层使用matplotlib。
-
设置标题和轴标签。
-
显示图表。
示例
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
# 年度营业额
plt.figure(figsize=(10,6))
yearly_revenue = Sales_data.groupby(['YEAR'])['TOTAL_SALES'].sum().reset_index()
sns.barplot(x="YEAR", y="TOTAL_SALES", data=yearly_revenue)
plt.title('Annual Revenue', fontsize = 20)
plt.xlabel('Year', fontsize = 16)
plt.ylabel('Revenue', fontsize = 16)
plt.show()
输出
结论
我们可以使用Python中的matplotlib对任何类型的产品销售数据进行分析和可视化,并获得可提高销售的标准数据见解。在上面的文章中,我们利用Python中的matplotlib、pandas和numpy,分析了随时间变化的总销售额和年度营业额。