Matplotlib 如何将Pandas dataframe / series数据保存为图形
Matplotlib是Python中最常用的绘图库之一。它常常用于绘制各种统计图表等数据可视化。在分析和可视化数据时,我们通常使用Pandas进行数据操作,而Matplotlib则用来绘制图形展示数据的结果。本篇文章主要介绍如何使用Matplotlib将Pandas dataframe / series数据保存为图形。
阅读更多:Matplotlib 教程
Pandas dataframe / series数据
在开始讨论如何将Pandas dataframe / series数据保存为图形之前,我们需要先了解这两种数据结构。
Pandas dataframe
Pandas dataframe是Pandas库中最为重要的数据结构之一。它可以看做是Excel中的一张数据表,由多行和多列组成。每列代表一个特定的变量,每行代表一个数据点。这些变量可以是字符串、整数、浮点型或其他Python数据类型。示例代码如下:
import pandas as pd
data = {'name': ['Tom', 'Jerry', 'Mike', 'Ali', 'John'],
'age': [23, 12, 31, 45, 27],
'gender': ['Male', 'Male', 'Female', 'Male', 'Male'],
'city': ['New York', 'London', 'Beijing', 'Paris', 'Sydney']}
df = pd.DataFrame(data)
print(df)
输出结果如下:
name age gender city
0 Tom 23 Male New York
1 Jerry 12 Male London
2 Mike 31 Female Beijing
3 Ali 45 Male Paris
4 John 27 Male Sydney
Pandas series
Pandas series是一种类似数组的数据结构,由一组数据及其对应的索引组成。每个索引对应一个数据值,这些索引和值可以是各种类型。当然,series也可以看做是只有一列的dataframe。示例代码如下:
import pandas as pd
data = pd.Series([1, 3, 5, 7, 9])
print(data)
输出结果如下:
0 1
1 3
2 5
3 7
4 9
dtype: int64
Matplotlib绘图
在了解了Pandas dataframe / series数据结构之后,我们接下来介绍如何使用Matplotlib将这些数据保存为图形。
折线图
折线图是一种最为常见的统计图形,通常用来表示时间序列、趋势分析等。在Matplotlib中,我们可以使用plot()函数绘制折线图。示例代码如下:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.Series([1, 3, 5, 7, 9])
plt.plot(data)
plt.savefig('line_plot.png')
运行代码后,将会在本地磁盘中生成一个名为“line_plot.png”的图像文件,用来表示这个series数据的折线图。
直方图
直方图是一种常见的统计图形,通常用来表示数据分布、频率分布等。在Matplotlib中,我们可以使用hist()函数绘制直方图。示例代码如下:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.Series([1, 3, 5, 5, 7, 9])
plt.hist(data)
plt.savefig('hist_plot.png')
运行代码后,将会在本地磁盘中生成一个名为“hist_plot.png”的图像文件,用来表示这个series数据的直方图。如下图所示:
箱形图是一种常见的统计图形,通常用来表示离散数据的分布情况、异常值等。在Matplotlib中,我们可以使用boxplot()函数绘制箱形图。示例代码如下:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.DataFrame({'Group': ['A', 'A', 'A', 'B', 'B', 'B'],
'Score': [90, 85, 80, 75, 70, 65]})
plt.boxplot(data['Score'], labels=data['Group'])
plt.savefig('box_plot.png')
运行代码后,将会在本地磁盘中生成一个名为“box_plot.png”的图像文件,用来表示这个dataframe数据的箱形图。
如何将结果保存为图像文件?
在使用Matplotlib绘制完图形后,我们可以使用savefig()函数将结果保存为图像文件。该函数有一个必选参数,即保存文件的路径和文件名。不同的文件格式有不同的后缀名,例如.png、.jpg、.pdf等。我们可以在savefig()函数中指定保存文件的格式。示例代码如下:
import pandas as pd
import matplotlib.pyplot as plt
data = pd.Series([1, 3, 5, 7, 9])
plt.plot(data)
plt.savefig('line_plot.png')
运行代码后,将会在本地磁盘中生成一个名为“line_plot.png”的图像文件。同样的,我们也可以将其他类型的图像保存为相应的格式文件。
总结
Matplotlib是Python中最常用的绘图库之一,可以用来绘制各种统计图表等数据可视化。在分析和可视化数据时,我们通常使用Pandas进行数据操作,而Matplotlib则用来绘制图形展示数据的结果。本文介绍了如何使用Matplotlib将Pandas dataframe / series数据保存为图形,包括折线图、直方图、箱形图等常见的统计图形。保存图像为文件时,我们可以使用savefig()函数将结果另存为图像文件。
极客教程