如何在Python的Seaborn库中使用stripplot绘制分类散点图时避免点重叠?
可视化数据是很重要的一个步骤,因为它可以通过不看数据而进行复杂计算的方式来帮助我们获取数据信息。 Seaborn是一个数据可视化库,它带有自定义主题和高级接口。
通常,在变量是分类性质的情况下,无法使用普通的散点图和直方图等工具。这时就需要使用分类散点图。
例如’stripplot’和’swarmplot’用于处理分类变量。当其中之一变量为分类变量时,我们使用’stripplot’函数,数据按照一轴排序并进行展示。但劣势是会产生某些点的重叠。因此需要使用’jitter’参数来避免变量之间的重叠。
它会向数据集中添加一些随机噪声,并且沿着分类坐标轴调整值的位置。
stripplot函数的语法
seaborn.stripplot(x, y,data, jitter =…)
让我们看看如何使用’jitter’参数来绘制数据集中的分类变量。
阅读更多:Python 教程
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = my_df, jitter = True)
plt.show()
输出

说明
- 导入所需的包。
- 输入数据是从scikit learn库加载的‘iris_data’数据。
- 把数据储存在一个数据框中。
- 使用’load_dataset’函数加载iris数据。
- 使用’stripplot’函数可视化这个数据。
- 传递一个被称为’jitter’的额外参数来避免数据重叠。
- 在此,数据帧作为参数被提供。
- 同时,也会指定x和y值。
- 将数据在控制台上显示。
极客教程