如何使用Python Seaborn的箱线图比较不同类别的数据?
Seaborn 库有助于可视化数据。它带有自定义的主题和高级接口。
散点图提供的信息有限,因为它们只告诉我们给定数据类别中数值的分布情况。如果我们想要比较类别中存在的数据,那么我们需要使用不同的技术。这就是箱线图的作用所在。它是一种在数据集中了解数据分布的方法,可以通过四分位数来实现。
箱线图由垂直线组成,这些线从箱子中延伸出来。这些延伸部分称为“须”。这些须告诉我们数据在上下四分位之外如何变化。这就是为什么箱线图也被称为须线图的原因。
boxplot 函数的语法
seaborn.boxplot(x, y,data,…)
数据中的异常值以单独的点进行绘制。以下是示例 –
更多Python相关文章,请阅读:Python 教程
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
my_df = sb.load_dataset('iris')
sb.boxplot(x = "species", y = "petal_length", data = my_df)
plt.show()
输出
解释
- 导入所需的包。
- 输入数据是从scikit learn库加载的“iris_data”。
- 此数据存储在 dataframe 中。
- 使用“load_dataset”函数加载鸢尾花数据。
- 使用“boxplot”函数来可视化数据。
- 在此,dataframe 作为参数进行提供。
- 同样,指定 x 和 y 的值。
- 此数据在控制台上显示。