Pandas 用于数据分析的小提琴图
Violin Plot是一种将不同变量的数字数据分布可视化的方法。它类似于箱形图,但每一面都有一个旋转图,在Yaxis上给出了更多关于密度估计的信息。
密度被镜像和翻转,产生的形状被填入,形成一个类似于小提琴的图像。小提琴图的优点是,它可以显示分布中的细微差别,而这些细微差别在膨胀图中是无法察觉的。另一方面,膨胀图能更清楚地显示数据中的异常值。
小提琴图比箱形图拥有更多的信息,它们不太受欢迎。由于它们不受欢迎,对于许多不熟悉小提琴图表示法的读者来说,它们的意义可能更难把握。
要获得Iris Data的链接,请点击-这里。
数据集的属性信息:
Loading Libraries
Loading Data
输出:
Description
输出:
Info
输出:
描述鸢尾花数据集的’SepalLengthCm’参数。
输出:
代码#1: Violin Plot for ‘SepalLengthCm’ Parameter.
输出:
正如你所看到的,我们在5和6之间有一个较高的密度。这是非常重要的,因为在SepalLengthCm的描述中,平均值是5.43。
代码#2:‘SepalLengthWidth’参数的小提琴图。
输出:
在这里,更高的密度也是在平均值=3.05
代码#3:小提琴图比较’SepalLengthCm’和’SepalWidthCm’。
输出:
代码#4:小提琴图比较’SepalLengthCm’的物种。
输出: