Seaborn 统计估计
在大多数情况下,我们处理的是对数据的整个分布的估计。但当涉及到中心趋势估计时,我们需要一种特定的方式来总结分布。平均数和中位数是非常常用的估计分布中心趋势的技术。
在上节所学的所有图中,我们对整个分布进行了可视化处理。现在,让我们来讨论一下可以用来估计分布的中心倾向的图。
柱状图
柱状图() 显示了分类变量和连续变量之间的关系。数据用矩形条表示,条的长度代表该类别中的数据比例。
条形图表示中心趋势的估计。让我们使用 “泰坦尼克 “数据集来学习柱状图。
例子
输出
在上面的例子中,我们可以看到每个类别中男性和女性的平均存活数量。从图中我们可以了解到,雌性的存活人数比雄性多。在雄性和雌性中,有更多的幸存者来自第一类。
柱状图的一个特殊情况是显示每个类别中的观察数,而不是计算第二个变量的统计数字。为此,我们使用 countplot()。
例子
输出
图中显示,三等舱的乘客数量高于一等舱和二等舱。
点阵图
点状图的作用与柱状图相同,但风格不同。与其说是完整的条形图,不如说是在另一个轴上的某一高度的点来表示估计值。
例子
输出