Seaborn 统计估计

Seaborn 统计估计

在大多数情况下,我们处理的是对数据的整个分布的估计。但当涉及到中心趋势估计时,我们需要一种特定的方式来总结分布。平均数和中位数是非常常用的估计分布中心趋势的技术。

在上节所学的所有图中,我们对整个分布进行了可视化处理。现在,让我们来讨论一下可以用来估计分布的中心倾向的图。

柱状图

柱状图() 显示了分类变量和连续变量之间的关系。数据用矩形条表示,条的长度代表该类别中的数据比例。

条形图表示中心趋势的估计。让我们使用 “泰坦尼克 “数据集来学习柱状图。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.barplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

输出

Seaborn - 统计估计

在上面的例子中,我们可以看到每个类别中男性和女性的平均存活数量。从图中我们可以了解到,雌性的存活人数比雄性多。在雄性和雌性中,有更多的幸存者来自第一类。

柱状图的一个特殊情况是显示每个类别中的观察数,而不是计算第二个变量的统计数字。为此,我们使用 countplot()。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.countplot(x = " class ", data = df, palette = "Blues");
plt.show()

输出

Seaborn - 统计估计

图中显示,三等舱的乘客数量高于一等舱和二等舱。

点阵图

点状图的作用与柱状图相同,但风格不同。与其说是完整的条形图,不如说是在另一个轴上的某一高度的点来表示估计值。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('titanic')
sb.pointplot(x = "sex", y = "survived", hue = "class", data = df)
plt.show()

输出

Seaborn - 统计估计

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程