Seaborn 分类数据的绘制
在前几章中,我们学习了散点图、六边形图和kde图,这些图用于分析研究中的连续变量。当所研究的变量是分类的时候,这些图就不适合了。
当所研究的一个或两个变量都是分类的时候,我们可以使用striplot()、swarmplot()等图。Seaborn提供了这样的接口。
分类散点图
在本节中,我们将学习分类散点图。
stripplot()
stripplot()用于研究中的一个变量是分类的时候。它沿任何一个轴以分类的方式表示数据。
例子
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df)
plt.show()
输出
在上面的图中,我们可以清楚地看到每个物种的 花瓣长度 的差异。但是,上述散点图的主要问题是,散点图上的点是重叠的。我们使用’Jitter’参数来处理这种情况。
抖动给数据添加了一些随机噪声。这个参数将调整沿分类轴的位置。
例子
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.stripplot(x = "species", y = "petal_length", data = df, jitter = Ture)
plt.show()
输出
现在,可以很容易地看到点的分布。
Swarmplot()
另一个可以用来替代 “抖动 “的选项是 swarmplot() 函数 。 这个函数将散点图的每个点定位在分类轴上,从而避免了重叠的点:
例子
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.swarmplot(x = "species", y = "petal_length", data = df)
plt.show()
输出