Seaborn 核密度估计
核密度估计(KDE)是一种估计连续随机变量的概率密度函数的方法。它用于非参数分析。
在 distplot 中将 hist 标志设置为False,将输出核密度估计图。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()
输出
拟合参数分布
distplot() 用于可视化数据集的参数分布。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()
输出
绘制双变量分布
双变量分布用于确定两个变量之间的关系。主要涉及两个变量之间的关系以及一个变量相对于另一个变量的行为方式。
在seaborn中分析双变量分布最好的方法是使用 jointplot() 函数。
Jointplot创建一个多面板图,显示两个变量之间的双变量关系以及每个变量的单变量分布。
散点图
散点图是直观显示分布的最方便方法,通过x轴和y轴在二维图中表示每个观测值。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()
输出
上图显示了鸢尾花数据中花瓣长度 (petal_length) 和花瓣宽度 (petal_width) 之间的关系。图中的趋势表明变量之间存在正相关。
六边形散点图
当双变量数据稀疏且难以通过散点图进行分析时,可以使用六边形分箱图。
通过增加一个名为 “kind” 和值为 “hex” 的参数,可以绘制六边形散点图。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()
核密度估计
核密度估计是一种非参数估计变量分布的方法。在seaborn中,我们可以使用 jointplot() 绘制核密度估计图。
将值’kde’传递给参数kind可以绘制核密度估计图。
示例
import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()