Seaborn 核心密度估计

核心密度估计（KDE）是一种估计连续随机变量的概率密度函数的方法。它被用于非参数分析。

在 distplot 中设置 hist 标志为False将产生核密度估计图。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'],hist=False)
plt.show()

输出

Seaborn - 核心密度估计

拟合参数分布

distplot() 用于可视化数据集的参数分布。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.distplot(df['petal_length'])
plt.show()

输出

Seaborn - 核心密度估计

绘制双变量分布图

双变量分布是用来确定两个变量之间的关系。这主要涉及两个变量之间的关系以及一个变量对另一个变量的表现。

在seaborn中分析双变量分布的最好方法是使用 jointplot() 函数。

Jointplot创建了一个多面板图，将两个变量之间的双变量关系以及每个变量的单变量分布投射在不同的轴上。

散点图

散点图是可视化分布的最方便的方法，每个观测值都通过X和Y轴在二维图中表示。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df)
plt.show()

输出

Seaborn - 核心密度估计

上图显示了鸢尾花数据中 花瓣长度 和 花瓣宽度 之间的关系。图中的趋势表明，所研究的变量之间存在正相关关系。

Hexbin图

在双变量数据分析中，当数据密度稀疏时，即数据非常分散，难以通过散点图进行分析时，就会使用六边形分层。

一个名为 “kind “和 “hex “的附加参数可以绘制hexbin图。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

Seaborn - 核心密度估计

核心密度估计

核心密度估计是一种估计变量分布的非参数方法。在seaborn中，我们可以使用 jointplot() 绘制kde。

将值’kde’传递给参数种类，以绘制内核图。

例子

import pandas as pd
import seaborn as sb
from matplotlib import pyplot as plt
df = sb.load_dataset('iris')
sb.jointplot(x = 'petal_length',y = 'petal_width',data = df,kind = 'hex')
plt.show()

输出

Seaborn - 核心密度估计