R语言 在直方图上绘制正态分布图
在这篇文章中,我们将讨论如何在R编程语言中用直方图绘制正态分布。
在一个随机数据集中,通常可以观察到数据的分布是正态的,也就是说,用密度图在X轴和Y轴的变量值上进行可视化,我们会得到一条钟形曲线。该曲线的中心代表数据集的平均值。但是密度图即使是平滑的,也不能显示真实的数值,而是显示正态分布。为了解决这种情况,我们使用带有正态分布的直方图来覆盖。在这种情况下,直方图给出了绘制的条形图的真实值,而覆盖的密度图显示了正态分布趋势。
为了做到这一点,我们使用rcompanion包的plotNormalHistogram()函数。该函数以数据向量为参数,绘制直方图,并将最佳拟合密度图作为叠加图。
安装
要安装rcompanion包。
带有正态分布覆盖的直方图
为了创建一个带有正态分布叠加密度图的基本直方图,我们使用R语言中rcompanion包库的plotNormalHistogram()函数。
语法
plotNormalHistogram( x, prob, col, main, length)
参数
- x: 确定用于绘制的数据向量
- prob: 它是一个布尔值。如果是FALSE,那么就显示计数,否则就显示密度。
- main: 决定绘图的显示标题。
- length : 确定密度图线中的点的数量。
例子
这里,是一个带有正态分布覆盖的基本直方图。
输出
颜色和尺寸的定制
我们可以根据我们的需要定制上述图表的外观和感觉,通过使用col, linecol, lwd, 和border参数来分别改变直方图条的颜色,密度图线的颜色,密度图线的宽度,以及直方图条边框的颜色。由于 plotNormalHistogram() 函数是建立在 hist() 函数之上的,所以 hist() 函数的所有参数在这里也起作用。
语法
plotNormalHistogram( x, col, linecol, lwd, border )
参数 :
- col: 决定直方图条的颜色。
- linecol: 决定密度图线的颜色。
- lwd: 决定密度图的线的宽度。
- border: 确定直方图中条形图的边框颜色。
例子
这里是一个带有正态分布的直方图,黑色条形图带绿色边框,红色粗的密度图线。
输出