R语言 忽略ggplot2 Boxplot中的异常值

R语言 忽略ggplot2 Boxplot中的异常值

在这篇文章中,我们将了解如何在R编程语言中的ggplot2 Boxplot中忽略或删除离群值。

移除/忽略离群值通常不是一个好主意,因为突出离群值通常是使用箱形图的优势之一。然而,有时极端的离群值,则会改变箱形图的大小,并掩盖箱形图的其他特征,因此,在这些情况下,最好不要将其剔除。我们可以在R中通过设置outlier.shape参数为NA来移除异常值。此外,coord_cartesian()函数将被用来拒绝所有超过或低于给定四分位数的离群值。ggplot2的y轴不会被自动调整。你可以通过使用coord_cartesian()函数来调整轴。

为了创建带有异常值的Bowxplot,我们需要两个函数,一个是ggplot(),另一个是geom_boxplot()

使用的数据集: Crop_recommendation

让我们先创建一个常规的博列表,不去除任何离群值,这样差异就会很明显。

例子

# Loading
library(ggplot2)
  
# loading data set and storing it in ds variable
ds <- read.csv("c://crop//archive//Crop_recommendation.csv", header = TRUE)
ds
  
# create a boxplot by using geom_boxplot() 
# function of ggplot2 package with outliers
box_plot_crop<-ggplot(data=ds, aes( y=rainfall))
  
box_plot_crop+geom_boxplot()

输出

忽略R语言中ggplot2 Boxplot中的异常值

现在,为了去除异常值,你可以使用outlier.shape到NA参数。

语法

geom_boxplot(outlier.shape = NA)

你可以直接用coord_cartesian()函数改变轴,因为ggplot2不会自动调整轴。在 coord_catesian() 中,你可以通过使用参数 ylim 或 xlim 来设置轴的极限。

语法

coord_cartesian( xlim = NULL, ylim = NULL, expand = TRUE, default = FALSE, clip = “on )

参数

  • xlim, ylim -- 设置x轴和y轴的极限,也允许放大和缩小。
  • expand – 默认为 “true”,如果它是 “true”,那么它将增加少量的限制,以确保数据和轴不会重叠。如果它是 “false”,那么限制将取自精确的数据或xlim/ylim。
  • default – 用于检查这是否是默认的坐标系。
  • clip– 它检查是否应该裁剪图形以适合绘图面板

例子

# Loading
library(ggplot2)
  
# loading data set and storing it in ds variable
ds <- read.csv("c://crop//archive//Crop_recommendation.csv", header = TRUE)
ds
  
# remove outliers or create boxplot without outliers
box_plot_crop<-ggplot(data=ds, aes(y = rainfall)) 
box_plot_crop+ geom_boxplot(outlier.shape = NA) +
  coord_cartesian(ylim =  c(50, 300))

输出

忽略R语言中ggplot2 Boxplot中的异常值

Python教程

Java教程

Web教程

数据库教程

图形图像教程

大数据教程

开发工具教程

计算机教程