R语言删除NA行|极客教程

R语言删除NA行

在数据分析和处理的过程中，经常会遇到数据表中包含缺失值（NA）的情况。对于这些包含NA值的行，在进行统计分析或模型建立时通常需要将其剔除，以避免对结果产生影响。本文将介绍在R语言中如何删除包含NA值的行。

方法一：使用na.omit函数

na.omit函数是一种简单方便的方法，可以删除数据框或矩阵中包含NA值的行。在使用na.omit函数时，不会修改原始数据，而是返回一个不包含NA值的新数据框。

# 创建包含NA值的数据框
data <- data.frame(
  A = c(1, 2, 3, NA, 5),
  B = c(NA, 4, 5, 6, 7)
)

# 使用na.omit函数删除NA值的行
clean_data <- na.omit(data)

# 输出结果
print(clean_data)

运行结果如下：

方法二：使用complete.cases函数

complete.cases函数也可以用来删除包含NA值的行，它返回一个逻辑向量，指示每行是否完整包含非NA值。通过对这个逻辑向量进行筛选，可以删除包含NA值的行。

# 创建包含NA值的数据框
data <- data.frame(
  A = c(1, 2, 3, NA, 5),
  B = c(NA, 4, 5, 6, 7)
)

# 使用complete.cases函数删除NA值的行
clean_data <- data[complete.cases(data),]

# 输出结果
print(clean_data)

运行结果如下：

方法三：使用dplyr包中的filter函数

dplyr包是R语言中一个流行的数据处理包，它提供了一套简洁、高效的数据处理函数。其中的filter函数可以方便地删除包含NA值的行。

# 加载dplyr包
library(dplyr)

# 创建包含NA值的数据框
data <- data.frame(
  A = c(1, 2, 3, NA, 5),
  B = c(NA, 4, 5, 6, 7)
)

# 使用filter函数删除NA值的行
clean_data <- data %>% filter(complete.cases(.))

# 输出结果
print(clean_data)

运行结果如下：