R语言 如何使用is.na
在这篇文章中,我们将讨论如何在R编程语言中使用is.na。
is.na用于检查给定数据中存在的NA值,如果该值是NA,则返回TRUE,否则返回FALSE。
语法:
is.na(data)
其中,数据是一个向量/数据帧
is.na()可以和其他方法一起使用,以增加需求的意义。要计算数据中存在的全部NA值,我们必须使用sum()函数
语法:
sum(is.na(data))
通过使用which()函数来获取存在NA值的位置
语法:
which(is.na(data))
is.na在向量中的使用
矢量是一种数据结构,可以存储多种数据类型的元素。
例子: R程序获取并计算向量中的NA值
# create a vector
data = c(1, 2, 3, NA, 45, 34, NA, NA, 23)
# display
print(data)
# get NA values
print(is.na(data))
# count NA values
print(sum(is.na(data)))
# get the NA index positions
print(which(is.na(data)))
输出
[1] 1 2 3 na 45 34 na 23
[1] 假的 假的 真的 假的 真的 真的 假的
[1] 3
[1] 4 7 8
在数据框架中使用is.na
数据框架是一种数据结构,可以在行和列中存储多种数据类型的元素。
例子: R程序计算数据框架中的NA和获取NA值
# create a dataframe with 3 columns
data=data.frame(column1=c(1,2,NA,34),
column2=c(NA,34,56,NA),
column3=c(NA,NA,32,56))
# display
print(data)
# get NA values
print(is.na(data))
# count NA values
print(sum(is.na(data)))
# get the NA index positions
print(which(is.na(data)))
输出
我们可以使用sapply()函数来获得数据框中的总NA值。
语法:
sapply(dataframe, function(variable) sum(is.na(variable)))
其中
- dataframe是输入数据框
- function是获得每一列中NA的总和
例子 :在一个数据框架上使用is.na
# create a dataframe with 3 columns
data=data.frame(column1=c(1,2,NA,34),
column2=c(NA,34,56,NA),
column3=c(NA,NA,32,56))
# display
print(data)
# get count of NA in each column
print(sapply(data, function(x) sum(is.na(x))))
输出