2019-01-12
阅读量:
763
在分析中排除缺失值
确定了缺失值的位置以后,你需要在进一步分析数据之前以某种方式删除这些缺失值。原因
是,含有缺失值的算术表达式和函数的计算结果也是缺失值。举例来说,考虑以下代码:
x <- c(1, 2, NA, 3)
y <- x[1] + x[2] + x[3] + x[4]
z <- sum(x)
由于x中的第3个元素是缺失值,所以y和z也都是NA(缺失值)。
好在多数的数值函数都拥有一个na.rm=TRUE选项,可以在计算之前移除缺失值并使用剩余
值进行计算:
x <- c(1, 2, NA, 3)
y <- sum(x, na.rm=TRUE)
这里, y等于6。
在使用函数处理不完整的数据时,请务必查阅它们的帮助文档(例如, help(sum)),检查
这些函数是如何处理缺失数据的。函数sum()只是我们将在第5章中讨论的众多函数之一,使用
这些函数可以灵活而轻松地转换数据。
你可以通过函数na.omit()移除所有含有缺失值的观测。 na.omit()可以删除所有含有缺
失数据的行。






评论(0)


暂无数据
推荐帖子
0条评论
0条评论
1条评论