热线电话:13121318867

登录
2019-01-12 阅读量: 739
在分析中排除缺失值

确定了缺失值的位置以后,你需要在进一步分析数据之前以某种方式删除这些缺失值。原因

是,含有缺失值的算术表达式和函数的计算结果也是缺失值。举例来说,考虑以下代码:

x <- c(1, 2, NA, 3)

y <- x[1] + x[2] + x[3] + x[4]

z <- sum(x)

由于x中的第3个元素是缺失值,所以yz也都是NA(缺失值)。

好在多数的数值函数都拥有一个na.rm=TRUE选项,可以在计算之前移除缺失值并使用剩余

值进行计算:

x <- c(1, 2, NA, 3)

y <- sum(x, na.rm=TRUE)

这里, y等于6。

在使用函数处理不完整的数据时,请务必查阅它们的帮助文档(例如, help(sum)),检查

这些函数是如何处理缺失数据的。函数sum()只是我们将在第5章中讨论的众多函数之一,使用

这些函数可以灵活而轻松地转换数据。

你可以通过函数na.omit()移除所有含有缺失值的观测。 na.omit()可以删除所有含有缺

失数据的行。

0.0000
0
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子