热线电话:13121318867

登录
2018-10-25 阅读量: 769
R里的循环语句笔记分享(3)

R今天在做一个项目的时候发现R剔除重复值比较困难,百度之后找到了解决办法:如果有下列的数据

> a

公司 比例

1 a 0.4

2 a 0.3

3 a 0.2

4 b 0.5

5 b 0.4

如果想仅保留每个公司的第一条数据,可使用如下方法

> duplicated(a$公司)

[1] FALSE TRUE TRUE FALSE TRUE

> b<-duplicated(a$公司)

> a[!b,]

公司 比例

1 a 0.4

4 b 0.5

如果是要完全去重呢?也就是去除公司和比例完全一样的行数据,则用如下方法:

> duplicated(paste(a公司公司,a比例))

[1] FALSE FALSE FALSE FALSE FALSE

> a[!duplicated(paste(a公司公司,a比例)),]

公司 比例

1 a 0.4

2 a 0.3

3 a 0.2

4 b 0.5

5 b 0.4

0.0000
8
关注作者
收藏
评论(0)

发表评论

暂无数据
推荐帖子