R语言筛选出不重复的行的几种方法
在做项目的过程中遇到筛选不重复的会员信息进行匹配,本次介绍五种筛选不重复行的数据:
五种方法如下:
>>> library(dplyr)
>>> library(sqldf)
方法一:
>>> data1 <- data7_0 %>% group_by(CELLPHONE,MEMBERID) %>%filter(row_number() == 1) %>%ungroup()
方法二:
>>> data2 <- data7_0 %>% distinct(CELLPHONE,MEMBERID, .keep_all = TRUE)
方法三:
>>> data3 <- sqldf("select DISTINCT CELLPHONE,MEMBERID from data7_0")
方法四:
>>> data4 <- base::unique(data7_0)
方法五:
>>> data5 <- as.data.table(data7_0[!duplicated(data7_0$CELLPHONE), ])
本文来自互联网用户投稿,文章观点仅代表作者本人,不代表本站立场,不承担相关法律责任。如若转载,请注明出处。 如若内容造成侵权/违法违规/事实不符,请点击【内容举报】进行投诉反馈!
