在de中引发异常
我目前正在编写一个R脚本来对从社交媒体收集的数据进行匿名化处理。 有一列包含作者的(数字)名称,我正试图对此专栏进行匿名化处理。 我在Stackoverflow上发现了这个脚本:
anonymiseColumns <- function(df, colIDs) {
id <- if(is.character(colIDs)) match(colIDs, names(df)) else colIDs
for(id in colIDs) {
prefix <- sample(LETTERS, 1)
suffix <- as.character(as.numeric(as.factor(df[[id]])))
df[[id]] <- paste(prefix, suffix, sep="")
}
names(df)[id] <- paste("V", id, sep="")
df
}
(感谢Josh O'brien:如何从私人数据创建示例数据集(用无信息的占位符替换变量名称和级别)?)这段脚本工作得非常好。 但是,我想保留1个特定的作者姓名。 也就是说,零售商的名称(我们以'沃尔玛'为例)应该成为'零售商'。 应该有办法解决这个问题,但我一直无法弄清楚。
链接地址: http://www.djcxy.com/p/24795.html