20

文字列を持つデータフレームがあります:

df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
df
#        var1
# 1 aabbcdefg
# 2 aabbcdefg

「a」から「h」、「b」から「i」など、いくつかの異なる個々の文字を置き換えたいと考えています。現在、次の呼び出しをいくつか使用していますgsub

df$var1 <- gsub("a", "h", df$var1)
df$var1 <- gsub("b", "i", df$var1)
df$var1 <- gsub("c", "j", df$var1)
df$var1 <- gsub("d", "k", df$var1)
df$var1 <- gsub("e", "l", df$var1)
df$var1 <- gsub("f", "m", df$var1)
df
#        var1
# 1 hhiijklmg
# 2 hhiijklmg

ただし、よりエレガントなソリューションがあると確信しています。続行するためのアイデアはありますか?

4

3 に答える 3

37

あなたがしたいchartr

df$var1 <- chartr("abcdef", "hijklm", df$var1)
df
#        var1
# 1 hhiijklmg
# 2 hhiijklmg
于 2011-08-05T09:55:27.533 に答える
22

from次のtoベクトルを作成できます。

from <- c('a','b','c','d','e','f')
to <- c('h','i','j','k','l','m')

gsub次に、関数をベクトル化します。

gsub2 <- function(pattern, replacement, x, ...) {
for(i in 1:length(pattern))
x <- gsub(pattern[i], replacement[i], x, ...)
x
}

これにより、次のことが得られます。

> df <- data.frame(var1 = c("aabbcdefg", "aabbcdefg"))
> df$var1 <- gsub2(from, to, df$var1)
> df
       var1
1 hhiijklmg
2 hhiijklmg
于 2011-08-05T09:38:20.233 に答える
11

置換が複数の文字である可能性があるために chartr を使用したくない場合は、gsubfn パッケージの gsubfn を使用する別のオプションがあります (これは gsub ではなく、gsub の拡張であることはわかっています)。以下に一例を示します。

> library(gsubfn)
> tmp <- list(a='apple',b='banana',c='cherry')
> gsubfn('.', tmp, 'a.b.c.d')
[1] "apple.banana.cherry.d"

置換は、一致を取り、その一致の置換値を返す関数にすることもできます。

于 2011-08-05T14:22:00.653 に答える