data.table の各行に関数を効率的に適用する方法を探しています。次のデータ テーブルを考えてみましょう。
library(data.table)
library(stringr)
x <- data.table(a = c(1:3, 1), b = c('12 13', '14 15', '16 17', '18 19'))
> x
a b
1: 1 12 13
2: 2 14 15
3: 3 16 17
4: 1 18 19
列の各要素をb
スペースで分割し (元のデータの各行に対して 2 つの行を生成)、結果のデータ テーブルを結合するとします。上記の例では、次の結果が必要です。
a V1
1: 1 12
2: 1 13
3: 2 14
4: 2 15
5: 3 16
6: 3 17
7: 1 18
8: 1 19
列a
に一意の値しかない場合、次のようになります。
x[, list(str_split(b, ' ')[[1]]), by = a]
次はほとんど機能しますが (元のデータ テーブルに同一の行がいくつかある場合を除きます)、x
多くの列があり、列 b を結果にコピーすると見苦しくなります。これは避けたいと思います。
> x[, list(str_split(b, ' ')[[1]]), by = list(a,b)]
a b V1
1: 1 12 13 12
2: 1 12 13 13
3: 2 14 15 14
4: 2 14 15 15
5: 3 16 17 16
6: 3 16 17 17
7: 1 18 19 18
8: 1 18 19 19
この問題を解決するための最も効率的で慣用的な方法は何でしょうか?