5

次のような要約統計のセットを計算する data.table 内の関数を呼び出したい:

summ.stats <- function(vec) {
    list(
         Min = min(vec),
         Mean = mean(vec),
         S.D. = sd(vec),
         Median = median(vec),
         Max = max(vec))
}

jそして、私はそれを a の中で呼び出したいdata.table:

DT <- data.table(a=c(1,2,3,1,2,3),b=c(1,4,3,2,1,4),c=c(2,3,4,5,2,1))

DT[, summ.stats(b), by=a]

これは問題ありません。次のようになります。

   a Min Mean      S.D. Median Max
1: 1   1  1.5 0.7071068    1.5   2
2: 2   1  2.5 2.1213203    2.5   4
3: 3   3  3.5 0.7071068    3.5   4

しかし、複数の変数を summ.stats に渡すことに興味があります。例えば:

DT[, summ.stats(b, c), by=a]

次のようなものを取得したい:

   a Var Min Mean      S.D. Median Max
1: 1   b   1  1.5 0.7071068    1.5   2
2: 2   b   1  2.5 2.1213203    2.5   4
3: 3   b   3  3.5 0.7071068    3.5   4
4: 1   c   2  3.5 2.1213203    3.5   5
5: 2   c   2  2.5 0.7071068    2.5   3
6: 3   c   1  2.5 2.1213203    2.5   4

これを行う最善の方法は何ですか?

4

2 に答える 2

6

または、次のように関数を変更できます。

summ.stats <- function(vec) {
    list(
        Var = names(vec),
         Min = sapply(vec, min),
         Mean = sapply(vec, mean),
         S.D. = sapply(vec, sd),
         Median = sapply(vec, median),
         Max = sapply(vec, max))
}

DT[, summ.stats(.SD), by=a] # no need for as.list(.SD) as Roger mentions
   a Var Min Mean      S.D. Median Max
1: 1   b   1  1.5 0.7071068    1.5   2
2: 1   c   2  3.5 2.1213203    3.5   5
3: 2   b   1  2.5 2.1213203    2.5   4
4: 2   c   2  2.5 0.7071068    2.5   3
5: 3   b   3  3.5 0.7071068    3.5   4
6: 3   c   1  2.5 2.1213203    2.5   4
于 2013-07-28T23:50:38.710 に答える