6

次のデータフレームがある場合:

value    factorA    factorB
1           a          e
2           a          f
3           a          g
1           b          k
2           b          l
3           b          m
1           c          e
2           c          g

各factorAについて、最高値とそれに関連付けられたfactorBからのエントリを取得するにはどうすればよいですか。

value   factorA factorB

3         a        g
3         b        m
2         c        g

これは最初に使用せずに可能ですか

blocks<-split(factorA, list(), drop=TRUE)

次に、各ブロック$ aを並べ替えます。これは何度も実行され、ブロックの数は常に変化するためです。

4

2 に答える 2

12

基本R関数を使用する1つのオプションは次のとおりです。

maxRows <- by(df, df$factorA, function(X) X[which.max(X$value),])
do.call("rbind", maxRows)
#   value factorA factorB
# a     3       a       g
# b     3       b       m
# c     2       c       g
于 2012-04-10T18:35:18.560 に答える
4

あなたのデータで

df<- structure(list(value = c(1L, 2L, 3L, 1L, 2L, 3L, 1L, 2L), factorA = structure(c(1L, 
        1L, 1L, 2L, 2L, 2L, 3L, 3L), .Label = c("a", "b", "c"), class = "factor"), 
            factorB = structure(c(1L, 2L, 3L, 4L, 5L, 6L, 1L, 3L), .Label = c("e", 
            "f", "g", "k", "l", "m"), class = "factor")), .Names = c("value", 
        "factorA", "factorB"), class = "data.frame", row.names = c(NA, 
        -8L))

パッケージddply内の関数の使用plyr

> df2<-ddply(df,c('factorA'),function(x) x[which(x$value==max(x$value)),])
  value factorA factorB
1     3       a       g
2     3       b       m
3     2       c       g

または、

> rownames(df2) <- df2$factorA
> df2
  value factorA factorB
a     3       a       g
b     3       b       m
c     2       c       g
于 2012-04-10T19:57:24.280 に答える