9

なぜこれが起こるのか、そしてこれをもっと雄弁に行う方法についての洞察をいただければ幸いです。

sapplyを使用する場合、3x2行列を返したいのですが、2x3行列を返します。どうしてこれなの?そして、なぜこれを別のデータフレームに添付するのが難しいのですか?

a <- data.frame(id=c('a','b','c'), var1 = c(1,2,3), var2 = c(3,2,1))
out <- sapply(a$id, function(x) out = a[x, c('var1', 'var2')])
#out is 3x2, but I would like it to be 2x3
#I then want to append t(out) (out as a 2x3 matrix) to b, a 1x3 dataframe
b <- data.frame(var3=c(0,0,0))

これらを付けようとすると、

b[,c('col2','col3')] <- t(out)

私が得るエラーは次のとおりです。

Warning message:
In `[<-.data.frame`(`*tmp*`, , c("col2", "col3"), value = list(1,  :
  provided 6 variables to replace 2 variables

以下は望ましい結果をもたらすように見えますが:

rownames(out) <- c('col1', 'col2')
b <- cbind(b, t(out))

変数を操作できません:

b$var1/b$var2

戻り値

Error in b$var1/b$var2 : non-numeric argument to binary operator

ありがとう!

4

3 に答える 3

6

DWinの答えを拡張するには、outオブジェクトの構造を調べると役立ちます。それはなぜb$var1/b$var2あなたが期待することをしないのかを説明します。

> out <- sapply(a$id, function(x) out = a[x, c('var1', 'var2')])
> str(out)  # this isn't a data.frame or a matrix...
List of 6
 $ : num 1
 $ : num 3
 $ : num 2
 $ : num 2
 $ : num 3
 $ : num 1
 - attr(*, "dim")= int [1:2] 2 3
 - attr(*, "dimnames")=List of 2
  ..$ : chr [1:2] "var1" "var2"
  ..$ : NULL

関数のapplyファミリーは、ベクトルと配列で機能するように設計されているため、data.frames(通常はベクトルのリスト)でそれらを使用する場合は注意が必要です。data.framesがリストであるという事実を利用して、を活用できますlapply

> out <- lapply(a$id, function(x) a[x, c('var1', 'var2')])  # list of data.frames
> out <- do.call(rbind, out) # data.frame
> b <- cbind(b,out)
> str(b)
'data.frame':   3 obs. of  4 variables:
 $ var3: num  0 0 0
 $ var1: num  1 2 3
 $ var2: num  3 2 1
 $ var3: num  0 0 0
> b$var1/b$var2
[1] 0.3333333 1.0000000 3.0000000
于 2010-11-10T03:11:57.797 に答える
3

最初にR表記を少し。のコードを見るとsapply、質問に対する答えが見つかります。このsapply関数は、リストの長さがすべて等しいかどうかを確認し、等しい場合は、最初にそれらを「unlist()」してから、その一連のリストをのデータ引数として受け取りますarray()array(matrix()のように)はデフォルトでその値を列の主要な順序で配置するので、それが得られます。リストは彼らの側に向けられます。気に入らない場合はtsapply、転置された値を返す新しい関数を定義できます。

> tsapply <- function(...) t(sapply(...))
> out <- tsapply(a$id, function(x) out = a[x, c('var1', 'var2')])
> out
     var1 var2
[1,] 1    3   
[2,] 2    2   
[3,] 3    1 

... 3x2マトリックス。

于 2010-11-10T01:48:20.890 に答える
1

plyrパッケージのddplyをご覧ください

a <- data.frame(id=c('a','b','c'), var1 = c(1,2,3), var2 = c(3,2,1))

library(plyr)
ddply(a, "id", function(x){
    out <- cbind(O1 = rnorm(nrow(x), x$var1), O2 = runif(nrow(x)))
    out
})
于 2010-11-10T15:00:41.717 に答える