7

data.frame から多次元配列に取得するためのより用途の広い方法を探しています。

データ フレーム内の必要な数の変数から、必要な数のディメンションを作成できるようにしたいと考えています。

現在、メソッドは各 data.frame に合わせて調整する必要があり、ベクトルを形成するためにサブレットが必要です。

プライアのメルト/キャスト方法に沿ったものが大好きです。

   data<-data.frame(coord.name=rep(1:10, 2),
             x=rnorm(20),
             y=rnorm(20),
             ID=rep(c("A","B"), each=10))


    data.array<-array(dim=c(10, 2, length(unique(data$ID))))

    for(i in 1:length(unique(data$ID))){
      data.array[,1,i]<-data[data$ID==unique(data$ID)[i],"x"]
      data.array[,2,i]<-data[data$ID==unique(data$ID)[i],"y"]
    }

data.array
, , 1

      [,1] [,2]
 [1,]    1    1
 [2,]    3    3
 [3,]    5    5
 [4,]    7    7
 [5,]    9    9
 [6,]    1    1
 [7,]    3    3
 [8,]    5    5
 [9,]    7    7
[10,]    9    9

, , 2

      [,1] [,2]
 [1,]    2    2
 [2,]    4    4
 [3,]    6    6
 [4,]    8    8
 [5,]   10   10
 [6,]    2    2
 [7,]    4    4
 [8,]    6    6
 [9,]    8    8
[10,]   10   10
4

2 に答える 2

7

微妙な理由で、 reshape2関数を適用するのに問題があった可能性があります。問題は、data.frameに、出力配列の最初の次元に沿って要素を配置する方法を指示するために使用できる列がないことでした。

以下に、そのような列を明示的に追加し、それを呼び出します"row"。これを配置すると、表現力acast()またはdcast()関数を使用して、選択した方法でデータの形状を変更できます。

library(reshape2)

# Use this or some other method to add a column of row indices.
data$row <- with(data, ave(ID==ID, ID, FUN = cumsum))

m <- melt(data, id.vars = c("row", "ID"))
a <- acast(m, row ~ variable ~ ID)

a[1:3, , ]
# , , A
# 
#   x y
# 1 1 1
# 2 3 3
# 3 5 5
#
# , , B
# 
#   x y
# 1 2 2
# 2 4 4
# 3 6 6
于 2012-04-05T23:07:26.043 に答える
4

私はこれが正しいと思います:

array(unlist(lapply(split(data, data$ID), function(x) as.matrix(x[ , c("x", "y")]))), c(10, 2, 2))
于 2012-04-05T23:04:23.190 に答える