r - plyr daply を使用してデータフレームを行列に変換する

Question

daplyパッケージ内の関数を使用しようとしていplyrますが、正しく出力できません。行列を構成する変数は数値ですが、行列の要素はリストであり、変数自体ではありません。例として、データの小さなサブセットを次に示します。

   Month Vehicle Samples
1 Oct-10   31057     256
2 Oct-10   31059     316
3 Oct-10   31060     348
4 Nov-10   31057     267
5 Nov-10   31059     293
6 Nov-10   31060     250
7 Dec-10   31057     159
8 Dec-10   31059     268
9 Dec-10   31060     206

そして、次のようなマトリックス形式でデータを視覚化できるようにしたいと考えています。

  Month
Vehicle Oct-10 Nov-10 Dec-10
  31057    256    267    159
  31059    316    293    268
  31060    348    250    206

私が使用する代替構文をいくつか示します (後者は、元のデータフレームにここに示すよりも多くの列があるためです)。

daply(DF, .(Vehicle, Month), identity)
daply(DF,.(Vehicle,Month), colwise(identity,.(Samples)))

ただし、代わりに得られるのはかなり難解です:

       Month
Vehicle Oct-10 Nov-10 Dec-10
  31057 List,3 List,3 List,3
  31059 List,3 List,3 List,3
  31060 List,3 List,3 List,3

str一部のコメンターが提案したように、出力で関数を使用しました。抜粋を次に示します。

List of 9
 $ :'data.frame':       1 obs. of  3 variables:
  ..$ Month  : Ord.factor w/ 3 levels "Oct-10"<"Nov-10"<..: 1
  ..$ Vehicle: Factor w/ 3 levels "31057","31059",..: 1
  ..$ Samples: int 256
 $ :'data.frame':       1 obs. of  3 variables:
  ..$ Month  : Ord.factor w/ 3 levels "Oct-10"<"Nov-10"<..: 1
  ..$ Vehicle: Factor w/ 3 levels "31057","31059",..: 2
  ..$ Samples: int 316

私は何が欠けていますか？また、基本パッケージで簡単にこれを行う方法はありますか? ありがとう！

以下は、Dputこれを再現したい場合のデータフレームです。

structure(list(Month = structure(c(1L, 1L, 1L, 2L, 2L, 2L, 3L, 
3L, 3L), .Label = c("Oct-10", "Nov-10", "Dec-10"), class = c("ordered", 
"factor")), Vehicle = structure(c(1L, 2L, 3L, 1L, 2L, 3L, 1L, 
2L, 3L), .Label = c("31057", "31059", "31060"), class = "factor"), 
    Samples = c(256L, 316L, 348L, 267L, 293L, 250L, 159L, 268L, 
    206L)), .Names = c("Month", "Vehicle", "Samples"), class = "data.frame", row.names = c(NA, 
9L))

score 8 · Accepted Answer

関数はここidentityで必要なものではありません。ヘルプページから、「すべての plyr 関数は同じ分割-適用-結合戦略を使用します。入力をより単純な部分に分割し、各部分に .fun を適用してから、それらの部分を単一のデータ構造に結合します。」この場合の単純な部分は、一意の車両/月の組み合わせを持つ元のデータフレームのサブセットです。恒等関数はそのサブセットを返すだけで、これらのサブセットは結果の行列を埋めるために使用されます。

つまり、取得したマトリックスの各要素は、その月/車両の組み合わせの行を含むデータフレーム (リストの一種) です。

> try1 <- daply(DF, .(Vehicle, Month), identity)
> try1[1,1]
[[1]]
   Month Vehicle Samples
1 Oct-10   31057     256

代わりにSamples、次のように、そのデータフレームの一部を取得する関数を使用します。

daply(DF, .(Vehicle, Month), function(x) x$Samples)

その結果、

       Month
Vehicle Oct-10 Nov-10 Dec-10
  31057    256    267    159
  31059    316    293    268
  31060    348    250    206

これを行ういくつかの代替方法は、パッケージcastからのものですreshape（データフレームを返します）

cast(DF, Vehicle~Month, value="Samples")

の改訂版reshape2。1 つ目はデータフレームを返し、2 つ目は行列を返します

dcast(DF, Vehicle~Month, value_var="Samples")
acast(DF, Vehicle~Month, value_var="Samples")

とパッケージxtabsからstats

xtabs(Samples ~ Vehicle + Month, DF)

または手動で、マトリックスインデックスを使用することはまったく難しくありません。ほとんどすべてのコードは、マトリックスを設定するだけです。

with(DF, {
  out <- matrix(nrow=nlevels(Vehicle), ncol=nlevels(Month),
                dimnames=list(Vehicle=levels(Vehicle), Month=levels(Month)))
  out[cbind(Vehicle, Month)] <- Samples
  out
})

stats パッケージのreshape関数もこれを行うために使用できますが、構文が難しく、学習castしてmeltからreshapeパッケージから一度も使用していません。

score 2 · Accepted Answer

タイトルの単語で OP を使用すると、R で常に使用できる基本パッケージdata.matrix()の標準関数を探している可能性があります。

data.matrix()データフレームを行列に変換する前に、任意の要素を数値コーディングに変換することによって機能します。次のデータフレームを検討してください。

dat <- data.frame(A = 1:10, B = factor(sample(c("X","Y"), 10, replace = TRUE)))

経由で変換するas.matrix()と、文字行列が得られます。

> head(as.matrix(dat))
     A    B  
[1,] " 1" "X"
[2,] " 2" "X"
[3,] " 3" "Y"
[4,] " 4" "Y"
[5,] " 5" "Y"
[6,] " 6" "Y"

または、matrix()次元を含むリストを取得する場合（リスト配列-ちなみにの値セクションで述べ?daplyたように）

> head(matrix(dat))
     [,1]      
[1,] Integer,10
[2,] factor,10 
> str(matrix(dat))
List of 2
 $ : int [1:10] 1 2 3 4 5 6 7 8 9 10
 $ : Factor w/ 2 levels "X","Y": 1 1 2 2 2 2 1 2 2 1
 - attr(*, "dim")= int [1:2] 2 1

data.matrix()ただし、意図したことを行います。

> mat <- data.matrix(dat)
> head(mat)
     A B
[1,] 1 1
[2,] 2 1
[3,] 3 2
[4,] 4 2
[5,] 5 2
[6,] 6 2
> str(mat)
 int [1:10, 1:2] 1 2 3 4 5 6 7 8 9 10 ...
 - attr(*, "dimnames")=List of 2
  ..$ : NULL
  ..$ : chr [1:2] "A" "B"

r - plyr daply を使用してデータ フレームを行列に変換する

2 に答える 2

Related

Reference

r - plyr daply を使用してデータフレームを行列に変換する