2

データフレーム内の と のユニークな組み合わせで作業したいとvar1思いvar2ます。

foo <- data.frame(var1 = c(1,1,2,2,2,2,3,3,3,3,3,4,4,4,4),
                  var2 = c(1,1,1,1,2,2,1,1,2,2,2,2,2,3,3))

前述のように、unique(foo)結果は次のようになります。

      var1  var2
 1    1     1
 2    2     1
 3    2     2
 4    3     1
 5    3     2
 6    4     2
 7    4     3

ユニークな組み合わせに基づいて、どのように取得しますか:

  • nvar1値の出現回数、および
  • svar、各var1値のvar2値の合計。

出力は次のようになります。

      var1  n    svar
1     1     1    1
2     2     2    3
3     3     2    3
4     4     2    5
4

3 に答える 3

4

unique(foo)あなたがここにいるものをあなたに与えるべきです。

UPDATE 2014:dplyr代わりに使用plyr

他の集約型タスクのライブラリ、plyrまたは のベース R の同等物を調べることをお勧めします。tapply()aggregate()

この演習では冗長ですが、plyr の使用方法は次のとおりです。

library(plyr)
ddply(foo, .(var1), unique)

次のように var2 の平均と sd を見つけるなど、unique を任意の数の関数に置き換えることができることに注意してください。

ddply(foo, .(var1), summarise, mean = mean(var2), sd = sd(var2))

編集への応答

をより正当に使用できるようになりましたplyr()。上記から学んだことを取り上げます。

x <- unique(foo)

プライヤーとの組み合わせ:

ddply(x, .(var1), summarise, n = length(var2), sum = sum(var2))

あなたが求めているものをあなたに与えるべきです。

于 2011-01-15T00:00:24.810 に答える
2

あなたの質問をよく理解しているといいのですが、試してみてください:

unique(foo)

質問が編集された後:

@Chaseと同じように書くのではなく、非常にシンプルだがエレガントではない解決策は次のとおりです。

foo$var12 <- paste(foo$var1, foo$var2, sep='|')      # the two variables combined to one
table(foo$var12)                                     # and showing its frequencies

そして出力はもちろんテーブルです:

 1|1 2|1 2|2 3|1 3|2 4|2 4|3 
   2   2   2   2   3   2   2 
于 2011-01-14T23:53:13.977 に答える
1

答えはあなたが述べているものとは異なりますが、私はあなたの答えを信頼するよりも自分のコードを信頼しており、変数に「合計」という名前を付けるという罪を犯すことはできません。

 newfoo <- data.frame(
                 var1=unique(foo$var1),
                 n = with(foo, tapply(var2, var1, length) ),
                 svar = with(foo, tapply(var2, var1, sum) ) )
 newfoo
#  var1 n svar
#1    1 2    2
#2    2 4    6
#3    3 5    8
#4    4 4   10

編集: (チェイス私に何を言おうとしたのか最初はわからなかった。)

newfoo <- data.frame(
                  var1=unique(unique(foo)$var1),
                  n = with(unique(foo), tapply(var2, var1, length) ),
                  svar = with(unique(foo), tapply(var2, var1, sum) ) )

> newfoo
  var1 n svar
1    1 1    1
2    2 2    3
3    3 2    3
4    4 2    5
于 2011-01-15T01:45:26.750 に答える