0

データの複数のサブセットについて、 Rで変位値のテーブルを作成しようとしています。

現在、連続していないid ( p_ids) のベクトルが tableにあります。DATAの各値についてp_ids、分位点をリストしようとしています。

これまでのところ、次のバリエーションを試しました。

i <- 1
n <- 1

for (i in p_ids) {
    while(n <= nrow(data)) {
        quantiles[n] <- quantile(subset(alldata$variableA, alldata$variableB == i),
                                 probs = c(0,1,2,3)/3)
        n <- n + 1
    }
}

問題がインデックスのどこかにあることはわかっていますが、インデックスがどこにあるのかわかりません。提案?

4

2 に答える 2

0

分位数を計算するために集計を使用することを検討する必要があります http://stat.ethz.ch/R-manual/R-devel/library/stats/html/aggregate.html

FUN=quantiles と by=p_ids を設定すると、必要なことが行われます。

それは私があなたの質問を誤解していない限りです。

于 2012-07-06T21:23:04.373 に答える
0

をご覧くださいcut()。例えば:

q <- cut(p_ids, 2) 
data.frame(P_id = p_ids, Bin = q)

2 番目の引数は、cut()必要なビンの数です。

于 2012-07-06T21:46:12.447 に答える