r - データの複数のサブセットに対して R で分位数のテーブルを作成する

Question

データの複数のサブセットについて、 Rで変位値のテーブルを作成しようとしています。

現在、連続していないid ( p_ids) のベクトルが tableにあります。DATAの各値についてp_ids、分位点をリストしようとしています。

これまでのところ、次のバリエーションを試しました。

i <- 1
n <- 1

for (i in p_ids) {
    while(n <= nrow(data)) {
        quantiles[n] <- quantile(subset(alldata$variableA, alldata$variableB == i),
                                 probs = c(0,1,2,3)/3)
        n <- n + 1
    }
}

問題がインデックスのどこかにあることはわかっていますが、インデックスがどこにあるのかわかりません。提案？

score 0 · Accepted Answer

分位数を計算するために集計を使用することを検討する必要があります http://stat.ethz.ch/R-manual/R-devel/library/stats/html/aggregate.html

FUN=quantiles と by=p_ids を設定すると、必要なことが行われます。

それは私があなたの質問を誤解していない限りです。

score 0 · Accepted Answer

をご覧くださいcut()。例えば：

q <- cut(p_ids, 2) 
data.frame(P_id = p_ids, Bin = q)

2 番目の引数は、cut()必要なビンの数です。

r - データの複数のサブセットに対して R で分位数のテーブルを作成する

2 に答える 2

Related

Reference