r - R の標準偏差に基づくサブセット化

翻译自：https://stackoverflow.com/questions/19549766 2013-10-23T18:38:15.163

4390 次

行である各観測の変数の列で構成されるデータフレームがあります。不要な観測を削除するには、このデータをトリミングする必要があります。

私が通常これを行う方法 -

trimmed_stats <- ddply(.data = data, .(pos), subset,
                       !AvgGFP > 100 &
                       !AvgRFP > 60 &
                       !Area < 220 &
                       !Area > 2000 &
                       !DeviationsRFP > 20 &
                       !DeviationGFP > 20)

...基本的に、特定の基準を満たさないデータを削除します。

ただし、複数のデータセットを見ている場合、これらの特定の数値はセットごとに異なります。

私がやりたいことは、平均からの標準偏差を使用して「トリミング」を実行することです。

たとえば、観測ごとに 1 つの変数を持つ単純なデータフレームを考えてみましょう。

p <- data.frame(obs = c(1:1000), var1 = rnorm(1000, 0 , 5))
sd(p[,2])
[1] 4.91213

したがって、1 標準偏差は 4.91213 です。var1 が平均の 1 標準偏差内にないすべての行を削除するにはどうすればよいですか?

r - R の標準偏差に基づくサブセット化

3 に答える 3

Related

Reference