行である各観測の変数の列で構成されるデータ フレームがあります。不要な観測を削除するには、このデータをトリミングする必要があります。
私が通常これを行う方法 -
trimmed_stats <- ddply(.data = data, .(pos), subset,
!AvgGFP > 100 &
!AvgRFP > 60 &
!Area < 220 &
!Area > 2000 &
!DeviationsRFP > 20 &
!DeviationGFP > 20)
...基本的に、特定の基準を満たさないデータを削除します。
ただし、複数のデータ セットを見ている場合、これらの特定の数値はセットごとに異なります。
私がやりたいことは、平均からの標準偏差を使用して「トリミング」を実行することです。
たとえば、観測ごとに 1 つの変数を持つ単純なデータ フレームを考えてみましょう。
p <- data.frame(obs = c(1:1000), var1 = rnorm(1000, 0 , 5))
sd(p[,2])
[1] 4.91213
したがって、1 標準偏差は 4.91213 です。var1 が平均の 1 標準偏差内にないすべての行を削除するにはどうすればよいですか?