r - Rで列を下ってデータのサブセットの標準偏差を計算する方法

Question

最初の観測から最後の観測まで、列の 4 つの値ごとの標準偏差を計算したいと思います。SD関数を移動するための多くの答えを見つけましたが、次のようにsd()、4つのデータ値ごとに計算し、データフレームの新しい列に答えを書き込むコード行が必要です:

サンプルデータ:

望ましい出力:

Obs Count SD
1   56    16.68
2   29    16.68
3   66    16.68
4   62    16.68
5   49    29.55
6   12    29.55
7   65    29.55
8   81    29.55
9   73    6.24
10  66    6.24
11  71    6.24
12  59    6.24

以下のコードを試しましたが、これは明らかに間違っています。

a <- for(i in 1: length(df)) sd(df$Count[i:(i+3)])

これは非常に簡単な作業のはずですが、答えを見つけることができませんでした。私はまだ学んでおり、助けていただければ幸いです。

score 7 · Accepted Answer

ベース R では、次を使用して「4 行ごと」のインデックスを作成できます。

(seq_len(nrow(mydf))-1) %/% 4
# [1] 0 0 0 0 1 1 1 1 2 2 2 2

それを使用aveして、目的の結果を得るために使用できます。

mydf$SD <- ave(mydf$Count, (seq_len(nrow(mydf))-1) %/% 4, FUN = sd)
mydf
#    Obs Count        SD
# 1    1    56 16.680827
# 2    2    29 16.680827
# 3    3    66 16.680827
# 4    4    62 16.680827
# 5    5    49 29.545163
# 6    6    12 29.545163
# 7    7    65 29.545163
# 8    8    81 29.545163
# 9    9    73  6.238322
# 10  10    66  6.238322
# 11  11    71  6.238322
# 12  12    59  6.238322

score 4 · Accepted Answer

別の方法はrollapply、zoo パッケージをと組み合わせて使用することrepです。

> library(zoo)
> N <- 4 # every four values
> SDs <- rollapply(df[,2], width=N, by=N, sd)
> df$SD <- rep(SDs, each=N)
> df
   Obs Count        SD
1    1    56 16.680827
2    2    29 16.680827
3    3    66 16.680827
4    4    62 16.680827
5    5    49 29.545163
6    6    12 29.545163
7    7    65 29.545163
8    8    81 29.545163
9    9    73  6.238322
10  10    66  6.238322
11  11    71  6.238322
12  12    59  6.238322

すべてを一度に取得したい場合があります。

df$SD <- rep( rollapply(df[,2], width=N, by=N, sd), each=N)

score 2 · Accepted Answer

これはより速く見えます（私は厳しいテストをしませんでした）：

# mydf = your data
idxs = rep(1:nrow(mydf), each = 4, length = nrow(mydf))

mydf = within(mydf, {
  Sd = rep(tapply(Count, idxs, sd), each = 4)
})
print(mydf)

r - Rで列を下ってデータのサブセットの標準偏差を計算する方法

3 に答える 3

Related

Reference