わかりました、立て続けに 2 番目の R の質問です。
私のデータ:
Timestamp St_01 St_02 ...
1 2008-02-08 00:00:00 26.020 25.840 ...
2 2008-02-08 00:10:00 25.985 25.790 ...
3 2008-02-08 00:20:00 25.930 25.765 ...
4 2008-02-08 00:30:00 25.925 25.730 ...
5 2008-02-08 00:40:00 25.975 25.695 ...
...
ddply
基本的に、通常はとの組み合わせを使用してsummarize
アンサンブルを計算します (たとえば、1 年間の 1 時間ごとの平均)。
上記の場合、時間などのカテゴリを作成します (たとえばstrptime(data$Timestamp,"%H") -> data$hour
、そのカテゴリを で使用してddply
、ddply(data,"hour", summarize, St_01=mean(St_01), St_02=mean(St_02)...)
各列のカテゴリごとに平均化します。
しかし、ここで粘着性が生じます。処理する列が 40 を超えていますが、それらすべてをsummarize
関数のパラメーターとして 1 つずつ入力する準備ができていません。このコードを生成するためにシェルでループを書いていましたが、それはプログラマーが問題を解決する方法ではありませんか?
ですから、同じ結果をより少ないキーストロークで達成するためのより良い方法がある人はいますか?