1

私はニューメキシコ州の気候データを扱っており、R の初心者です。NA を手段に置き換えようとしていますが、私の df には 37 の異なるサイトがあります。DF$STATION.NAME (列 1) が一意である列の手段が必要です。ある場所のデータを使用して別の場所の平均を見つけることはできません...明らかに。したがって、実際には、各ステーションの各月の平均が必要です。

私のデータは、1 列目には station.name で縦に並べられ、次の列には 1 月から 12 月の測定値が表示され、最後 (右) に合計列が表示されます。測定値または観測値は、数年にわたる各月の各観測所に関するものです (観測所名は、新しい年ごとに新しい行にリストされています)。

NA を、指定された station.name 内の指定された月の CLDD の合計に置き換える必要があります。これを行うにはどうすればよいですか?

4

1 に答える 1

0

https://stats.stackexchange.com/でその質問をしてみてください( タグで示唆されているように)。おそらく、一般的なプログラミングサイトよりもRユーザーの方が多いでしょう。また、質問にタグを追加しました。

データをステーション月のサブセットに分割し、そこに欠落している値を埋めてから、それらを1つの大きなマトリックスに再アセンブルすることに何の問題もありません。

参照: Rの欠落値の平均または最頻値を置き換える

欠落値を平均、中央値、またはモードで埋める一般的な方法が一般的ですが、これにより分散が明らかに減少するため、結果が希薄になる可能性があることに注意してください。欠測値を補間できる理由と方法について強い物理的な議論がない限り、欠測値を直接処理できる方法を見つけることができれば、よりエレガントになります。

于 2012-09-19T06:04:56.880 に答える