var_1
非常に大きなデータセット (ほぼ 1 テラバイト) で1 つの変数 ( と呼びます) を合計しようとしているとします。データセットは長くて広いです。私のコードは次のようになります。
PROC MEANS DATA=my_big_dataset SUM;
VAR var_1;
RUN;
KEEP
読み取り中のデータセットでオプションを使用すると、パフォーマンスが向上しますか? あれは:
PROC MEANS DATA=my_big_dataset (KEEP=var_1) SUM;
VAR var_1;
RUN;
ディスク I/O に関しては、何があっても各レコードを完全に読み取る必要があると思います。ただし、レコードを読み取るために割り当てる必要があるメモリはおそらく少なくなります。アドバイスをいただければ幸いです。