ベクトルのサブセットの平均と分散を計算する必要があります。をベクトルx
とy
し、観測がサブセット内にあるかどうかの指標とします。どちらがより効率的ですか:
sub.mean <- mean(x[y])
sub.var <- var(x[y])
また
sub <- x[y]
sub.mean <- mean(sub)
sub.var <- var(sub)
sub <- NULL
最初のアプローチでは、新しいオブジェクトを明示的に作成しません。しかし、呼び出しをmean
行い、var
それを暗黙的に行いますか? それとも、保存されている元のベクトルで機能しますか?
サブセット化を2回行う必要がないため、2番目の方が高速ですか?
大規模なデータセットの速度とメモリ管理に関心があります。