役に立たない変数を取り除くためにデータフレームを改良しています。私が行った最初のステップは、次のコマンドを使用して、行の半分以上がNA値である列を削除することでした。
limit <- nrow(mydata)/2
mydata <- mydata[, which(as.numeric(colSums(!is.na(mydata))) > limit)]
ゼロについても同じことをするのを楽しみにしていますが、「is.zero()」のような関数が見つかりませんでした。どうすればよいですか?
私が楽しみにしているもう1つのことは、「制限」回数を超えて任意の値を繰り返す列を削除することです(そのようなコマンドが存在する場合は理想的です!)
どうもありがとう、