次のコードを使用して、データベースから特定の行を削除しました。
df2 <- df1[!(df1$variable==1), ]
これはダミー変数であり、その特定のダミー変数の値が 1 である行は正常に削除されました。(前後に「dim」機能を使用してデータベースのサイズを確認しましたが、すべて正常に見えました。)
しかし、今回は新しいデータ セット「df2」を使用して回帰モデルを実行したところ、自由度が急激に低下したことがわかりました。これは、削除された行の数をはるかに超えていました!
どうしてこうなったのだろうと思いました。その後、新しいデータセットには、NA のみを持つ行が多数あることに気付きました。確率変数に欠損値がある各行で、R は NA 値の完全な行を作成しました。
上記のコードが行を削除する最良の方法ではないことに気付いた後、次のことを試しました。
df2 <- df1[(df1$variable==0 | is.na(df1$variable)), ]
私はもう同じ問題を抱えていないので、うまくいったようです。しかし、上記の新しいコードには、私が今のところ気付いていない (類似またはその他の) 問題がある可能性があると思いますか?