空白の欠損値と NA の両方を含む大きなデータ フレームがあります。summary(factor(df$col)) を実行すると、次のような結果が得られます
A
123
B
50000
90000
C
26000
NA's
12476
( の後の空白に注意してください50000
。)
とsum(is.na(df$col))
は の数と同じ 12476 ですNA
が、空白と s の合計にしたいと思いNA
ます。
And then
try を実行して空白のレベルを作成しようとしましたが、が生成されたと表示されますが、出力は同じです。因子レベルに基づいて NA を作成する方法を知っている人、または欠落している値を置き換えるためのより良い解決策を知っている人はいますか? 問題は、空白が複数の空白文字であるため、に変換されなかった可能性があると思いますが、それを確認する方法がわかりません。
levels(df$col) <- c("A", "B", "Blank", "C")
df$col <- factor(df$col, exclude="Blank")
NA
NA