これ欲しい:
そしてna.action=na.pass
、boxplot に渡すと、グループ名に NA が表示されると思いました。サンプルコードは次のとおりです。
#Build a fake dataset
set.seed(212012)
nn = 100
sample_data <- data.frame( score = c( rpois(nn, 1), rpois(nn, 2),
rpois(nn, 1.5), rpois(nn, 3)),
category = c( rep(0, nn), rep(1, nn),
rep(2, nn), rep(NA, nn) ))
boxplot( score ~ category, data=sample_data, na.action=na.pass )
しかし、それはこれを生成します:
私が望むものを取得する「簡単な」方法は次のコードですが、探索的データ分析には適していません。
sample_data$category2 <- sample_data$category
sample_data$category2[ is.na(sample_data$category) ] <- 'NA'
boxplot( score ~ category2, data=sample_data )
そこにいる R Guru からのヒントはありますか? このより一般的な議論から、na.pass について知ることができました。また、na.pass の起源については、Ripley 教授からここで聞くことができました。しかし、因子によって分割されるデータに現れる欠損データ (NA) と、因子自体の欠損データとの間に区別はないようです。何か単純なものが欠けているのでしょうか、それともこれは機能リクエストのようなものですか?