4

これ欲しい:

カテゴリ名として NA を含む箱ひげ図

そしてna.action=na.pass、boxplot に渡すと、グループ名に NA が表示されると思いました。サンプルコードは次のとおりです。

#Build a fake dataset
set.seed(212012)
nn = 100
sample_data <- data.frame( score = c( rpois(nn, 1), rpois(nn, 2),
                                      rpois(nn, 1.5), rpois(nn, 3)),
                          category = c( rep(0, nn), rep(1, nn), 
                                        rep(2, nn), rep(NA, nn) ))   

boxplot( score ~ category, data=sample_data, na.action=na.pass )

しかし、それはこれを生成します:

ここに画像の説明を入力

私が望むものを取得する「簡単な」方法は次のコードですが、探索的データ分析には適していません。

sample_data$category2 <- sample_data$category
sample_data$category2[ is.na(sample_data$category) ] <- 'NA'
boxplot( score ~ category2, data=sample_data )

そこにいる R Guru からのヒントはありますか? このより一般的な議論から、na.pass について知ることができました。また、na.pass の起源については、Ripley 教授からここで聞くことができました。しかし、因子によって分割されるデータに現れる欠損データ (NA) と、因子自体の欠損データとの間に区別はないようです。何か単純なものが欠けているのでしょうか、それともこれは機能リクエストのようなものですか?

4

1 に答える 1

7

boxplot( score ~ factor(category,exclude=NULL), data=sample_data)

デフォルトの因子動作はexclude=NAです。まだ要因になっていない場合、呼び出しの内部はboxplot呼び出しであると思います。factorこれは、因数分解に NA 値を含めることを強制しているだけです。

于 2012-02-01T18:27:04.520 に答える