データのヒストグラムをプロットしてその分布を示したいのですが、ほとんどの値と比較して非常に高い外れ値がいくつかあり、それらは < 1.00 です。グラフの左端に 1 本または 2 本のバーをくしゃくしゃにして、右端まで何も表示しないのではなく、外れ値以外のすべてを含むヒストグラムを作成し、最後にバーを追加して、ラベルがその下に ">100%" があります。次のように geom_bar() を使用して ggplot2 でそれを行うことができます。
X <- c(rnorm(1000, mean = 0.5, sd = 0.2),
rnorm(10, mean = 10, sd = 0.5))
Data <- data.frame(table(cut(X, breaks=c(seq(0,1, by=0.05), max(X)))))
library(ggplot2)
ggplot(Data, aes(x = Var1, y = Freq)) + geom_bar(stat = "identity") +
scale_x_discrete(labels = paste0(c(seq(5,100, by = 5), ">100"), "%"))
問題は、私がこれを必要とするサイズでは、ラベルが重なってしまうか、読みやすくするために斜めにプロットする必要があることです。すべてのバーにラベルを付ける必要はありません。いずれかの方法はありますか
- A) これを geom_bar() 以外の別の方法でプロットして、最後のバーを手動で追加したり、追加したりする必要がないようにします。
- B) 一部のバーにのみラベルを付けますか?