23

次のようなグラフィックを作成したいと思います。

ここに画像の説明を入力

私の元のデータセットは次のようになります。

> bb[sample(nrow(bb), 20), ]
      IMG QUANT FIX
25663   1     1   0
7936    2     2   0
23586   3     2   0
23017   2     2   1
31363   1     3   1
7886    2     2   0
23819   3     3   1
29838   2     2   1
8169    2     3   1
9870    2     3   0
31440   2     1   0
35564   3     1   0
24066   1     2   0
12020   3     2   0
6742    3     2   0
6189    2     3   0
26692   2     3   0
1387    3     2   0
31839   2     3   1
28637   3     2   0

したがって、バーはFIX = 1因子ごとQUANTおよび因子ごとに表示されるという考え方ですIMG

を使用して、データセットをパーセンテージに集計しましたplyr

library(plyr)
bb.perc <- ddply(bb,.(QUANT,IMG),summarise,FIX.PROP = sum(FIX) / length(FIX))

それはほとんど正しいことをします:

  QUANT IMG   FIX.PROP
1     1   1 0.52439024
2     1   2 0.19085366
3     1   3 0.13658537
4     2   1 0.20414201
5     2   2 0.53964497
6     2   3 0.09585799
7     3   1 0.29000000
8     3   2 0.13000000
9     3   3 0.40705882

しかし、グラフを作成すると、FIX==0ケースが考慮されません。つまり、すべてのバーが同じ高さ、つまり 100% になります。これは私が望んでいるものではありません。個々の QUANT サブフレームの合計が 100% にならないことに注意してください。

> sum(bb.perc[1:3,]$FIX.PROP)
[1] 0.8518293
> sum(bb.perc[4:6,]$FIX.PROP)
[1] 0.839645
> sum(bb.perc[7:9,]$FIX.PROP)
[1] 0.8270588

R でできる最善のことは、カウントを表示することです。

# Take only the positive samples
bb.pos <- bb[bb$FIX == 1,]
# Plot the counts
ggplot(bb,aes(factor(QUANT),fill=factor(IMG))) + geom_bar() +
  scale_y_continuous(labels=percent)

そして、結果は次のとおりです。 ここに画像の説明を入力 これも私が望むものではありません:

  • パーセンテージスケールはかなり外れています。関数に 100% ポイントを渡す方法が必要ですが、方法が percentわかりません。
  • ラベルがありません。

すでに SO に関する同様の質問が多数ありますが、特定の問題の解決策を推定するのに十分な量の知性 (または R の理解) が不足しているようです。

ご指摘ありがとうございます。

編集: Sven Hohenstein は既に回答を提供していますが、これが私が最終的に自分で行った方法です:

> ggplot(bb.perc,aes(x=factor(QUANT),y=FIX.PROP,label=paste(round(FIX.PROP*100),
     "%"),fill=factor(IMG)))+ geom_bar(stat="identity") + geom_text(position="stack",
     aes(ymax=1),vjust=5) + scale_y_continuous(labels = percent)

を使用しbb.percてさらに定義した を使用しplyrます。これには、パーセンテージがグローバルではなく、列ごとにローカルに計算されるという利点があります。

助けてくれてありがとう。次の 2 つの質問とそれぞれの回答は、正しく理解するのに大いに役立ちました。

ggplot2 を使用した積み上げ棒グラフ ラベル

ggplot 棒グラフにラベルを追加する

私が最初に間違っていたのは、position = "fill"パラメータを に渡すことでしたgeom_bar()。これにより、何らかの理由ですべてのバーが同じ高さになりました!

4

1 に答える 1

24

これは、プロットを生成する方法です。

ggplot(bb[bb$FIX == 1, ],aes(x = factor(QUANT), fill = factor(IMG), 
                             y = (..count..)/sum(..count..))) +
 geom_bar() +
 stat_bin(geom = "text",
          aes(label = paste(round((..count..)/sum(..count..)*100), "%")),
          vjust = 5) +
 scale_y_continuous(labels = percent)

パラメータの値を変更してvjust、ラベルの垂直位置を調整します。

ここに画像の説明を入力

于 2012-09-12T11:13:55.707 に答える