これは、データを視覚的に表現するためのベスト プラクティスと、R/ggplot2 でプロットを描画する方法の両方に関する質問です。
ここで語られるストーリーをグラフィカルに表現する方法を見つけようとしています。
「2000 のテスト ケースがあり、そのうち 500 にエラーがありました。調査の結果、400 のテストが大規模で、1600 が小規模であることがわかりました。大規模なテストのうちエラーがあったのは 25 だけだったので、それらを脇に置き、1600 の小規模なテストを残しました。そのうち 475 にエラーがありました.その後、400 の Small テストが時計回りで、1200 が反時計回りであることがわかりました.Small Clockwise テストの 20 のみにエラーがあったため、それらを脇に置き、1200 の Small Counter-Clockwise テストを残しました。 455 にエラーがありました。」
つまり、テスト ケースを分類するためにカテゴリを使用しており、各カテゴリのエラーの割合が進行状況に応じてどのように変化するかを表現したいと考えています。
データを含むRは次のとおりです。
tests <- data.frame(n.all=c(2000,400,1600,400,1200),n.err=c(500,25,475,20,455),sep.1=as.factor(c("all","Big","Small","Small","Small")),sep.2=as.factor(c("all","all","all","Clockwise","Counter-Clockwise")))
この少量のデータでは、単純な数値テーブルが最適な選択かもしれません。話が続き、ますます多くの分離カテゴリが使用されているため、単純に数字をリストすることは最善の選択ではないと仮定しましょう。
このデータを表現するにはどうすればよいでしょうか? いくつかの可能性を考えることができます:
- 取り除かれた円のスライスを示す円グラフと、残っているエラーの内訳/エラーなし
- 棒グラフ、類似
- ミナードのナポレオンの進軍図のように、カテゴリを分離する「流れ」を示すリボン付きの棒グラフ
- 同様ですが、棒グラフは分数を縦ではなく横に示しています
4 つの方法はすべて、テスト ケースの絶対量が減少し、分離されたカテゴリのエラーの割合と残っているものを示しています。私は#4が一番好きだと思いますが、私は心を開いています。
この種のデータをどのように表現する必要がありますか? R/ggplot2 を使用して表現できますか?