2

連続変数とnレベルの因子を持つデータセットがあります。

各レベルの経験的累積分布関数と、各パネルの全体的な ecdf を個別にプロットしたいと思います。ポイントは、サブセット (レベル) の ecdf を全体 (完全なデータ セット) と比較することです。

各 ecdfs を 1 つのパネルにプロットするのは簡単です (例として「ダイヤモンド」データ セットを使用)。

ggplot(diamonds) + 
  stat_ecdf(aes(x=carat, colour = color)) + 
  stat_ecdf(aes(x=carat), lwd=1, linetype="dotted")

しかし、ファセット オプションを使用してレベルをパネルに分割しようとすると、

ggplot(diamonds) + 
  stat_ecdf(aes(x=carat, colour = color)) + 
  stat_ecdf(aes(x=carat), lwd=1, linetype="dotted") + 
  facet_wrap(~color, ncol=4)

サブセットの ecdf と全体的な ecdf (点線) を持つn 個のパネルの代わりに、各サブセットの ecdf を 2 回プロットします。

明らかな何かが欠けていると確信しています。他の誰かの質問と重複している場合は、関連する質問を教えてください。

4

1 に答える 1