連続変数とnレベルの因子を持つデータセットがあります。
各レベルの経験的累積分布関数と、各パネルの全体的な ecdf を個別にプロットしたいと思います。ポイントは、サブセット (レベル) の ecdf を全体 (完全なデータ セット) と比較することです。
各 ecdfs を 1 つのパネルにプロットするのは簡単です (例として「ダイヤモンド」データ セットを使用)。
ggplot(diamonds) +
stat_ecdf(aes(x=carat, colour = color)) +
stat_ecdf(aes(x=carat), lwd=1, linetype="dotted")
しかし、ファセット オプションを使用してレベルをパネルに分割しようとすると、
ggplot(diamonds) +
stat_ecdf(aes(x=carat, colour = color)) +
stat_ecdf(aes(x=carat), lwd=1, linetype="dotted") +
facet_wrap(~color, ncol=4)
サブセットの ecdf と全体的な ecdf (点線) を持つn 個のパネルの代わりに、各サブセットの ecdf を 2 回プロットします。
明らかな何かが欠けていると確信しています。他の誰かの質問と重複している場合は、関連する質問を教えてください。