カウント データから R でバイオリン プロットを作成しようとしています。私が使用するデータは、各ソースの各サンプルで見つかった多数の変異です。
次のようになります。
2 Source1
8 Source2
0 Source1
1 Source1
9 Source2
...
以下のコードを使用して、いくつかのプロットを作成しました。
ggplot(df_combined, aes(factor(names), y=mutations)) +
geom_violin() +
geom_boxplot(width=.1, outlier.size=0, fill="grey50") +
stat_summary(fun.y=median, geom="point", fill="white", shape=21, size=4) +
xlab("Source") +
ylab("Number of mutations") +
theme(axis.text = element_text(colour = "black"))`
それらのほとんどは問題なく表示されますが、一部は「ぐらつき」始めます (説明できる最善の方法です) 動作しない例を次に示します。
これは、データが離散的で連続的ではないためだと思いますが、バイオリン プロットでこれを変更する方法が見つかりません。これをggplot2とgeom_violinで動作させる方法はありますか?
以下のデータ:
structure(list(mutations = c(6, 6, 6, 6, 6, 6), names = structure(c(1L, 1L, 1L, 1L, 1L,
1L), .Label = c("1kG", "CG"), class = "factor")), .Names = c("mutations", "names"),
row.names = c(NA, 6L), class = "data.frame")