個人の口座残高と婚姻状況 (既婚、未婚、離婚) を含むテーブルがあります。ggplot()
各婚姻状況のバランスを一度にプロットするにはどうすればよいですか?
私の現在の方法はあまり効率的ではありません:
married <- subset(bank[,c("marital","balance")], marital == "married")
質問をより具体的にすることができます。データをどの程度正確に表示したいですか? とにかく、ここにいくつかの可能性があります。うまくいけば、それらのいずれかを目的に使用できます。
# load packages
pkgs2load <- c("data.table", "ggplot2", "data.table")
sapply(pkgs2load, require, character.only=TRUE)
# generate sample data
N <- 1e4
dt <- data.table(balance = runif(N, 0, 1e6),
status = sample(c("married", "unmarried", "divorced"), N, replace=TRUE))
# plots
ggplot(dt, aes(status, balance)) + stat_summary(fun.data = "mean_cl_boot")
ggplot(dt, aes(status, balance)) + geom_jitter()
ggplot(dt, aes(factor(0), balance, color=status)) + geom_jitter() +
scale_x_discrete(name="", breaks=NULL)