3

製造ユニットの一意のID、それらの出力の産業分類(CAT)、および各ユニットが雇用する人数(EMP)を含むデータセットがあります。EMPはCATによって異なることをグラフで示したいと思います。つまり、一般的に雇用規模は、ユニットが生成する出力の種類によって異なります。EMPの中央値で整理された箱ひげ図を試しました。

a = read.csv("/filepath/plot.csv", header=T, stringsAsFactors=F)
bymedian = with(a, reorder(CAT, log(as.numeric(as.character(EMP))), median))
boxplot(log(EMP) ~ bymedian, data=a, horizontal=F, notch=T, pch=1, cex=.25, col="gray95", boxwex=.25, las=2, outline=F)
pch=1, cex=.25, col="gray95", boxwex=.25, las=2, outline=F)

問題は、カテゴリの数が多い(400以上)ため、プロットが非常に乱雑になることです。私がやろうとしていることを示すためのよりクリーンな方法はありますか?

4

1 に答える 1

3

あなたを使用しggplot2て、あなたが何をしようとしているのかを示すことができますscale_x_discrete

ここに画像の説明を入力してください

library(ggplot2)
a$bymedian = with(a, reorder(CAT, log(EMP), median))
p <- ggplot(a,aes(y=log(EMP),x=bymedian))+
     geom_boxplot()

breaks <- levels(a$bymedian)[seq(1,nlevels(a$bymedian),20)]
p %+% scale_x_discrete(breaks = breaks,  labels = breaks)
于 2013-01-11T08:01:53.097 に答える