製造ユニットの一意のID、それらの出力の産業分類(CAT)、および各ユニットが雇用する人数(EMP)を含むデータセットがあります。EMPはCATによって異なることをグラフで示したいと思います。つまり、一般的に雇用規模は、ユニットが生成する出力の種類によって異なります。EMPの中央値で整理された箱ひげ図を試しました。
a = read.csv("/filepath/plot.csv", header=T, stringsAsFactors=F)
bymedian = with(a, reorder(CAT, log(as.numeric(as.character(EMP))), median))
boxplot(log(EMP) ~ bymedian, data=a, horizontal=F, notch=T, pch=1, cex=.25, col="gray95", boxwex=.25, las=2, outline=F)
pch=1, cex=.25, col="gray95", boxwex=.25, las=2, outline=F)
問題は、カテゴリの数が多い(400以上)ため、プロットが非常に乱雑になることです。私がやろうとしていることを示すためのよりクリーンな方法はありますか?