ggplot を使用して会社ごとの生産データをプロットし、ポイントの色を使用して年を指定しようとしています。次のグラフは、サンプル データに基づく例を示しています。
しかし、多くの場合、実際のデータには 50 ~ 60 の異なる会社が含まれているため、Y 軸の会社名がぎっしりとグループ化されており、あまり慎重に満足できるものではありません。
上位 5 社の情報 (2011 年数量でランク付け) のみのデータを表示し、残りを集計して「その他」として表示する最も簡単な方法は何ですか?
以下は、サンプル チャートを作成するために使用したサンプル データとコードです。
# create some sample data
c=c("AAA","BBB","CCC","DDD","EEE","FFF","GGG","HHH","III","JJJ")
q=c(1,2,3,4,5,6,7,8,9,10)
y=c(2010)
df1=data.frame(Company=c, Quantity=q, Year=y)
q=c(3,4,7,8,5,14,7,13,2,1)
y=c(2011)
df2=data.frame(Company=c, Quantity=q, Year=y)
df=rbind(df1, df2)
# create plot
p=ggplot(data=df,aes(Quantity,Company))+
geom_point(aes(color=factor(Year)),size=4)
p
私はブルートフォースアプローチの道を歩み始めましたが、おそらくこれを行うためのシンプルでエレガントな方法があり、それを学ぶ必要があると思いました. どんな援助でも大歓迎です。