私の目標は、収入などのさまざまな社会経済的要因の分布を複数年にわたって比較して、たとえば 5 年間で特定の地域の人口がどのように変化したかを確認することです。この一次データは、Public Use Microdata Sampleから取得されます。R
+ggplot2
を優先ツールとして使用しています。
2 年間分のデータ (2005 年と 2010 年) を比較すると、2 つのデータ フレームがhh2005
ありhh2010
、2 年間の世帯データがあります。2 年間の収入データは、hincp
両方のデータ フレームの変数に格納されます。を使用しggplot2
て、次のように個々の年の密度プロットを作成します (2010 年の例)。
p1 <- ggplot(data = hh2010, aes(x=hincp))+
geom_density()+
labs(title = "Distribution of income for 2010")+
labs(y="Density")+
labs(x="Household Income")
p1
このプロットに 2005 年の密度を重ねるにはどうすればよいですか? 先に進む方法がわからないためdata
、読み込んだとは言えません。hh2010
最初から根本的に異なる方法でデータを処理する必要がありますか?