私はRを初めて使用します。時間の断面である、1つの主要な変数を持つ比較パネルデータセットを使用しているため、その期間のすべての変数を平均化する必要があります。
データの形式は次のとおりです。行は国の観測値、列は可変年です。
私はこの例を作成しました:
cname<- c("ARGENTINA", "BOLIVIA", "CHILE", "CHINA", "ECUADOR", "EGYPT")
gdp2003<- c(1.5, 2.3, 5.2, 12, 2.3, 3.3)
gdp2004<- c(1.7, 2.2, 4.7, 13.3, 1.7, 1.5)
corrupt2003<- c(5.1, 6.7, 3.4, 5.5, 4.5, 8.7)
corrupt2004<- c(4.5, 5.4, 2.4, 4.5, 5.4, 8.9)
df<- data.frame(cbind(cname, gdp2003, gdp2004, corrupt2003, corrupt2004))
df
これはこの出力を生成します:
cname gdp2003 gdp2004 corrupt2003 corrupt2004
1 ARGENTINA 1.5 1.7 5.1 4.5
2 BOLIVIA 2.3 2.2 6.7 5.4
3 CHILE 5.2 4.7 3.4 2.4
4 CHINA 12 13.3 5.5 4.5
5 ECUADOR 2.3 1.7 4.5 5.4
6 EGYPT 3.3 1.5 8.7 8.9
次のように、国別の列変数を平均化できる関数を作成したいと思います。
cname gdp2003 gdp2004 corrupt2003 corrupt2004 new.col.gdp new.col.corrupt
1 ARGENTINA 1.5 1.7 5.1 4.5 1.6 4.8
2 BOLIVIA 2.3 2.2 6.7 5.4 2.25 6.05
3 CHILE 5.2 4.7 3.4 2.4 4.95 2.9
4 CHINA 12 13.3 5.5 4.5 12.65 5
5 ECUADOR 2.3 1.7 4.5 5.4 2 4.95
6 EGYPT 3.3 1.5 8.7 8.9 2.4 8.8
どんな助けでもいただければ幸いです。