2

現在、大量のデータをパネルデータに結合する際に問題があります。「より小さな」ソリューションに役立つこのソリューションを見つけました:パネルデータですが、これを「より大きな」フォーマットに適用することはできません。

コーディング例を作成してみます: パッケージ 'datasets' から:

df_1 = WorldPhones # In my case, years 2000-2014 and 43 columns (districts)
df_2 = WorldPhones # In my case, there is different data here
df_3 = WorldPhones # ""
df_4 = WorldPhones # ""

各データ フレームには、43 の地区ごとに異なる値が含まれています。すべての地区に一意の ID (1 ~ 43) を割り当てました。43 の地区は、データ セット WorldPhones で指定された 7 つの地域 (大陸) に匹敵します。すべてのデータフレームには、地区ごとおよび年ごとに 1 つの変数のみが含まれます。df_1 に変数 X1 が含まれ、df_2 に X2 が含まれているとします。このデータを「長い」形式にしたいのですが、次のように考えてください。

Id  Year  X1     X2    X3   ...
1   1951  45939  21574 2876  
1   1956  60423  29990 4708 
1   1957  64721  32510 5230 
1   1958  68484  35218 6662 
1   1959  71799  37598 6856 
1   1960  76036  40341 8220
1   1961  79831  43173 9053 
2   1951  45939  21574 2876  
2   1956  60423  29990 4708 
2   1957  64721  32510 5230 
2   1958  68484  35218 6662 
2   1959  71799  37598 6856 
2   1960  76036  40341 8220
2   1961  79831  43173 9053 
...
43  1951  45939  21574 2876  
43  1956  60423  29990 4708 
43  1957  64721  32510 5230 
43  1958  68484  35218 6662 
43  1959  71799  37598 6856 
43  1960  76036  40341 8220
43  1961  79831  43173 9053 

残念ながら、43回「それを書き留める」という「ブルートフォース」を除いて、これを行う方法は本当にわかりません。

4

1 に答える 1