次のようなデータセットがあり、月次パネルデータセットに拡張したいと思います。
ID | start_date | end_date | event_type |
1 | 01/01/97 | 08/01/98 | 1 |
2 | 02/01/97 | 10/01/97 | 1 |
3 | 01/01/96 | 12/01/04 | 2 |
一部のケースは他のケースよりも長持ちします。各日付から年を引き出して使用することにより、データを年次構成に拡張する方法を理解しました。
year <- ddply(df, c("ID"), summarize, year = seq(startyear, endyear))
に続く:
month <- ddply(year, c("ID"), summarize, month = seq(1, 12))
このアプローチの問題は、その月に正しい番号が割り当てられないことです。つまり、1月= 1であるため、最終的にマージしたいイベントデータセットではうまく機能しません。year
、、、ID
およびに一致しmonth
ます。助けていただければ幸いです。これが私が拡張しようとしているデータセット(.xls)への直接リンクです:http://db.tt/KeLRCzr9。十分な情報が含まれているといいのですが、他に必要な情報があれば教えてください。