私は長い形式の縦断調査を使用しており、個人が 25 歳までに大学の学位を取得していない場合のダミー変数を作成しようとしています。私のデータは次のようになります。
ID CYRB VAR VALUE
1 1983 DEG98 1
1 1983 DEG00 1
1 1983 DEG02 1
1 1983 DEG04 0
2 1979 DEG08 0
2 1979 DEG00 0
2 1979 DEG02 1
2 1979 DEG04 1
3 1978 DEG98 NA
3 1978 DEG00 NA
3 1978 DEG02 NA
3 1978 DEG04 0
説明しようとしたように、関連する年の調査回答にはかなりの数の欠落データ ポイントがあります。しかし、回答者が後年「いいえ」と答えた場合、25 歳未満のときに学位を取得していなかったことが推測できます。
できるだけ一般的になるように努めますが、ID = 1、2、3 など、1 人の個人のすべての変数値に依存する新しい変数を作成するにはどうすればよいですか?
わかりにくかったらすいません!
編集:
申し訳ありませんが、データは以前はワイド形式で、変数は回答者が 1998 年、2000 年、2002 年などに大学の学位を取得しているかどうかを示していました (値は応答を示す 1 == TRUE、0 == FALSE)、CYRB は実際、生年月日、目的のダミー変数の期待される出力用に編集されたテーブルは次のようになります。
ID CYRB VAR VALUE DUMMY
1 1983 DEG98 0 0
1 1983 DEG00 0 0
1 1983 DEG02 0 0
1 1983 DEG04 1 0
2 1979 DEG08 0 0
2 1979 DEG00 0 0
2 1979 DEG02 1 0
2 1979 DEG04 1 0
3 1978 DEG98 NA 1
3 1978 DEG00 NA 1
3 1978 DEG02 NA 1
3 1978 DEG04 0 1
つまり、回答者が 25 歳以降の調査で大学の学位を持っていないと回答した場合、ダミーの値は 1 になります。
これが少し明確であることを願っています。