非常に新しいので、これがあまりにも多くを求めているかどうか私に知らせてください。パネルデータをRで2つの異なるカテゴリにサブセット化しようとしています。1つは変数の完全な情報を持ち、もう1つは変数の不完全な情報を持っています。私のデータは次のようになります。
Person Year Income Age Sex
1 2003 1500 15 1
1 2004 1700 16 1
1 2005 2000 17 1
2 2003 1400 25 0
2 2004 1900 26 0
2 2005 2000 27 0
私がする必要があるのは、各列(列1と2ではない)を調べることです。データが変数のデータでいっぱいの場合(変数は最初の列のIDで定義され、次に列名で定義されます。上の図の例は次のとおりです。 person1Income)それをデータセットに返します。それ以外の場合は、別のデータセットに入れます。これが私のメタコードと、上記のデータを前提として実行する必要のある例です。注:変数をID名、次に列名で呼び出します。たとえば、変数person1Incomeは、列3の最初の3行になります。
for(each variable in all columns except 1 and 2 in data set) if (variable = FULL) { return to data set "completes" }
else {put in data set "incompletes"}
completes = person1Income, person2Income, person1Age, person2Age, person1Sex, person2 sex
incompletes = {empty because the above info is full}
誰かがこの質問に完全に答えることができないかどうかはわかりますが、助けていただければ幸いです。また、私の目標が明確でない場合は、私に知らせてください。私は明確にするよう努めます。
tl;drまだ一文で説明できないので...ごめんなさい。
編集:完全な変数と不完全な変数の意味を視覚化します。スクリーンショット