これは些細なことだと思いますが、その方法がわかりません。
私は個人が存在するデータフレームを持っており、それぞれが複数のプロパティを持つことができ、各プロパティはいくつかの方法で分類されます。現在、それは長い形であり、レコードは次のように見えます(概略形式では、実際にはもう少し複雑です):
IndividualID Property PropClass
1 X A
1 Y B
2 X A
3 Y B
3 W C
3 Z A
私が欲しいのは、個々のIDごとに1つの行で、個々のIDと、その個人が元のファイルに持っている各プロパティとPropClassの列のペアです。この場合は次のようになります。
IndividualID Prop1 PropClass1 Prop2 PropClass2 Prop3 PropClass3
1 X A Y B NA NA
2 X A NA NA NA NA
3 Y B W C Z A
したがって、元のデータセット内のindividualIDの最大行数(大きくない約5)と同じ数のProp変数とPropClass変数が必要であり、元のデータセットの行数はその最大数よりも少なくなります。 、その個人にとって何の意味もない余分な列には、NAが含まれています。個人のProp変数とPropClass変数の順序は重要ではありません(ただし、長い形式のファイルの元の順序である場合もあります)。
明らかに、Propのすべての可能な値に対して1組のProp列とpropClass列がある場合、これを行うのは簡単です(たとえば、reshapeを使用)が、Propの可能な値は数百あるため、ファイルは巨大で役に立たなくなります。自分のやりたいことを簡単にやる方法がないなんて信じられませんが、一生懸命探しているように見えますが、見つけられませんでした。私はバカだと言ってください。もしそうなら、どうやってバカを治すことができるのでしょうか。