次の形式のデータがあります-
ID EVID ADMIT DC DRG CLIN_C PRIN_DX
1 AA 1/1/13 2/1/13 ABC 1A234 Y
1 AA 1/1/13 2/1/13 ABC 1B345 N
1 AA 1/1/13 2/1/13 ABC 1C234 N
1 AA 1/1/13 2/1/13 ABC 1234C N
1 BB 3/1/13 2/15/13 EEE C12C3 Y
1 BB 3/1/13 2/15/13 EEE 1B345 N
1 BB 3/1/13 2/15/13 EEE 1C234 N
1 BB 3/1/13 2/15/13 EEE 987D N
2 CC 3/1/13 2/15/13 EEE C12C3 Y
2 CC 3/1/13 2/15/13 EEE 546X N
2 CC 3/1/13 2/15/13 EEE 1C234 N
2 CC 3/1/13 2/15/13 EEE 1234C N
そして、次の形式のデータが必要です。
ID EVID ADMIT DC DRG PRIN_DX 1B345 1C234 1234C 987D 546X
1 AA 1/1/13 2/1/13 ABC 1A234 1 1 1 0 0
1 BB 3/1/13 2/15/13 EEE C12C3 1 1 0 1 0
2 CC 3/1/13 2/15/13 EEE C12C3 0 1 0 0 1
できればRでやりたいです。reshape/reshape2 を試しましたが、グループ化された行を処理する明らかな方法が見つかりません - グループ化された行を列に分割し、残りの行を集約します。
データは数百件の入院記録であり、妥当な大きさです。