Rを使用した入院データの質問処理に関する提案を提供してくれてありがとう。この問題について追加の質問があります。実際、それはその質問の前のタスクであるはずです。
これで、次のようなデータセットができました。
Patient_ID Date Ward
P001 1 A
P001 2 A
P001 3 A
P001 4 A
P001 4 B
P001 5 B
P001 6 B
P001 7 B
P001 7 C
P001 8 B
P001 9 B
P001 10 B
私はそれを次のように変換する必要があります:
Patient_ID Date Ward
P001 1 A
P001 2 A
P001 3 A
P001 4 A;B
P001 5 B
P001 6 B
P001 7 B;C
P001 8 B
P001 9 B
P001 10 B
現在、私はそれを使用して変換しましたddply
、コードは以下に添付されています:
data <- ddply(data,
c("Patient_ID", "Date"),
function(df)
{data.frame(Ward=paste(unique(df[,"Ward"]),collapse=";"))
},
.progress="text"
)
unique(Patients_ID)
これで問題を解決できますが、データセットに8818と1861がある場合は、非常に遅くなります(P4 3.2マシンでは20分以上)unique(Date)
。どうすればそれを改善できますか?ありがとう!