入院日と退院日を含むデータがいくつかあります。(各人および入院 ID 番号ごとに)、入院と退院の間のシーケンスで人を含む幅広から長さのデータフレームを作成し、ID を許可する必要があります。入院と退院を含むその間の毎日の値を示します。
dlply が作成するリスト内の項目に名前を付ける方法を利用して、これを行う非常にハック的な方法に出くわしました。ただし、エラーが発生しやすいのではないかと心配しています。いずれにせよ、これはぎこちなく感じます。より少ないコードでこれを行うためのよりクリーンな方法があるのではないかと思います。
person <- c(1, 2, 3, 3)
admit <- c(1, 1, 1, 2)
admit.date <- as.Date(c("1/1/2010", "1/1/2010", "1/1/2010", "2/1/2010"), "%m/%d/%Y")
discharge.date <- as.Date(c("1/1/2010", "1/1/2010", "1/1/2010", "2/1/2010"), "%m/%d/%Y") + c(1,2,2,2)
df1 <- data.frame(person, admit, admit.date, discharge.date)
df1 ## where I start
library(plyr)
los_seq <- function(df) { seq(df$admit.date, df$discharge.date, 1)}
lst1 <- dlply(df1, .(person, admit), los_seq)
vec1 <- unlist(lst1)
## now it gets really hackish
df2 <- data.frame(v1 = paste(names(vec1), vec1, sep="__"))
df2$person <- substr(df2$v1, 1, regexpr("\\.", df2$v1)-1)
df2$admit <- substr(df2$v1, regexpr("\\.", df2$v1)+1, regexpr("\\.", df2$v1)+1)
df2$date <- as.Date(as.numeric(substr(df2$v1, regexpr("__", df2$v1)+2, nchar(df2$v1))), origin="1970-01-01")
df2[,-1] ## this is how I need the result to look