コンテキスト:私が見る限り、R には、生存/イベント履歴分析のコンテキストでのデータ準備を容易にする一貫した機能がありません。
各個人 ( ) には、各エピソードid
の開始start.cp
時間 ( ) と終了時間 ( ) が示されています。stop.cp
さらに、1、2、...、ptvc.start_
の時変共変量 (TVC) のそれぞれについて、エピソードの開始時 ( ) と終了時( )がわかりtvc.stop_
ます。
私の例 (以下を参照) では、TVC の数は 2 ですが、通常、数はさまざまです (1 から p まで)。
例:
入力データ:
id start.cp stop.cp tvc.start1 tvc.start2 tvc.stop1 tvc.stop2
1 1 1 2 2 3 4 7
2 1 2 3 2 3 4 7
3 1 3 4 2 3 4 7
4 1 4 7 2 3 4 7
5 1 7 12 2 3 4 7
structure(list(id = c(1, 1, 1, 1, 1), start.cp = c(1, 2, 3, 4,
7), stop.cp = c(2, 3, 4, 7, 12), tvc.start1 = c(2, 2, 2, 2, 2
), tvc.start2 = c(3, 3, 3, 3, 3), tvc.stop1 = c(4, 4, 4, 4, 4
), tvc.stop2 = c(7, 7, 7, 7, 7)), .Names = c("id", "start.cp",
"stop.cp", "tvc.start1", "tvc.start2", "tvc.stop1", "tvc.stop2"),
row.names = c(NA, 5L), class = "data.frame")
TVC の名前はわかっています。つまり、この例では、次のことがわかっています。
tvc.start <- c("tvc.start1", "tvc.start2")
tvc.stop <- c("tvc.stop1", "tvc.stop2")
予想された結果:
id start.cp stop.cp tvc.start1 tvc.start2 tvc.stop1 tvc.stop2 tvc.d1 tvc.d2
1 1 1 2 2 3 4 7 0 0
2 1 2 3 2 3 4 7 1 0
3 1 3 4 2 3 4 7 1 0
4 1 4 7 2 3 4 7 0 1
5 1 7 12 2 3 4 7 0 1
structure(list(id = c(1, 1, 1, 1, 1), start.cp = c(1, 2, 3, 4,
7), stop.cp = c(2, 3, 4, 7, 12), tvc.start1 = c(2, 2, 2, 2, 2
), tvc.start2 = c(3, 3, 3, 3, 3), tvc.stop1 = c(4, 4, 4, 4, 4
), tvc.stop2 = c(7, 7, 7, 7, 7), tvc.d1 = c(0, 1, 1, 0, 0), tvc.d2 = c(0,
0, 0, 1, 1)), .Names = c("id", "start.cp", "stop.cp", "tvc.start1",
"tvc.start2", "tvc.stop1", "tvc.stop2", "tvc.d1", "tvc.d2"), row.names = c(NA,
5L), class = "data.frame")
質問: TVC ごとに、特定のエピソード (と で定義) が TVC の間隔にオーバーラップ (=1) していることを示す新しいベクトル ( tvc.d1
、 、例を参照)を作成したいと考えています。[ start.cp , stop.cp) . TVC のセットをループせずにこれを行うにはどうすればよいでしょうか。つまり、ベクトル化されたソリューションを探しています。tvc.d2
start.cp
stop.cp
PS:タイトルは自由に変更してください...