別のR初心者の質問。
私は、生存分析を使用する必要があるプロジェクトに取り組んでいます。具体的には、離散単位の生存分析を使用する必要があります (したがって、DV が連続的であると仮定する Cox 回帰やその他の方法は問題外です)。
データセットを長い形式に変換しました。(STEP 1) 最後に変数 ("q") =1 を見つけて打ち切り DV ("dv") を作成する必要があります。(STEP 2) time+1 で "dv" を "0" として記録します。(STEP 3) time+2...n で「dv」を「NA」として再コーディングします。(STEP 4) "dv"=NA の場合のすべての観測 (行) を削除します。
これを行う前に、デフォルトで「1」に割り当てられている DV を作成する必要があるようです。ステップ 3 の後、私のデータは次のようになります。
id time q dv
1 1 1 1
1 2 0 1
1 3 1 1
1 4 0 0
1 5 0 NA
1 6 0 NA
2 1 1 1
2 2 1 1
2 3 0 0
2 4 0 NA
2 5 0 NA
2 6 0 NA
「q」は時間の経過とともに「0」または「1」の間で変化する可能性があることに注意してください (時間 = 2 での id=1 の観察を参照)。ただし、生存分析の性質上、「dv」は変化しません。私がする必要があるのは、「q」が「1」と「0」の間で変化する最後の時間を見つけ、それに応じて打ち切られる変数を作成することです。ステップ 4 の後、データは次のようになります。
id time q dv
1 1 1 1
1 2 0 1
1 3 1 1
1 4 0 0
2 1 1 1
2 2 1 1
2 3 0 0
可能な限りのすべての助けをありがとう!