私がやろうとしているのは、MICE からの 5 つの帰属データセットに 5 つのカプラン マイヤー曲線を当てはめることです。私が目指しているのは、すべての時点で、5 つの生存確率の平均を取ることです。各 KM 曲線を構成するステップ関数の正確な形式があれば簡単だと思いますが、それを抽出する方法がわかりません。
これが私が実行するコードの例です
#make up data
survival_time=rexp(10,3)
dead=sample(c(0,1),10,replace=TRUE)
gender=sample(c(0,1),10,replace=TRUE)
#induce missingness in gender
gender[3:5]=NA
data=cbind(survival_time,dead,gender)
#do imputation
imp=mice(data)
#fit KM curves on each of the imputed datasets
km_fit=with(imp,survfit(Surv(survival_time,dead)~gender))
#now break down each km curve into male and female
#and average the surv prob at each time
#but how?
課題は、生存時間と死亡指標が常に固定されていることですが、各性別の量は帰属間で変化します. このため、各グループの数、したがってイベントの数と時間は代入間で変化します。
私の計画は、ステップ関数を取得できると仮定すると、ステップ関数で apply predict を使用して平均を取得することです。これが最善の解決策ですか、それとももっと良い解決策があると思いますか?