私は生存分析の初心者です。何も観測されなかった測定値をデータセットに含めることが重要かどうかを理解しようとしています。
次の架空のデータがあります: 3 人の患者、
- 最初の患者は時間 12 で病気にかかっていることが観察され、
- 2 人目は 13 時に 1 回、14 時に 1 回、病気がないことが 2 回観察されます。
- 3 番目の患者は、時間 1 で病気にかかっていることが観察されます。
次の2つの例を試しました
require(flexsurv)
surv_test <- with(data.frame(status = c(1,0,0,1), time = c(12L, 13L,1L, 1L)), Surv(time, status))
flexsurvreg(surv_test~1, dist = "weibull")
#Call:
#flexsurvreg(formula = surv_test ~ 1, dist = "weibull")
#Estimates:
# est L95% U95% se
#shape 0.937 0.295 2.973 0.552
#scale 13.755 3.001 63.035 10.683
#N = 4, Events: 2, Censored: 2
#Total time at risk: 27
#Log-likelihood = -7.199135, df = 2
#AIC = 18.39827
と
surv_test <- with(data.frame(status = c(1,0,1), time = c(12L, 14L, 1L)), Surv(time, status))
flexsurvreg(surv_test~1, dist = "weibull")
#Call:
#flexsurvreg(formula = surv_test ~ 1, dist = "weibull")
#Estimates:
# est L95% U95% se
#shape 0.844 0.244 2.922 0.535
#scale 13.883 2.635 73.140 11.770
#N = 3, Events: 2, Censored: 1
#Total time at risk: 27
#Log-likelihood = -7.167346, df = 2
#AIC = 18.33469
結果は、2つの間に明確な違いがあることを示しています.患者が病気ではないという観察を含めることが重要である理由を誰かが説明できるかどうか疑問に思っていました. ありがとう!