0

私は生存分析の初心者です。何も観測されなかった測定値をデータセットに含めることが重要かどうかを理解しようとしています。

次の架空のデータがあります: 3 人の患者、

  1. 最初の患者は時間 12 で病気にかかっていることが観察され、
  2. 2 人目は 13 時に 1 回、14 時に 1 回、病気がないことが 2 回観察されます。
  3. 3 番目の患者は、時間 1 で病気にかかっていることが観察されます。

次の2つの例を試しました

require(flexsurv)
surv_test <- with(data.frame(status = c(1,0,0,1), time = c(12L, 13L,1L, 1L)), Surv(time, status))
flexsurvreg(surv_test~1, dist = "weibull")

#Call:
#flexsurvreg(formula = surv_test ~ 1, dist = "weibull")

#Estimates: 
#          est    L95%    U95%      se    
#shape   0.937   0.295   2.973   0.552
#scale  13.755   3.001  63.035  10.683

#N = 4,  Events: 2,  Censored: 2
#Total time at risk: 27
#Log-likelihood = -7.199135, df = 2
#AIC = 18.39827

surv_test <- with(data.frame(status = c(1,0,1), time = c(12L, 14L, 1L)), Surv(time, status))
flexsurvreg(surv_test~1, dist = "weibull")

#Call:
#flexsurvreg(formula = surv_test ~ 1, dist = "weibull")

#Estimates: 
#          est    L95%    U95%      se    
#shape   0.844   0.244   2.922   0.535
#scale  13.883   2.635  73.140  11.770

#N = 3,  Events: 2,  Censored: 1
#Total time at risk: 27
#Log-likelihood = -7.167346, df = 2
#AIC = 18.33469

結果は、2つの間に明確な違いがあることを示しています.患者が病気ではないという観察を含めることが重要である理由を誰かが説明できるかどうか疑問に思っていました. ありがとう!

4

0 に答える 0