0

SAS でコーディングされた R の加速故障時間 (aft) モデルの結果を再現しようとしています。

使用するデータセットはこちら

そこには、SAS コードも含まれています。

    formula <- survreg(Surv(Duration, Censor) ~ Acq_Expense + Acq_Expense_SQ + Ret_Expense + Ret_Expense_SQ + Crossbuy + Frequency + Frequency_SQ + Industry + Revenue + Employees, dist='weibull', data = daten [daten$Acquisition==1, ])
    out1 <- survreg(formula = formula, data = daten [daten$Acquisition==1, ], dist = "weibull")
    summary(out1)

    ind <- c("Duration", "Censor")

    err.mat <- ???

    out2 <- simexaft(formula = formula, data = daten [daten$Acquisition==1, ], SIMEXvariable = ind, repeated = FALSE, err.mat = err.mat, dist = "weibull")
    summary(out2)

私たちの質問は、err.mat 用語をどのように定義するかです。err.mat は、測定誤差のある変数を指定します。私たちのデータセットは適切に打ち切られているので、測定誤差のある変数はおそらくDurationおよび/またはCensorであると思いました. しかし、それはそれほど単純ではありません。err.mat は正方対称数値行列でなければなりません。

4

1 に答える 1