生存分析では、ハザード関数は即死率です。
これらの分析では、通常、何かがこのハザード関数に与える影響を測定しています。たとえば、「ヒ素を飲み込むと死亡率が高くなりますか?」と尋ねることができます。バックグラウンド ハザードとは、とにかく人が死亡するレベルです (この場合、ヒ素を飲み込まずに)。
のドキュメントをcoxphfit
注意深く読むと、その関数がベースライン ハザードを計算しようとしていることがわかります。それはあなたが入力するものではありません。
ベースライン ハザードを計算する X 値。
編集: MATLAB のcoxphfit
関数は明らかにグループ化されたデータでは機能しません。Rに切り替えてもよければ、分析はワンライナーです。
library(survival)
#Create some data
n <- 20;
dfr <- data.frame(
survdays = runif(n, 5, 15),
cens = runif(n) < .3,
x = rlnorm(n),
groups = rep(c("first", "second"), each = n / 2)
)
#The Cox ph analysis
summary(coxph(Surv(survdays, cens) ~ x / groups, dfr))
別の編集: baseline
MATLAB のそのパラメーターはcoxphfit
、正規化定数のようです。R のcoxph
関数には、同等のパラメーターがありません。Michael Crawley のStatistical Computingを調べたところ、個人が死亡する可能性を計算すると相殺されるため、ベースライン ハザードは重要ではないことが示唆されているようです。第 33 章、特に p615-616 を参照してください。モデルがどのように機能するかについての私の知識は、MATLAB と R の実装における不一致を説明するのに十分ではありません。おそらく、 Stack Exchange Stats Analysisサイトで質問できます。