ベイジアンの以前の概念は理解できます。これはクールですが、それらをコードに変換するのは難しすぎます。私が知る限り、事前情報なしで公開することは良い習慣ではありません。私は非常に大きなデータセット (n = 5000) を持っています。誰でも助けることができますか?
次のような hurdle_lognormal モデルがあります。
fit = brm(bf(received_treatment_hours ~ p1 + p2 + p3_fct + p4 + p5_fct + p6 + p7 + (1 | region), hu ~ p1 + p2 + p3_fct + p4 + p5_fct + p6 + p7 + (1 | region)), data = df, family = hurdle_lognormal(), cores = 3, chains = 3, prior = prior)
received_ Treatment_hours は、ゼロ膨張 (50%) の結果変数であり、極端な値 (外れ値) も含まれています。0 ~ 100 の範囲で、ほとんどの患者は約 5 時間かかりました。
前回のまとめです
prior_summary(fit)
モデルの対数正規部分と二項部分の一般的な事前確率 b をコーディングする方法は? 異なる予測因子レベル間で、受けた治療時間が 30 時間を超える可能性は低いと仮定しましょう。ゼロの割合は、さまざまな予測レベル (10 ~ 90%) の間でかなりの範囲にありました - これをどのようにコーディングするのですか?
これらの sd、intercept、およびシグマ プライアで定義できるものは何ですか?
モデルの対数正規部分のために私が自分で書いたコード:
prior = c(prior(student(3, 0, 15), class=b), #allows extreme values and 2xSD = 2x15 = 30 hours
prior(student_t(3, 0, 15), class= sd, group = county)) #prior for hierarchical part of the model, allows extreme values and 2xSD = 2x15 = 30 hours