手形の測定値から身長を推定するための線形回帰モデルを開発しようとしています。ベイジアン アプローチを採用し、以前の研究から有益な事前確率を定義したいと思います。いくつかの予測子 (いくつかの線形測定値) と身長測定値 (ターゲット変数として) を含むデータ セットがあります。
以前の研究から、線形回帰モデルの同じ変数と式の記述統計 (平均と標準偏差) に関する情報があります。それで、私の質問は、その情報をどのように使用して、研究のために有益な事前分布を抽出できるかということです。たとえば、以前の研究から変数 HL と身長に関する次のデータがあります。
平均 (HL) = 17.94、SD (HL) = 0.94、平均 (身長) = 178.5、SD (身長) = 7.05、範囲 (身長) = (162.4–200.5)
身長推定モデル = 69.723 +5 .567 x HL、SEE = 4.83、r = 0.73
それらを使用して、モデルで事前および事前インターセプトを構築するにはどうすればよいですか
Model <- stan_glm(STATURE ~ HL, data = mydata, prior = ?, prior_intercept = ?)
また、私の母集団と以前の研究の母集団の出力変数 (身長) に違いがある可能性があるため、他の研究の結果に基づいてターゲット変数の事前確率を構築する方法はありますか? たとえば、母集団の平均身長が 180 +/- 5 cm であることがわかっているとします。
さまざまなソース (例: http://mc-stan.org/rstanarm/articles/priors.html )で説明を探していましたが、以前の研究から有益な事前確率を構築する方法のガイドはありません。