0

全て、

rjagsを使用してベイジアンモデリングを行っています。ただし、観測数が1000を超える場合。グラフサイズが大きすぎます。

より具体的には、ベイジアンのランキング問題をやっています。伝統的に、1 つの観測は 1 つの X[i, 1:N]-Y[i] ペアを意味します。ここで、X[i, 1:N] は、i 番目のアイテムが N サイズの予測子ベクトルによって表されることを意味し、Y[i ] は応答です。目的は、予測値の点ごとの誤差 (最小二乗誤差など) を最小化することです。

ランク付けの問題は異なります。順序を重視するため、Y[i] と Y[j] の間の順序を表すためにペアワイズ 1-0 インジケーターを使用します。たとえば、Y[i]>Y[j] の場合、I(i 、j)=1; それ以外の場合は、I(i,j)=0 です。この 1-0 インジケーターを観測値として扱います。したがって、K 個の項目 Y[1:K] があると仮定すると、指標の数は 0.5*K*(K-1) になります。したがって、K が 500 から 5000 に増加すると、観測数は非常に多くなり、つまり 500^2 から 5000^2 になります。rjags モデルのガーフ サイズも大きく、たとえばグラフ サイズ > 500,000 です。そして、対数事後分布は非常に小さくなります。

そして、トレーニングを完了するには長い時間がかかります。消費時間は40時間以上だと思います。私がさらに実験を行うことは現実的ではありません。したがって、rjags を高速化する考えはありますか。RStan は Rjags よりも速いと聞きました。似たような経験をした人はいますか?


4

0 に答える 0