machine-learning - ますます多くのフィードバックに基づいて、ベータ版配布用のアルファおよびベータパラメータを更新します

翻译自：https://stackoverflow.com/questions/60183934 2020-02-12T08:22:10.317

106 次

大学のプロジェクトで、顧客からのフィードバックに基づいてオンラインコンテンツのランク付けに取り組んでいます。そのために、各コンテンツを以前のアルファおよびベータパラメータに関連付け、得たフィードバックに基づいてそれらを更新します。試行回数を重ねるごとに、アルファパラメータとベータパラメータの値が増加し続けます。モデルを最近の顧客の行動にもっと反応させたいので、アップデートでは、以前のパラメータを 0.9 の係数で減衰させ、最終日のアルファ、ベータを合計します (一次不均一線形差分方程式として)。

崩壊により、モデルは一部のコンテンツが最適でなかったことを忘れ、それを再度調査しようとして、循環的な動作につながります。これを解決するより良い方法はありますか？ディストリビューションを構築するために先月のデータを調べてみましたが、それも「忘れっぽい」ようです。モデルが反応的であり、次善の戦略を忘れないようにしながら、アルファ/ベータが大きくなりすぎないようにするにはどうすればよいですか?

machine-learning - ますます多くのフィードバックに基づいて、ベータ版配布用のアルファおよびベータ パラメータを更新します

1 に答える 1

Related

Reference

machine-learning - ますます多くのフィードバックに基づいて、ベータ版配布用のアルファおよびベータパラメータを更新します