0

ユーザーのクリック行動記録に基づくレコメンダー システム アルゴリズムとして行列分解を使用しています。2 つの行列因数分解法を試します。

最初のものは基本的な SVD であり、その予測はユーザー ファクター ベクトルuとアイテム ファクターiの積です: r = u * i

2 番目に使用したのは、バイアス コンポーネントを使用した SVD です。

r = u * i + b_u + b_i

ここで、b_ub_iは、ユーザーとアイテムの好みの偏りを表します。

私が使用しているモデルの 1 つはパフォーマンスが非常に低く、もう 1 つは妥当です。なぜ後者のパフォーマンスが悪いのか、私にはよくわかりません。

オーバーフィッティングを検出する方法をグーグル検索したところ、学習曲線が良い方法であることがわかりました。ただし、x 軸はトレーニング セットのサイズで、y 軸は精度です。これは私をかなり混乱させます。トレーニング セットのサイズを変更するにはどうすればよいですか? データ セットからいくつかのレコードを選択しますか?

別の問題は、反復損失曲線をプロットしようとしたことです (損失は です)。そして、曲線は正常なようです:

ここに画像の説明を入力

しかし、私が使用する指標は適合率と再現率であるため、この方法が正しいかどうかはわかりません。反復精度曲線をプロットしましょうか??? または、これはすでに私のモデルが正しいことを示していますか?

私が正しい方向に進んでいるかどうか、誰か教えてください。どうもありがとう。:)

4

1 に答える 1