2

Myrrix に対して次の入力があります。

11, 101, 1
11, 102, 1
11, 103, 1
11, 104, 1000
11, 105, 1000
11, 106, 1000

12, 101, 1
12, 102, 1
12, 103, 1
12, 222, 1

13, 104, 1000
13, 105, 1000
13, 106, 1000
13, 333, 1000

ユーザー 11 に推奨するアイテムを探しています。アイテム 333 が最初に推奨されると予想されます (ユーザー 13 とアイテム 104、105、106 の重みが高いため)。

Myrrix からの推奨結果は次のとおりです。

11, 222, 0.04709
11, 333, 0.0334058

アイテム 222 は強度 0.047 で推奨されていますが、アイテム 333 には強度 0.033 しか与えられていないことに注意してください --- 予想される結果とは逆です。

また、強度の差がもっと大きくなると予想していました (1000 と 1 は非常に異なるため) が、順序が期待したものではない場合は明らかに意味がありません。

これらの結果をどのように解釈すればよいですか? また、重みパラメーターについてどのように考えるべきですか? 私たちは厳しい締め切りの下で大規模なクライアントと協力しており、何かアドバイスをいただければ幸いです.

4

1 に答える 1

1

小規模な合成データ セットに基づいて判断するのは困難です。ここでの最大の要因はパラメータだと思います。機能の数は? ラムダ?ここでは機能 = 2 を期待します。それが高い場合は、これをすぐにオーバーフィットすると思います。結果は、ユーザー 11 が 222 および 333 と対話しないことを完全に説明した後、ほとんどがそこから残ったノイズです。

値は非常に低く、これらの両方が結果である可能性が低いことを示唆しているため、それらの順序は何よりもノイズである可能性があります. モデルが別のランダムな開始点から再構築された場合、異なる結果が表示されますか?

于 2013-09-16T07:18:11.367 に答える