3

1.0として表される設定の大規模なデータセットがあり、Tanimoto類似度関数とGenericBooleanUserおよびItemPreferenceRecommendersを使用しています。推奨値は通常、0〜1.0の値です。

Mahout in Actionブックなどの多くのソース、およびこの以前のSOスレッドは、ブールデータセットに対してTanimotoよりもLogLikelihoodSimilarityメトリックを推奨しています。LogLikelihood類似度メトリックに切り替えると、11など、はるかに高い範囲のスコアが生成されました。より官能的な評価を取得するには、谷本に戻る必要がありました。修正の可能性を提案できますか、それとも推奨アイテムスコアの戻り値を誤解していますか?

4

1 に答える 1

2

評価がない場合、観察される値は予測された評価ではありません。結局のところ、それらはすべて1.0であるため、ランキングには使用できません。結果は実際には類似性の合計であり、それが任意に大きくなる可能性がある理由です。[0,1]などには含まれていません。

于 2012-04-16T18:01:59.850 に答える