-1

私は Mahout Apache を使用して、(ユーザーによる同様のアイテムの評価に基づいて) アイテム ベースのレコメンダーを作成しています。次の 2 つの類似性メトリックのどちらを使用するのが最適か疑問に思っていました。

ピアソン、スピアマン、ユークリッド、谷本、対数尤度

4

1 に答える 1

0

好みの値がある場合は、人物相関またはユークリッド距離の類似性メトリックを使用する必要があります。好みの値がない場合は、谷本係数または対数尤度を使用する必要があります。使用する絞り込みのどれを選択するには、データセットで評価を実行する必要があります。そのため、 mahout の評価フレームワークが使用されます。平均二乗誤差 (MSE)、絶対平均二乗誤差、精度、再現率、MAP など、多くの指標を評価できます。

私は調整されたコサイン類似性をコード化しました。これはピアソン相関の変形であり、より良い結果をもたらしますが、遅くなります。

于 2014-11-26T20:47:16.843 に答える