私たちはアイテム (およびその後のユーザー) 間の類似性を見つけようとしています。アイテムはユーザーによってさまざまなリストでランク付けされています ( Hi Fidelityの Rob、Barry、Dick を考えてみてください)。特定のリストのインデックスが低いほど、評価が高いことを意味します。
標準的なアプローチは、ピアソン相関を使用してから、何らかの方法でインデックスを反転することだと思います。
しかし、私が理解しているように、ピアソン相関の目的は、通常、物事を高く評価したり低く評価したりしても、相対的な評価が似ているユーザー間の違いを補うことです。
リストが連続している場合 (任意の長さですが)、位置から暗示される評価がこのように歪められることは問題ではないように思えます。
この場合、ユークリッドに基づく類似性で十分だと思います。これは事実ですか?ピアソン相関を使用すると悪影響が生じ、適切でない相関が検出されるでしょうか? このデータに最も適した類似性尺度はどれですか?
さらに、リスト内の位置に影響を与えたいと考えていますが、離れすぎているランキングにペナルティを課したくはありません。ランキングが大きく異なるリスト内のアイテムを両方とも取り上げている 2 人のユーザーは、類似していると見なされるべきです。