1

レコメンダー システムに Apache Mahout のユーザー ベースの協調フィルタリングを使用しています。

2 つの質問があります。

1) UserID と ItemID は数値でなければなりませんか?

私のデータモデルは次のようになります。

ジェシーステイ、e/4d0b55757114464eb56cdf01bf5d6842,1

ここで、「jessestay」はユーザー ID、「e/4d0b55757114464eb56cdf01bf5d6842」はアイテム ID、「1」はユーザーからこのアイテムへの設定値です。

userID と ItemID を int または long にエンコードするにはどうすればよいですか?

2) UserSimilarity を使用している場合、構築されたユークリッド距離、ピアソン相関係数、またはスピアマン相関を使用する必要がありますか?

userSimilarity を推定する独自の方法を定義できますか?

Apache Mahout の協調フィルタリングを使用するのはこれが初めてです。

ご助力ありがとうございます。お返事を楽しみにしています!

シャオ・シェン

4

1 に答える 1