レコメンダー システムに Apache Mahout のユーザー ベースの協調フィルタリングを使用しています。
2 つの質問があります。
1) UserID と ItemID は数値でなければなりませんか?
私のデータモデルは次のようになります。
ジェシーステイ、e/4d0b55757114464eb56cdf01bf5d6842,1
ここで、「jessestay」はユーザー ID、「e/4d0b55757114464eb56cdf01bf5d6842」はアイテム ID、「1」はユーザーからこのアイテムへの設定値です。
userID と ItemID を int または long にエンコードするにはどうすればよいですか?
2) UserSimilarity を使用している場合、構築されたユークリッド距離、ピアソン相関係数、またはスピアマン相関を使用する必要がありますか?
userSimilarity を推定する独自の方法を定義できますか?
Apache Mahout の協調フィルタリングを使用するのはこれが初めてです。
ご助力ありがとうございます。お返事を楽しみにしています!
シャオ・シェン