MapReduce でコサイン類似度を使用してアイテムベースのレコメンデーションを作成しようとしています。
入力セットはこちら。
itemIdx_1、userIdx_1 itemIdx_1、userIdx_2 itemIdx_2、userIdx_1 itemIdx_3、userIdx_3 ...
この入力データを使用して設計するにはどうすればよいですか?
コサイン類似度を使用するには、入力は次のようにする必要があると思います。
(設定がないため、データは 0 または 1 であると想定されます) itemIdx_1、[userIdx_1:1、userIdx_2:1、userIdx_3:0] itemIdx_2、[userIdx_1:0、userIdx_2:1、userIdx_3:0] ItemIdx_3、[userIdx_1:0、userIdx_2:0、userIdx_3:1] ...
しかし、MapReduce を使用して各行を比較するにはどうすればよいでしょうか?
助けてください。私はこれに1週間ほどうんざりしています..