mahout でアイテム ベースのレコメンダーを使用しようとしています。これには、250 万人のユーザーとアイテムのやり取りが含まれていますが、好みの値は含まれていません。約100件のアイテムと10万人のユーザーがいます.推奨するのに約10秒かかります. 一方、ユーザーベースのレコメンダーを使用すると、同じデータの場合、1 秒もかかりません。
ItemSimilarity sim = new TanimotoCoefficientSimilarity(dm);
CandidateItemsStrategy cis = new SamplingCandidateItemsStrategy(10,10,10,dm.getNumUsers(),dm.getNumItems());
MostSimilarItemsCandidateItemsStrategy mis = new SamplingCandidateItemsStrategy(10,10,10,dm.getNumUsers(),dm.getNumItems());
Recommender ur = new GenericBooleanPrefItemBasedRecommender(dm,sim,cis,mis);
SamplingCandidateItemsStrategy に上記のパラメーターを使用することを提案している @Sean の回答の 1 つを読みました。しかし、それが実際に何をしているのかはよくわかりません。
編集: 2.5 M はユーザーとアイテムの関連付けの合計で、10 万人のユーザーがいて、アイテムの総数は 100 です。