ユーザーベースの協調フィルタリングの Java での非常に単純な実装を探しています。この CF の精度と再現率を movielens データセットで評価したいと思います。パフォーマンス (F1) は約 20 ~ 30% (ピアソンの類似性と KNN を使用) であることがわかりました。
この単純なフレームワークは、精度とリコール コードの評価とともに存在しますか?
ユーザーベースの協調フィルタリングの Java での非常に単純な実装を探しています。この CF の精度と再現率を movielens データセットで評価したいと思います。パフォーマンス (F1) は約 20 ~ 30% (ピアソンの類似性と KNN を使用) であることがわかりました。
この単純なフレームワークは、精度とリコール コードの評価とともに存在しますか?
Apache Mahoutは、ここで言及したすべてのことを行います。これは Java ベースであり、ユーザーベースの協調フィルタリング (とりわけ) をサポートしていますGenericUserBasedRecommender
。などの類似性の実装をプラグインできる k 最近傍アルゴリズムですPearsonCorrelationSimilarity
。
org.apache.mahout.cf.taste
パッケージとサブパッケージを見てください。.impl.eval
サブパッケージでを見つけますGenericRecommenderIRStatsEvaluator
。これにより、精度、再現率、および F1 を報告するテストが実行されます。
最後に、 に基づいた実用的な例がすでにいくつかありGroupLens
ますmahout-examples
。
RapidMiner を試しましたか? 興味がある場合は、コーディングに集中することなく、精度の評価やリコールなどを試してみてください。それがあなたのためのツールです。紙や youtube ビデオのチュートリアルでさえ、あなたを助けるような良い情報がウェブ上にあります。