3

記事/ニュース推奨エンジンを実装する必要があるプロジェクトに取り組んでいます。いろいろな方法(アイテムベース、ユーザーベース、モデルCF)を組み合わせようと考えているのですが、使用するツールについて質問があります。

私の調査によると、Lucene は間違いなくテキスト処理のツールですが、レコメンデーションの部分については、それほど明確ではありません。テキストの類似性に基づいて記事にアイテム CF を実装したい場合:エンジン)、検索の問題に本当に近いので、solrの方が良いと思いますよね?- 2 つのツールの時間処理の違いは何ですか (Mahout はバッチ処理と Solr リアルタイム処理が多いと思います) - Lucene からテキストの距離を直接取得できますか (Lucene と比較して solr の付加価値が何であるかは明確ではありません)。- より高度な方法 (行列因数分解に基づくモデル) については、Mahout を使用しますが、solr にコンセプト/タグを発見するための SVD のような機能はありますか?

ご協力いただきありがとうございます。

4

1 に答える 1

0

要件にもよりますが、オフラインのレコメンデーション機能のみが必要な場合は、 mahout が適しています。オンラインについては、私もテストしています。実際、私は lucene と mahout でテストしましたが、一緒にうまく動作します。Solrの場合、よくわかりませんが、コアとしてルセンを使用していることはわかっています。そのため、すべての重労働は引き続き lucene によって行われます。私の場合、Java プログラムで mahout と lucene を組み合わせました。基本的に lucene は前処理とプリミティブの類似性の計算を行い、結果を mahout に送信してさらに分析します。

于 2014-02-24T05:52:48.243 に答える