15

私は、レコメンデーションシステムの開発にSolrとMahoutを使用することについて読んでいます。

私が理解したように、彼らは2つの異なる問題を処理します。

  1. Solrは検索エンジンと分類システムであるため、主にDrupalの「これに似た」などの推奨事項に使用されます-http ://jamidwyer.com/d7/node/21

(またはStackOverflowの「関連」機能)

  1. Mahoutの場合、協調フィルタリングなどの機械学習アルゴリズムを実装します。ユーザーの以前のアクションに基づいたAmazonでの提案などの機能を実装するために使用できます。(いいね、購入したアイテム)

私の質問、

それらは2つの異なる問題に対処するために使用されていますか?

それらを統合できますか?

Mahoutがオフライン処理とスケーラブルを行うことを読みました。これは、Solrをスケーリングできないことを意味しますか?

4

3 に答える 3

11

これらは、さまざまな問題に対するさまざまなツールです。Solr は実際に推奨するわけではなく、内容に基づいて類似のドキュメントを提案します。これは、ユーザーに関連しないという意味でパーソナライズされていません。この特定の問題に非常に優れています。

Taste / Mahout は共同フィルタリング用であり、ドキュメントやその他の種類のものに固有のものではなく、「類似アイテム」が決定的に異なり、レコメンデーションはアイテム プロパティではなく、ユーザーとアイテムの相互作用に基づいています。

必要なものと意味に応じて、どちらも適切にスケーリングします。Solr を疑う理由はありません。

Mahout と Recommender については、簡単に言うと 2 つの部分があります。One piece (Taste) はリアルタイムであり、Hadoop ベースではなく、1 台のマシンで適度なデータ セット (おそらく 10M データ ポイント) にスケーリングします。その後、Mahout は、より大規模にスケーリングできる Hadoop ベースの非リアルタイムのバッチ実装を追加します。(広告: 私は上記の主な作成者であり、 Myrrixと呼ばれる両方に基づく次世代システムに取り組んでいます。スケーラブルでリアルタイムの Mahout スタイルのレコメンダーの両方に興味がある場合は魅力的です。)

上記に基づいて、Solr を含むプラットフォームをまとめている会社に興味がある場合は、NGDATAを参照してください。

于 2012-11-28T09:29:46.537 に答える
3

おっしゃる通り、彼らは 2 つの異なる問題に対処していますが、これまでのところ、すぐに使用できる既存の統合を見たり見つけたりしたことはありません。

あなたができることは、Mahout の分類結果を使用して、インデックス化されたドキュメントにさらに情報を追加し、ブーストの目的で使用できるようにすることです。

あなたの最後の答えについて-Solrはスケーリングできます。リリースされたばかりのバージョン4.0では、以前よりもスケーリングできます。しかし、それは別の目的を解決し、それに対して適切にスケーリングします。

あなたの質問は少し具体的ではないので、これが何らかの形で役立つことを願っています.

乾杯

于 2012-11-28T08:46:14.200 に答える
3

手を汚しても構わないのであれば、Solr + 協調フィルタリングを実際に使用して、非常に優れた検索認識型のレコメンデーション システムを作成できます。つまり、検索が与えられ、検索S者の購入履歴がP_i与えられ、他のすべての人の購入履歴が与えられたP_j場所j≠i. 次に、検索を満たす結果を返すことができますがS、他の同様のユーザーに基づいて検索者がおそらく好むアイテムに基づいてブーストされます。

これは私が書いたブログ投稿で、あなたを正しい方向に導くことができます: http://opensourceconnections.com/blog/2013/10/05/search-aware-product-recommendation-in-solr/

于 2014-12-24T03:38:03.097 に答える