1

次のような CSV ファイルがあります。

タイプA、タイプB
タイプA、タイプC
タイプA、タイプC
タイプA、タイプB

ここで、typeA、typeB、typeC は 3 つの異なるタイプのエンティティです。タイプ B と C を 2 つの異なるタイプのアイテムと見なし、タイプ A をユーザーと見なします。

この CSV ファイルを Myrrix にフィードすることで、モデルを構築できます。このファイルには、B (以前の CSV ファイルの「B」項目はユーザーとしてここに含まれています) と D の 2 つのタイプしかありません。次に、次のような別の CSV ファイルがあるとします。

タイプB、タイプD
タイプB、タイプD
タイプB、タイプD
タイプB、タイプD

ここでは、typeB に対して typeD のレコメンデーションを取得したいと考えています。これには別の Myrrix インスタンスが必要ですか? 2 つのモデルを用意して、どちらを推奨するかを選択することはできますか? Apache Mahout でこれを行うのは簡単だと思いますが、Myrrix のようにリアルタイムの setPreference とモデルの更新の喜びを得ることができないのではないでしょうか?

これを解決するためのアイデアをいただければ幸いです。

4

1 に答える 1

5

はい、これらは概念的には 2 つの異なるドメインです。1つはA-to-B-or-C、もう1つはB-to-Dです。これは、ユーザーから記事または投稿へ、および記事からタグへの可能性があります。D は最初のものには存在しませんが、まさに 2 番目の推奨事項です。

分離により、物事は単純になります。たとえば、両方のモデルを同じマシン内でホストしたり、場合によっては JVM でホストしたりすることもできます。たとえば、2 つのポートで 2 つのサーバーを実行しているとします。いずれかのサービスにアクセスして、必要なものを選択できます。ServerRecommenderまたは、単純に の 2 つのインスタンスを直接埋め込んで使用することもできます。

この点では、Mahout と違いはありません。

于 2013-05-23T19:23:05.687 に答える