1

航空会社の旅行代理店のユーザー データがあり、このデータから、ユーザーにとって特定のエンティティの最も好ましい値を取得したいと考えています。私のデータセットは次のような形式です-

userId  From      TO        Meal    Carrier            Travel type

MT001   London    Abu Dhabi Non Veg Lufthansa          International
MT001   Abu Dhabi Beijing   Veg     Lufthansa          International
MT001   New York  Chicago   Non Veg American Airlines  Domestic
MT002   New York  Texas     Veg     American Airlines  Domestic

ここで、ユーザー MT001 の食事、運送業者の列の優先値を取得し、このユーザーを分類したいと考えています。SQL を使用してこれらの値を取得できることはわかっていますが、mahout フレームワークを使用して取得することは可能ですか? リアルタイムで結果を取得したくありません。データを前処理し、すぐに結果を取得できる場所から結果を保存するバッチ ジョブのようなものを考えています。

mahout は分類をサポートしており、アイテム ベースのレコメンデーションなどを使用して優先値を取得できることを知っています。また、hadoop に移行する予定なので、その場合の選択 mahout はどのようになるでしょうか。

4

1 に答える 1

1

ここで探しているのは、コンテンツ ベースのレコメンデーションのようなものだと思います。Mahout はコンテンツ ベースのレコメンデーションをサポートしていますが、それを実装するのに最適なフレームワークかどうかはわかりません。あなたのプログラム。

これが見つかりました-新しいデータセットのMahoutを拡張します

于 2013-06-02T18:40:35.743 に答える