私は mahout と少し混乱しています: 私はそれを使用する 2 つの方法があるという印象を持っています:
- Taste Recommender を使用して .jar を実行する
- ここ
mahout recommenditembased --input input/recommend_data.csv --output output/recommendation --similarityClassname SIMILARITY_PEARSON_CORRELATION
に示すように、コマンド ラインを使用します。
→正しいですか、それとも同じですか?
私の問題は次のとおりです。user_id、item_id、rating の形式の csv 入力ファイルがあります。100 000 行あり、すべてのユーザーの推奨事項を毎日計算する必要があります。Hadoop がなくても問題ないはずだと読みましたが、そうではありません。作成した .jar は小さなバッチでは機能しますが、入力ファイル全体では機能しません。
コマンド ライン メソッドは 5 分で動作しますが、jar プロジェクトほど柔軟ではありません (特に MySQL データベースとのインターフェイス)。
.jar を使用して hadoop の恩恵を受けることは可能ですか? 私は計算を配布していないので (hadoop は 1 つのサーバーで実行されます)、.jar-without-mahout メソッドと command-line-with-hadoop メソッドの間にこのような違いがあるのは正常ですか?
助けてくれて本当にありがとうございます!