0

NearestNUserNeighborhoud を変更して、信頼ネットワークに属するユーザーに特別な価値を追加しました。信頼ネットワークはデータベース (MySQL) にあります。

特定のユーザーにアイテムを推奨すると、うまく機能し、推奨事項が提供されます。

ただし、データベース/ユーザーの信頼ネットワークにいるユーザーを比較する場合、RMSE を評価すると非常に遅くなります。(何千もの select ステートメントを実行します)

最初のデータ モデルは csv ファイル上にあり、userid itemid rating の形式になっています。一方、データベースでは truster trustee の形式になっています。

妥当な時間内に RMSE を評価するために何を提案しますか?

4

1 に答える 1

1

mahout 評価アルゴリズムは、並列処理を利用できます。より多くのコアを備えたより大きなマシンで実行できます。ただし、データベースへのアクセスに問題があるようです。1 つの準備ステートメントがあり、データベースを呼び出すだけであることを確認してください。(prepare ステートメントを常に実行しないでください)。

より良い解決策は、Map のメモリにトラスト ユーザーをロードし ( Trove ライブラリを使用すると、メモリの消費量が少なくなります)、データベースからではなく、メモリ内でチェックを行うことです。

于 2014-08-02T10:15:25.443 に答える