1

レコメンダーシステムを拡張して、他の機能(ディメンション)を含めることを検討しています。これまでのところ、ユーザーがドキュメントをどのように評価しているかを追跡し、それを使用して推奨事項を実行しています。ユーザーの場所、年齢、性別などの機能をさらに追加することに興味があります。これまでのところ、これを処理するにはいくつかのmysqlテーブルで十分ですが、機能を追加するとすぐに乱雑になるのではないかと心配しています。

私の質問:この種の多次元データをどのように表現して永続化するのが最適ですか?Python固有のヒントが役立ちます。

ありがとうございました

4

2 に答える 2

0

あなたの場合、SQLデータベースは正常に機能するはずです。実際、すべてのトレーニング サンプルを 1 つのデータベースに格納できます。各行は特定のトレーニング セットを表し、各列は特徴を表します。必要に応じて列を追加することで機能を追加できます。リレーショナル データベースでは、さまざまな不整合の理由により、データのクエリを実行するときにアクセス エラーが発生する場合があります。NoSQL データベースを使用してみてください。私は個人的に Python で MongoDB と Pymongo を使用して、トレーニング例を JSON 形式の辞書として保存しています。(この方法では、Web アプリのほうが簡単です)。

于 2012-09-11T12:02:44.793 に答える