Rails で実行され、そのデータが MySQL に保存されている Web アプリをサポートするレコメンデーション エンジンを構築したいと考えています。ある種のリアルタイム風のファッション。桁違いに、おそらくすべてのユーザーで 1 秒間に数十回のインタラクションが発生していると思います。1 日あたり 100 万のデータポイント。
私の質問は、物事を迅速に処理できるように、分析をどのように構造化して処理するかです。私がすでに知っていることを利用して、Ruby と R (RServe、RSRuby) のフレーバーを使用して、既存のデータセットで SVD/クラスタリング/アンサンブル/whatevermodels を実行し、サンプリングによってモデル/式を頻繁に更新できますが、それは物事を行うための本当に不格好な方法。これを行うより良い方法は何ですか?MySQL で直接計算を実行しますか? 優れた数学関数を備えたクールな Ruby ライブラリを使用していますか? 市販のレコメンデーション エンジン パッケージを使用しますか?
(提案された「同様の質問」リンクをすべて見たにもかかわらず、私はそこに何があるかについて明確に認識していません。甘い皮肉です。:( )
PS: 私のバックグラウンド: R を数年間使用している数値担当者ですが、完全に静的/オフライン データ用です。Python、Rails などの初心者プログラマーですが、その分野で働くことができます。