生データの保存に関する意見を募集しています。「ありとあらゆるものを追跡する」のカテゴリに分類される種類のデータ。主に、方向性を推進するための社内分析、新機能のテストなどに使用されます。
データの保存はとても簡単です。ログファイルにダンプするだけで、データベースは必要ありません。一方、複雑な分析やデータ マイニングを実行する場合は、データベースが役に立ちます。
そこで、生データを Redis に保存することを考えていました。Redis は書き込みが高速です。アーカイブには適していません。一時的なデータに最適です。Redis に書き込み、必要に応じて将来の分析のために結果セットをアーカイブできます。
より読みやすい/グループ化された形式に集約することになると。Postgres のような RDBMS で十分です。しかし、MongoDB のドキュメント構造を利用することを考えていました。集計フレームワークが追加されているため、読み取りに最適です。
Redis からの生データを、おそらく cron ジョブまたはワーカー プロセスで定期的にバッチで集約できます。
これは一例です。集計部分については、Mongodb に非常に熱心です。何百万もの生データを保存するために、他にどのようなセットアップ/ソリューションを検討できますか? これに関するベストプラクティスは何ですか?