Linux クラウド サーバーでのデータ ウェアハウス マイニング プロジェクトのセットアップ。主要言語は Python です。
データのクエリとデータの保存にこのパターンを使用したいと思います:
- SQL データベース- SQL データベースは、データのクエリに使用されます。ただし、SQL データベースには検索が必要なフィールドのみが格納され、データ自体の「ブロブ」は格納されません。代わりに、データの完全な「ブロブ」を参照するキーをキー値ブロブストアに格納します。
- Blobstore - キーと値の Blobstore は、データの実際の「ドキュメント」または「BLOB」を格納するために使用されます。
私たちが抱えている問題は、より頻繁にアクセスされるデータのブロブを自動的に RAM に保存したいということです。これには Redis を使用する予定でした。ただし、最初に RAM からデータを自動的に取得しようとするソリューションが必要です。RAM でデータが見つからない場合は、ブロブストアに移動します。
自分で作成せずに使用できる、優れたライブラリまたは既製のソリューションはありますか? また、提案されたアーキテクチャに関するコメントや批判も歓迎します。
本当にありがとう!