私が持っているデータのサブセットに Amazon SimpleDBが適しているかどうかを確認しようとしています。
データを記録する何千もの自律型センサー デバイスを展開しています。
各センサー デバイスは基本的に、数か月から数年にわたり、毎日 1 時間に 4 回、いくつかの値を報告します。過去の統計分析のために、このデータをすべて保持する必要があります。通常、一度書き込み、何度も読み取ります。サーバーベースのアプリケーションは定期的に実行され、データを照会して他の情報を推測します。
今日のデータ行は、SQL では次のようになります。
- (id、device_id、utc_timestamp、value1、value2)
私たちの既存の MySQL ソリューションは、数千万行にスケールアップする予定はありません。「昨日のすべての値 1 の合計を教えてください」または「過去 8 時間の値 2 の平均を表示してください」などのクエリを実行します。これは SQL で行いますが、喜んでコードで行うように変更できます。SimpleDB の「結果整合性」は、私たちの目的には問題ないようです。
AWSアカウントで実験を開始しようとしていますが、SimpleDB のさまざまな概念 (アイテム、ドメイン、属性など) がドメインにどのように関連しているかが明確ではありません。
SimpleDB はこれに適した手段であり、一般化されたアプローチは何でしょうか?
PS: 私たちは主に Python を使用していますが、大まかに考えると、これは問題ではありません。この時点でbotoライブラリを認識しています。
編集:
この解決策を探し続けていると、スタック オーバーフローの質問に出くわしました。時系列データを保存するための最良のオープン ソース ソリューションは何ですか? これは役に立ちました。