amazon-s3 - 分散データストア

Question

アプリにある種の永続性を追加しようとしています。アプリは1 秒あたり約 250 エントリを生成します。これらの各エントリは、2M ファイルのいずれかに属しています。各ファイルについて、後で検索できるように、最新の 10 個のエントリを保持したいと考えています。

クライアントアプリケーションの動作方法:

すべてのデータのストリームを取得します
正しいファイルを取得します (GET)
新しいコンテンツを追加します
ファイルを保存します（PUT）

取得するデータの量が数週間ごとに倍増しているため、水平方向にスケーリングできるこのデータを効率的に保存する方法を探しています。

最初に S3 を調べました。正常に動作しますが、非常に速く非常に高価になります (PUT 操作だけで毎月 1000 ドル以上!)

次に、リアクを撃ちました。しかし、各ノードで毎秒 60 を超える書き込みはできないようで、非常に低速です。

そこに他の解決策はありますか？

score 1 · Accepted Answer

Riak で調整できるノブはたくさんあります - まだお持ちでない場合は、メーリングリストに問い合わせてください。毎秒 60 回の書き込みは標準の範囲内ではありません。

参照: http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com

score 0 · Accepted Answer

Appistry のCloudIQ Storageを見ることをお勧めします。完全に分散されたファイルストアです。REST ベースの API を介してアクセスでき、コモディティハードウェアで実行できます。ファイルごとに保持するコピーの数を定義できます。最終的に整合性のあるモデルをサポートしているため、ファイルの整合性とパフォーマンスのバランスを取ることができます。

score 0 · Accepted Answer

Amazon EC2 インスタンスに広がる Hadoop の HDFS はどうですか? 各インスタンスには十分な量のストレージスペースがあることはわかっています。また、受信転送のみで、プット/取得に料金を支払う必要はありません。

amazon-s3 - 分散データストア

3 に答える 3

Related

Reference