1

アプリにある種の永続性を追加しようとしています。アプリは1 秒あたり約 250 エントリを生成します。これらの各エントリは、2M ファイルのいずれかに属しています。各ファイルについて、後で検索できるように、最新の 10 個のエントリを保持したいと考えています。

クライアント アプリケーションの動作方法:

  • すべてのデータのストリームを取得します
  • 正しいファイルを取得します (GET)
  • 新しいコンテンツを追加します
  • ファイルを保存します(PUT)

取得するデータの量が数週間ごとに倍増しているため、水平方向にスケーリングできるこのデータを効率的に保存する方法を探しています。

最初に S3 を調べました。正常に動作しますが、非常に速く非常に高価になります (PUT 操作だけで毎月 1000 ドル以上!)

次に、リアクを撃ちました。しかし、各ノードで毎秒 60 を超える書き込みはできないようで、非常に低速です。

そこに他の解決策はありますか?

4

3 に答える 3

1

Riak で調整できるノブはたくさんあります - まだお持ちでない場合は、メーリング リストに問い合わせてください。毎秒 60 回の書き込みは標準の範囲内ではありません。

参照: http://lists.basho.com/mailman/listinfo/riak-users_lists.basho.com

于 2010-05-10T22:02:39.260 に答える
0

Appistry のCloudIQ Storageを見ることをお勧めします。完全に分散されたファイル ストアです。REST ベースの API を介してアクセスでき、コモディティ ハードウェアで実行できます。ファイルごとに保持するコピーの数を定義できます。最終的に整合性のあるモデルをサポートしているため、ファイルの整合性とパフォーマンスのバランスを取ることができます。

于 2011-04-18T16:10:50.393 に答える
0

Amazon EC2 インスタンスに広がる Hadoop の HDFS はどうですか? 各インスタンスには十分な量のストレージ スペースがあることはわかっています。また、受信転送のみで、プット/取得に料金を支払う必要はありません。

于 2010-05-10T20:49:56.020 に答える