10

今後のプロジェクトのストレージプラットフォームを評価しており、Cassandraに戻ってきます。このプロジェクトでは、データの量を失うことは容認できません。これまでリレーショナルデータベース(Microsoft SQL Server)を使用してきましたが、データが非常に多様で大きいため、保存とクエリが問題になっています。

Cassandraはプライマリデータストアとして使用するのに十分堅牢ですか?または、アクセスを高速化するために既存のデータをミラーリングするためにのみ使用する必要がありますか?

4

2 に答える 2

9

事例:はい、Twitter、Digg、Ooyala、SimpleGeo、Mahaloなどが、プライマリデータストア(http://n2.nabble.com/Cassandra-users-survey-td4040068.html)にCassandraを使用または移動しています。

技術的に:はい。レプリケーション(複数のデータセンターを含む)をサポートすることに加えて、各Cassandraノードにはfsyncされたコミットログがあり、書き込みが永続的であることを確認します。そこから、書き込みは圧縮まで不変のSSTableに変換されます(複数のSSTableをGCの古いバージョンに結合します)。スナップショットは、圧縮前の自動スナップショットを含め、いつでもサポートされます。

于 2009-12-05T14:44:35.613 に答える
4

アプリケーションにCassandraを使用するかどうかは、純粋にデータワークロードに依存します。Cassandraは、書き込みの多いワークロード用に最適化されているため、大量のデータを挿入する必要があるアプリケーション(Facebookのインフラストラクチャログ情報など)に適しています。

ただし、高速な取得が必要で、挿入速度が問題にならない場合は、HBase(読み取りを多用するワークロードに最適化されている)などを確認する必要があります。

于 2011-09-20T16:19:59.403 に答える