結果整合性のあるデータストアを探していますが、RiakまたはCassandraにあるようです。誰かがこれについての見解の経験を持っていますか?
5 に答える
おそらくご存じのとおり、どちらもアーキテクチャ的に Dynamo の影響を強く受けています (結果整合性、単一障害点がないなど)。どちらも「純粋な K/V よりもリッチな」データ モデルを提供するという点で Dynamo を超えています。Cassandra の場合は Bigtable のような ColumnFamily モードを提供し、Riak の場合はドキュメント指向のモデルです。正気な人が両方を選ぶのを見てきました。
カサンドラを支持するポイントは次のとおりだと思います
- 速度
- 複数のデータセンターにまたがるクラスターのサポート
- それを使用している有名人 (digg、twitter、facebook、webex、... -- http://n2.nabble.com/Cassandra-users-survey-tp4040068p4040393.html )
Riakを好むポイントは次のとおりです
- すぐに使用できる map/reduce サポート
/カサンドラ開発者、fwiw
Riakはによって使用されます
- Mozilla Foundation
- Ask.comがスポンサーとなっているリスト
- Comcast
- シティグループ
- Bet365
どちらも信頼できるリファレンスの顧客/ユーザーのテストに合格していると思います。
カサンドラはより成熟しているようで、現在ベンチマークでより良い業績を上げています。Riakは、クラスターが大きくなるにつれてノードを追加する方が簡単なようです。
完全を期すために: http://docs.basho.com/riak/1.3.2/references/appendices/comparisons/Riak-Company-to-Cassandra/で、2 つの優れた (おそらく偏った) 比較を見つけることができます。
使用とダウンロードは異なります。リファレンスを取得するのに最適です。
おそらく、これらの企業での Riak の参照を共有できる場所で、プライベートな会話を行うことができますか? Cassandra でこれを実現する方法はわかりませんが、Cassandra をサポートする企業のコミュニティがあり、始めるのに適していると思われます。これらにはおそらく Cassandra 開発のコミュニティ参加者がいるため、開始するのに非常に合理的な場所である可能性があります。
顧客が満足している最近の大規模な展開に対する Riak の回答を聞きたいです。
また、各製品のロードマップも見てみたいです。私の見解では、Cassandra の wiki は制限事項や今後変更される可能性があることについて議論していますが、将来の概要については詳しく説明していないため、Riak よりも Cassandra を追跡するのが少し簡単です (http://wiki.apache.org/cassandra/)。オープン ソース コミュニティのことは理解できますが、おそらく...しかし、お金を払わなければならない製品を購入することはできません。
また、Cloudant の調査もお勧めします。Cloudant は、非常に優れた機能の階層化のように見えます。また、Apache ランドの他の場所での機能を実現しているようにも見えます。CouchDB は、Cloudant のベースとなっている Apache プラットフォームです。しかし、Lucene を使用したインデックス作成は、Cloudant の可能性を考えると氷山の一角に過ぎないように思われます。インデックスの作成と管理は、非常に体系的なプロセスであり、一種のデータ パイプラインであり、他の Apache コミュニティ アセットを使用してスクリプト化できます。NLP のような AND 機能も、Lucene を介して間接的に追加することも、永続化されたものに直接追加することもできます。
提案された Cloudant のロードマップを見るのは素晴らしいことです。特に、チームは Apache コミュニティの富を掘り起こし、それを Cloudant に統合することができるからです。他に理由がなければ、それを必要とする Cloudant 収益モデルの運用コンポーネントがあるため、おそらくそのようなものは存在します。
もう 1 つの関心分野 ... Cloudant の価格設定モデル ... 彼らの収益モデルがソフトウェアに基づいているのではなく、サービスに基づいていることは明らかです。これは非常に魅力的で、Cassandra を取り巻くエコシステムとも一致しているようです。芭蕉の人々がまだ nosql コミュニティを十分に獲得しているかどうかはわかりません...彼らの Web サイトや製品に関する話題からそのようなものは見当たりません。
この Cloudant Web ページ (https://cloudant.com/the-data-layer/) が気に入っています。Erlang 機能が組み込まれているのを見て驚きました... CouchDB が Erlang で書かれているとは知りませんでした。これは Apache コミュニティでは珍しいように思われるからです (私の無知)。CouchDB は、私が知っている (現在) Erlang で書かれている他の nosql 製品よりも古いようです。彼らの戦略がどうであれ、彼らは少なくとも Amazon EC2 と Microsoft Azure をホスティング パートナーとして数えており、Microsoft と !Microsoft の世界を高く評価していることを示しています。これらのタイプのデータを処理するミドルウェアの価値の可能性 (キャッシュまたはハッシュ テーブル アプリケーションを超えて) を適切に認識している場合、これらはすべて非常に重要です。店が持っている可能性があります。
最後に、私はこのボードについてよく知りませんが、Andy Palmer のガイダンスは役に立ちそうです。彼は、(VoltDB を介して) 構造化データに対する何らかのガイダンスを、正しいか間違っているかに関わらず、非構造化データの KVP ハッシュ テーブルとして不当にブランド化される可能性がある世界にもたらすことができます。nosql「データベース」を取り巻く構造とエコシステムの必要性が認識されています... Google の Spanner への取り組みを目撃してください... KVP/小さな構造/検索機能の必要性が Google の Spanner スペースへの投資を動機付けました。Spanner のようなものは必要ないかもしれませんが、これらの nosql データベースを最新のクラウド アーキテクチャに合理的に組み込むには、改善された堅牢な「エンタープライズ」管理機能と相互運用性機能がおそらく必要です。必要な構造は、相互運用性の容易さと豊富な機能から生まれます。また、構造化されていないデータから構造化されたデータへの変換をサポートする新しい機能 (インデックス、NLP を使用して KVP BLOB 内の構造化および解析されたレンダリングを作成するなど、ロードマップに入れられて、公開され、ユーザー ベースを引き付けて成長させることができます)。Cloudantは成功する可能性が高いようです...私はそれを詳しく見ていきます...
そして、私がCouchDBについて見つけたものを見てください...
CouchDB には、オンザフライのドキュメント変換やリアルタイムの変更通知など、Web アプリの開発を簡単にする一連の機能が付属しています。使いやすい Web 管理コンソールも付属しています。ご想像のとおり、CouchDB から直接提供されました。私たちは分散スケーリングに非常に気を配っています。CouchDB は可用性が高く、分割耐性がありますが、結果整合性もあります。そして、私たちはあなたのデータをとても気にかけています。CouchDB には、データの安全性を最優先するフォールト トレラントなストレージ エンジンがあります。