1

これが正当な質問であることを願っています。

私は(私にとって)非常に大きなデータセットを持っています。800 万行を超える 639 MB のテーブルがあります。私は主にこのデータを読み取り、データは本質的に永続的である必要があります (実際には変更されません)。

行数が 800 万行を超えていることに気づいたとき、最初に使用した mySql ソリューションがまだ最適であるかどうか疑問に思い始めました。これにより、Nosql とそのさまざまなサブセット (cassandra、mongodb、postgresql) に注目するようになりました。これらはすべて nosql のサブセットですよね?

だから今、グーグルでガイドをたくさん検索し、いくつかのプレゼンテーションを見て、いくつかのパワーポイントを読んだ後、基本的にcassandraとmongodbのようなものは本質的に同じかどうか疑問に思っています. SQLの代替が基本的にすべてnosqlの場合。データセットが大きすぎて、nosql ソリューションが従来の RDBMS ソリューションよりも最適になるのはいつですか? 大規模なデータセット以外に、(パフォーマンス上の理由以外で) nosql の代替を必然的に使用する他の理由はありますか? そして、一般的に、大規模なデータセットとスケーラビリティに最適な sql の代替手段、大規模なデータセットの資格、およびこれらの大規模なデータセットを処理する際の主要な業界標準は何ですか?

DBA がこれについて何を言わなければならないか、また Web 開発者に非常に興味があります。参考になる情報をありがとうございます。

編集: 「多くの優れた質問は、専門家の経験に基づいてある程度の意見を生成しますが、この質問への回答は、事実、参考文献、または特定の専門知識ではなく、ほぼ完全に意見に基づいている傾向があるため、この質問は保留になっています。」私はそれがどこから来ているのか理解しています。しかし、私の希望は、業界標準となる可能性のあるものについての洞察を得ることでした. この特定のインスタンスでどのタイプの DB を使用するかについて意見が分かれたり、つまらない意見が出たりするかもしれませんが、満たされている場合に mysql または nosql のいずれかの使用が認められるよく知られた標準が存在することは確かです。また、cassandra または mongodb のいずれかの使用を認定するサブスタンダードが存在する可能性もあります。私は、この分野で長年の経験を持つ誰かがチャイムを鳴らすか、これらを区別するために使用できるリソースを教えてくれることを望んでいました. これが不可能な場合は理解していますが、そうであることを願っています。乾杯、スティーブン。

4

1 に答える 1

1

800 万行と 639 MB のテーブルは、ほとんどの RDBMS にとって特別なものではありません。チューニングやインデックス作成が必要になる場合がありますが、それほど難しくはありません。

問題のテーブルの構造に基づいて DB を選択する必要があります。それが「実際の」テーブル (テーブル内のデータをテーブル形式で表すことができる) である場合、どの RDBMS もこのケースに適合するはずです。

于 2013-07-08T13:02:17.703 に答える