1

私が働いているアプリケーションでは、データベースでテキストを検索し(全文検索)、他の列に基づいて結果に優先順位を付ける必要があります。パフォーマンスを考慮すると、ここではどの種類のデータストアが最適ですか?構造化データを検索し、結果に優先順位を付ける必要があります。

RDBMSまたはドキュメントストア(Couch、Mongo)またはその他のNoSQLデータベースですか?または、Hadoopなどのバッチ処理ツールを使用して、検索用のデータを準備する必要がありますか?

道順を探しています。前もって感謝します。

4

1 に答える 1

1

1 か月前に同様の問題があり、nosql ソリューションのパフォーマンス上の利点について確固たる事実、説明可能な測定値があるかどうかを知りたがっていました。

だから私は比較のためにグーグルで検索し、ピエール・イヴがほんの数日前に行ったこのきちんとしたテストを見つけました。

結論: パフォーマンスに関しては、ドキュメント ストアがリードしているように見えますが、nosql ソリューションの場合と同様に、トレードオフを念頭に置く必要があります。

更新:私が言及するのを忘れていたのは、ピエールは大文字と小文字の区別による速度の違いについても議論していたことです。全文検索では、ほとんどの場合、大文字と小文字を区別しない検索が必要になるため、全文検索ではこの議論を完全に理解することはできません。たぶん、あなたが検索していた単語は、大文字で (小さな s で!) 重要としてマークされていて、大文字と小文字を区別するアプローチでは決して見つからないでしょう。

于 2012-07-16T10:25:12.390 に答える