indexing - 検索エンジンのデータストレージとしての Couchbase または Riak

Question

テキスト検索エンジンを実装したい。索引付けする特定の文書は、重みのある用語のリストになります。
クエリは用語の単純なリストです。
検索の出力は、関連性の一致 (用語とその重みに対して) によってソートされたリストである必要があります。保存する必要があるデータは大きいです。単一のノードには収まりません。そのため、最終的なストレージは簡単に配布できる必要があります。

どのデータベースストレージをお勧めしますか? いくつかの分析の後、Couchbase と Riak のどちらかを選択したいと思います。

[編集] 単なるリレーショナルデータベースについてどう思いますか? 彼らはすでに配布のための優れたメカニズムを持っています（例：Postgres 9には組み込まれています）[/編集]

Riak には組み込みの検索機能がありますが、私が知る限り、それを使用したくありません。応答を取得するために (すべてのクエリに対して計算するのではなく) インデックスが必要だからです。

一方、Couchbase 2 は " JSON ドキュメントのセカンダリインデックスを追加します。インデックスはビューを介して作成され、クエリを実行できます。インデックス作成は均等に分散されます。 "
これは Couchbase にとって大きな利点のように思えます。

score 1 · Accepted Answer

全文検索にはRiakSearchをお勧めします。これは非常に強力で、 Luceneの利点のほとんどを取り入れながら、透過的にフォールトトレラントで、複製され、スケーラブルです。データが単一のノードに収まらない場合は、おそらく最もバランスの取れたオープンソースソリューションです。

score 1 · Accepted Answer

1

ElasticSearch と CouchDB を使用しましたが、かなりうまく機能します。

于 2012-04-24T15:32:20.573 に答える

indexing - 検索エンジンのデータ ストレージとしての Couchbase または Riak

3 に答える 3

Related

Reference

indexing - 検索エンジンのデータストレージとしての Couchbase または Riak