4

私はapacheのcassandraプロジェクトで遊んでいます。かなりの読み込みを行いました。データの単一セットとバッチセットの挿入、キーに基づく単一データセットと複数データセットの取得など、かなり複雑な例がいくつかあります。私が見た記事のいくつかは含まれています

http://www.rackspacecloud.com/blog/2010/05/12/cassandra-by-example http://github.com/digg/lazyboy http://arin.me/blog/wtf-is-a- supercolumn-cassandra-data-model http://www.sodeso.nl/?p=80

説明されている概念をかなりよく理解しており、簡単なアプリも実装しています。

たとえば、クエリがユーザーが入力した検索用語である場合に、クエリを実行する方法については、どの記事にも説明されていません。

誰かがそのようなクエリを実行する方法を知っているか、提案することができますか?または、検索可能なインデックス、全文検索、またはリモートで閉じるものを作成する方法はありますか?

4

1 に答える 1

3

おそらくテキストを単語に分割し、これらの単語を「インデックス」のキーとして使用します。各単語には、記事やメッセージなどのIDのリストを含むタイムスタンプ順の列ファミリーが含まれます。したがって、キー(単語)に対してのみ単純な検索を実行できます。複数の単語を検索する場合は、これらの列ファミリーの共通部分を使用してください。

これは非常に単純なアプローチです。より複雑なクエリが必要な場合は、Lucandraをご覧ください-http://github.com/tjake/Lucandra-Lucandraは、バックエンドストレージとしてCassandraを備えた全文検索エンジンです。

于 2010-08-09T23:17:11.970 に答える