-1

MongoDB に大量のツイートが保存されています。ツイートは次のようになります。

"_id" : ObjectId("4c02c58de500fe1be1000005"),
"contributors" : null,
"text" : "Hello world",
"user" : {
    "following" : null,
    "followers_count" : 5,
    "utc_offset" : null,
    "location" : "",
    "profile_text_color" : "000000",
    "friends_count" : 11,
    "profile_link_color" : "0000ff",
    "verified" : false,
    "protected" : false,
    "url" : null,
    "contributors_enabled" : false,
    "created_at" : "Sun May 30 18:47:06 +0000 2010",
    "geo_enabled" : false,
    "profile_sidebar_border_color" : "87bc44",
    "statuses_count" : 13,
    "favourites_count" : 0,
    "description" : "",
    "notifications" : null,
    "profile_background_tile" : false,
    "lang" : "en",
    "id" : 149978111,
    "time_zone" : null,
    "profile_sidebar_fill_color" : "e0ff92"
},
"geo" : null,
"coordinates" : null,
"in_reply_to_user_id" : 149183152,
"place" : null,
"created_at" : "Sun May 30 20:07:35 +0000 2010",
"source" : "web",
"in_reply_to_status_id" : {
    "floatApprox" : 15061797850
},
"truncated" : false,
"favorited" : false,
"id" : {
    "floatApprox" : 15061838001

たとえば、canon などのトピックに関するツイートを検索したい場合、「テキスト」をチェックして「canon」に関するすべてのツイートを検索するクエリをどのように作成すればよいでしょうか?

4

1 に答える 1

1

MongoDB には、テキスト内を検索するための直接的なネイティブ クエリ サポートはありません。全文検索への簡単なアプローチを実現する方法を示す公式ドキュメントがあります:
http://www.mongodb.org/display/DOCS/Full+Text+Search+in+Mongo

テキストを単語に分割し、インデックスを付けた配列に格納する必要があります。これにより、配列の内容と照合できます。それらをどのように分割するかはあなたの選択です。単語を小文字にして、小文字のキーワードと照合するだけかもしれません。または、オートコンプリートが必要な場合は、各単語のバリエーションや音声学などを行います。すべてステミングです。

これを行うように設計された全文検索エンジンほど堅牢ではありませんが、機能します。使用している言語によっては、一部のフレームワークに検索パッケージがあります。たとえば、私は mongodb をdjango の nonrel projectで使用していますが、語幹解析と検索用のさまざまなツールを提供する検索アプリがあります。

于 2012-05-13T05:30:27.340 に答える