3

#photographyと同じように検索できるようにしてほしいphotography。これらは、Sphinx では 2 つの異なる単語として扱われるべきです。デフォルトでは に#photographyマップされphotography、ハッシュタグを検索できません。

このページで、ハッシュタグを charset_table に追加してこれを実現できることを読みました。私はそれを行う方法について完全に無知です。私はユニコードを知りませんし、charset_table がどうあるべきかわかりません。

誰かが私のcharset_tableがどうあるべきか教えてもらえますか? ありがとう。

# charset_table     = 0..9, A..Z->a..z, _, a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F

注: リアルタイム インデックスを使用する予定です。(これが違いを生むかどうかはわかりません)

4

2 に答える 2

8

U+0023ユニコード表によると。したがって、最終的な構成は次のようになります

charset_table     = 0..9, A..Z->a..z, _, a..z, U+23, U+410..U+42F->U+430..U+44F, U+430..U+44F

charset_type変数を忘れないでください。私の知る限り、この例charset_tableutf-8. これに加えて、変数から削除して、Sphinx がそれを正当な文字としてインデックス化できるようにする必要がありU+23ますblend_chars

于 2012-04-30T12:01:57.180 に答える
0

写真だけでなく #photography も検索できるようにしてほしいです。これらは、Sphinx では 2 つの異なる単語として扱われるべきです。デフォルトでは、#photography は写真にマップされ、ハッシュタグを検索することはできません。

良い一日。

問題の回避策がいくつかあると思いますが、

ユーザークエリから直接検索機能を呼び出すのは悪い方法です。

sphinx エンジンで検索関数を呼び出す前に、ユーザー文字列に対して何らかの処理を行う必要があります。たとえば、ある種の特殊文字のユーザー文字列をチェックし、クエリから特殊文字を削除できます。その後、進行中のクエリで検索機能を呼び出すことができます。

幸運を。

于 2012-05-05T09:16:37.150 に答える