MySql 全文検索はラテン語以外の言語でも適切に機能しますか? (ヘブライ語、アラビア語、日本語...)
追加: いくつかのテストを行いました... ヘブライ語に問題があります。例: 名前מו ס ינזוןはמו ש ינזוןと同じように発音されますが、一方を検索しても他方が見つかりません。これはヘブライ語でよくあるスペルミスであるため、完全に機能させるにはデータ操作を行う必要があるようです。 .
MySql 全文検索はラテン語以外の言語でも適切に機能しますか? (ヘブライ語、アラビア語、日本語...)
追加: いくつかのテストを行いました... ヘブライ語に問題があります。例: 名前מו ס ינזוןはמו ש ינזוןと同じように発音されますが、一方を検索しても他方が見つかりません。これはヘブライ語でよくあるスペルミスであるため、完全に機能させるにはデータ操作を行う必要があるようです。 .
MySQL でのヘブライ語のサポートは限られていますが、あなたの問題は、間違ったスペルを使用している人々の問題であり、この観点から見ると MySQL サーバーの機能不全です。Google で単語のつづりを間違えると、候補が表示され、その候補をクリックしてその用語を検索できます。
おそらく、同じ動作をするプログラムを作成できます。たとえば、2 つのフィールドを持つテーブルを作成できます。1 つは一般的にスペルが間違っている単語を含み、もう 1 つは正しいスペルを含みます。次に、スペルミスのある単語を見つけて候補を表示するプログラムを作成できます。
照合順序が適切に設定されている限り、うまく機能します。
もちろん、Unicode はこれらのほとんどで機能します。しかし、これではラテン文字がうまく翻訳されません (たとえば、オランダ語の照合でaa
は は として認識されますå
)。
Japanese
理解できないChinese
独自の空白記号を使用します。MySQL
索引付けするテキスト内の単語がASCII
区切り文字(スペース、コンマなど)で区切られていることを確認してください。範囲外のASCII
ものはおそらく機能しません。
さらに、おそらく修正する必要がありますft_min_word_len
。デフォルトでは、文字より短い単語、およびほとんどのMySQL
単語にインデックスを付けません。4
Japanese
Chinese
言語ではCyrillic
、変換エラーは非常に一般的です。
このシーケンスのすべての文字:АВЕКМНОРСТуХ / ABEKMHOPCTyX
ほとんどのフォントで区別できません。
それらの最悪のものはキリル文字С
/ラテン文字C
です。これらの記号は両方ともキーボードの1つのキーにあり、ほとんどのフォントでまったく違いはありませんが、コードは異なります。
MySQL
それも捕まえません。
はい、ただし、ストップワードとは何かを確認してください。