7

私は現在、自分のWebサイトの基本的な全文検索を開発しようとしていますが、「よろしく」などの特定の単語がMySQL全文検索のストップワードとしてリストされていることに気付きました。特定のニュースアイテムを検索する人は必ずしも「よろしく」という単語を使用して検索するとは限らないので、これは今のところあまり気になりません(しかし、私は確かにすべての人に話すことはできません!)。しかし、私はここの誰かがストップワードリストを持つ理由について私に教えてくれることを望んでいました。ありがとう!

明確にするために: フルテキストテーブルにMyIsamを使用しています。ストップワードは、MySQLがインデックス付けしない単語です(フルテキストインデックスの場合)。この質問へのコメントに記載されているように、説明のないストップワードの完全なリストがあります。「彼ら」が選んだ言葉の背後に論理的根拠があったかどうかを知りたいだけです。

4

1 に答える 1

8

ストップワードは英語の一般的な単語です。ほとんどの場合、これらの単語にインデックスを付けないと、検索結果の関連性が高まり、インデックスが小さくなり、高速になります。

必要に応じて、ft_stopword_file変数を使用してストップワードリストを編集できます(または、''に設定して、ft_min_word_lenより長いまたは長いすべての単語にインデックスを付けることができます)。同じ理由で存在するft_min_word_len変数を使用して、インデックス付きの最小ワード長を変更することもできます。

于 2010-02-23T19:35:05.210 に答える