0

「例」を検索すると「(例)」が返されるように

ブラケット UTF コードを ignore_chars に配置しようとしましたが、うまくいきません。

現在の構成は次のとおりです。

production:
  version: 1.10-beta
  wordforms: lib/wordforms.txt
  stopwords: lib/stopwords.txt 
  charset_table: "0..9, a..z, _, U+023, A..Z->a..z, U+410..U+42F->U+430..U+44F, U+430..U+44F"
  ignore_chars: "U+0027, U+0028"
  morphology: stem_en
4

1 に答える 1

0

charset_tableにリストされていないすべての文字は、とにかく区切り文字としてカウントされます。したがって、文字セットテーブルにそれらがないため、単語の一部としてインデックスが作成されることはありません。

とにかく動作します。あなたは何か他の問題を抱えているに違いありません。

注意:丸括弧は16進数の28と29です。27は一重引用符です。

于 2013-01-23T12:31:24.467 に答える