Elasticsearch-analysis-kuromoji を使用して日本語で検索を実行していますが、2 つの非常に奇妙な動作が発生しています。最初の 1 つは、検索する文字が機能しないことです。各文字の間にスペースを入れて「輸出貿易易」として渡します。また、「と」などの文字は検索対象外です。
これは私の構成です:
.setSettings(ImmutableSettings.settingsBuilder().loadFromSource(jsonBuilder()
.startObject()
.startObject("analysis")
//
.startObject("tokenizer")
.startObject("kuromoji_user_dict")
.field("type", "kuromoji_tokenizer")
.field("mode", "extended")
.field("discard_punctuation", "false")
.endObject()
.endObject()
//
.startObject("analyzer")
.startObject(JAPANESE_LANGUAGE_ANALYSIS)
.field("type", "custom")
.field("tokenizer", "kuromoji_user_dict")
.endObject()
.endObject()
//
.endObject()
.endObject().string()));
構成が間違っているのでしょうか、それとも「輸出貿易とント」のような文字には別のトークナイザーが必要ですか?
ありがとうございました