ドイツ語のステミング SnowballPorterFilterFactory に問題があります。私はそれを機能させることができません。英語でもドイツ語でもありません。このAnalzyderDefを使用しています。
@AnalyzerDef(name = "customAnalyzer", charFilters = {
@CharFilterDef(factory = HTMLStripCharFilterFactory.class)},
tokenizer = @TokenizerDef(factory = StandardTokenizerFactory.class),
filters = {
@TokenFilterDef(factory = TrimFilterFactory.class),
@TokenFilterDef(factory = LowerCaseFilterFactory.class),
@TokenFilterDef(factory = SnowballPorterFilterFactory.class, params = {
@Parameter(name = "language", value = "German2")
}),
@TokenFilterDef(factory = WordDelimiterFilterFactory.class, params = {
@Parameter(name = "splitOnCaseChange", value = "1"),
@Parameter(name = "splitOnNumerics", value = "1"),
@Parameter(name = "generateWordParts", value = "1"),
@Parameter(name = "preserveOriginal", value = "1")
}),
@TokenFilterDef(factory = EdgeNGramFilterFactory.class, params = {
@Parameter(name = "minGramSize", value = "5"),
@Parameter(name = "maxGramSize", value = "15"),
@Parameter(name = "side", value = "front")
})
}))
ここで述べたように、ウォーク/ウォーキング/ウォークで試しました。フィルターの組み合わせが問題なのでしょうか。