デフォルトの Sitecore 8 インストールでは、かなりの数のアイテムを含むバケットがあります。ギリシャ語の RTE フィールドでコンテンツ検索クエリを発行すると、Sitecore が検索語をアクセントを区別して処理しているように見えますが、これはギリシャ語では正しくありません。
誰かがギリシャ語のインデックスアクセントを鈍感にする正しい方向に私を向けることができますか?
デフォルトの Sitecore 8 インストールでは、かなりの数のアイテムを含むバケットがあります。ギリシャ語の RTE フィールドでコンテンツ検索クエリを発行すると、Sitecore が検索語をアクセントを区別して処理しているように見えますが、これはギリシャ語では正しくありません。
誰かがギリシャ語のインデックスアクセントを鈍感にする正しい方向に私を向けることができますか?
アナライザーを変更する必要があります。この場合、分析方法に関しては、次の 2 つの適切なオプションが思い浮かびます。
を使用しorg.apache.lucene.analysis.el.GreekAnalyzer
ます。これは、あなたが求めていることを行うだけでなく、ギリシャ語のステミングを追加します。ステミングが本当に必要ない場合を除き、これがおそらく最良のオプションです。
GreekLowerCaseFilter
標準の小文字フィルターの代わりに、を使用するカスタム アナライザーを作成します。このフィルターは分音記号などを削除するので、探していることができると思います。
public class StandardWithGreekLower extends StopwordAnalyzerBase{
public StandardWithGreekLower() {
}
@Override
protected TokenStreamComponents createComponents(final String fieldName) {
StandardTokenizer src = new StandardTokenizer();
TokenStream filter = new StandardFilter(src);
filter = new GreekLowerCaseFilter(filter);
//If you want to add a stop filter, this would be a good place for it
return new TokenStreamComponents(src, filter);
}
}