sitecore - Sitecore lucene ギリシャ語検索はアクセントを区別しますか?

Question

デフォルトの Sitecore 8 インストールでは、かなりの数のアイテムを含むバケットがあります。ギリシャ語の RTE フィールドでコンテンツ検索クエリを発行すると、Sitecore が検索語をアクセントを区別して処理しているように見えますが、これはギリシャ語では正しくありません。

誰かがギリシャ語のインデックスアクセントを鈍感にする正しい方向に私を向けることができますか?

score 0 · Accepted Answer

アナライザーを変更する必要があります。この場合、分析方法に関しては、次の 2 つの適切なオプションが思い浮かびます。

を使用しorg.apache.lucene.analysis.el.GreekAnalyzerます。これは、あなたが求めていることを行うだけでなく、ギリシャ語のステミングを追加します。ステミングが本当に必要ない場合を除き、これがおそらく最良のオプションです。

GreekLowerCaseFilter標準の小文字フィルターの代わりに、を使用するカスタムアナライザーを作成します。このフィルターは分音記号などを削除するので、探していることができると思います。

public class StandardWithGreekLower extends StopwordAnalyzerBase{
    public StandardWithGreekLower() {
    }

    @Override
    protected TokenStreamComponents createComponents(final String fieldName) {
        StandardTokenizer src = new StandardTokenizer();
        TokenStream filter = new StandardFilter(src);
        filter = new GreekLowerCaseFilter(filter);
        //If you want to add a stop filter, this would be a good place for it
        return new TokenStreamComponents(src, filter);
    }
}

sitecore - Sitecore lucene ギリシャ語検索はアクセントを区別しますか?

2 に答える 2

Related

Reference