0

デフォルトの Sitecore 8 インストールでは、かなりの数のアイテムを含むバケットがあります。ギリシャ語の RTE フィールドでコンテンツ検索クエリを発行すると、Sitecore が検索語をアクセントを区別して処理しているように見えますが、これはギリシャ語では正しくありません。

誰かがギリシャ語のインデックスアクセントを鈍感にする正しい方向に私を向けることができますか?

4

2 に答える 2

0

アナライザーを変更する必要があります。この場合、分析方法に関しては、次の 2 つの適切なオプションが思い浮かびます。

  • を使用しorg.apache.lucene.analysis.el.GreekAnalyzerます。これは、あなたが求めていることを行うだけでなく、ギリシャ語のステミングを追加します。ステミングが本当に必要ない場合を除き、これがおそらく最良のオプションです。

  • GreekLowerCaseFilter標準の小文字フィルターの代わりに、を使用するカスタム アナライザーを作成します。このフィルターは分音記号などを削除するので、探していることができると思います。

    public class StandardWithGreekLower extends StopwordAnalyzerBase{
        public StandardWithGreekLower() {
        }
    
        @Override
        protected TokenStreamComponents createComponents(final String fieldName) {
            StandardTokenizer src = new StandardTokenizer();
            TokenStream filter = new StandardFilter(src);
            filter = new GreekLowerCaseFilter(filter);
            //If you want to add a stop filter, this would be a good place for it
            return new TokenStreamComponents(src, filter);
        }
    }
    
于 2016-08-25T17:09:39.953 に答える