1
4

1 に答える 1

3

solr.HTMLStripCharFilterFactoryを使用すると、HTML タグが"Indexed"になるのを防ぐことはできますが、"Stored"になることはできません。

つまり、"すもももももももものうち"(もちろん HTML タグを使用して) の結果は得られますが、 の場合は得られません"<p>すもももももももものうち</p>"

注:検索中に html タグを取り除かないことを前提としています。

これらの HTML タグにインデックスを付けたくない場合は、solr.PatternReplaceCharFilterFactoryを使用できます。

構成は次のようになります。

    <analyzer>
        <charFilter class="solr.PatternReplaceCharFilterFactory" 
                    pattern="Your regular expression to match HTML tags" 
                    replacement=""/>
        <tokenizer class="solr.CJKTokenizerFactory"/>
    </analyzer>
于 2013-03-08T10:19:51.823 に答える