質問する
506 次
1 に答える
3
solr.HTMLStripCharFilterFactoryを使用すると、HTML タグが"Indexed"になるのを防ぐことはできますが、"Stored"になることはできません。
つまり、"すもももももももものうち"
(もちろん HTML タグを使用して) の結果は得られますが、 の場合は得られません"<p>すもももももももものうち</p>"
。
注:検索中に html タグを取り除かないことを前提としています。
これらの HTML タグにインデックスを付けたくない場合は、solr.PatternReplaceCharFilterFactoryを使用できます。
構成は次のようになります。
<analyzer>
<charFilter class="solr.PatternReplaceCharFilterFactory"
pattern="Your regular expression to match HTML tags"
replacement=""/>
<tokenizer class="solr.CJKTokenizerFactory"/>
</analyzer>
于 2013-03-08T10:19:51.823 に答える