1

Windowsマシンでapache-solr-3.6.0を使用しています。インデックスを作成する前に、コロンとピリオドを除くすべての句読点を削除したいと考えています。

私は試した:

<fieldType name="text_ar" class="solr.TextField" positionIncrementGap="100">
      <analyzer> 
        <tokenizer class="solr.WhitespaceTokenizerFactory"/>
        <filter class="solr.PatternReplaceFilterFactory" pattern="[\p{Punct}&&[^\.^\:]]" replacement="" replace="all"/>
      </analyzer>
    </fieldType>

しかし、うまくいきませんでした。何か案は?

4

1 に答える 1

2

あなたの代わりに次のパターンフィルターを使用してください。

<filter class="solr.PatternReplaceFilterFactory" pattern="([^a-zA-Z0-9.:])" replacement="" replace="all"/>
于 2012-09-24T10:22:22.417 に答える