私のSolr実装では、発音区別符号を使用して検索するかどうかに関係なく、発音区別符号を含む単語と発音区別符号を含まない単語をクエリで返すようにします。
例を挙げると
検索語は「çest 」-Solrは「cest 」、「çest」、「çestca 」を返します検索語は「cest 」 -Solrは「 cest」、「çest」 、「 çestca」を返します
現在、最初の作品。「çest」を検索すると、cestとçestの両方が返されます。ただし、「cest」を検索すると、「cest」のみが返されます。
これが私のスキーマでどのように見えるかです:
<fieldType name="text_special_search" class="solr.TextField" positionIncrementGap="100">
<analyzer>
<filter class="solr.ASCIIFoldingFilterFactory"/>
<charFilter class="solr.PatternReplaceCharFilterFactory" pattern="\W+" replacement="-"/>
<tokenizer class="solr.LowerCaseTokenizerFactory"/>
</analyzer>
</fieldType>
両方の方法で機能させる方法はありますか?