位置を考慮せずに重複を削除するために使用できるフィルターファクトリはありますか?
RemoveDuplicatesTokenFilterFactoryは位置[スタック]を考慮するため、使用できません。
一意にしたいフィールド内の重複する値がたくさんあるという同様の問題がありました。解決策は、 solrconfig.xmlファイルにプロセッサを追加することでした。以下はその例です。リストされたフィールドのすべての値は一意になります。私のフィールド名はcomponent_substance、active_moiety ..です。
<updateRequestProcessorChain>
<processor class="org.apache.solr.update.processor.UniqFieldsUpdateProcessorFactory">
<lst name="fields">
<str>ingredient_substance</str>
<str>active_moiety</str>
<str>generic_medicine</str>
<str>inactive_ingredient_substance</str>
</lst>
</processor>
<processor class="solr.RunUpdateProcessorFactory"/>
</updateRequestProcessorChain>