2

現在、Solr スキーマのテキスト フィールドでファセット検索をテストしており、stopwords.txt ファイルに多数の結果が含まれていることに気付きました。

私のスキーマは現在、テキスト データ型の既定の構成を使用しており、"solr.StopFilterFactory" フィルターが使用されている場合、ストップワードがインデックス化されていないという印象を受けました。

誰かがこれに光を当てて、a) ストップワードがファセットに適用されない理由とそれをどう扱うかを理解するのを手伝ってくれるか、b) ファセットクエリが返されないように正しい方向に私を向けてくれることを願っていますストップワードからの単語。

ありがとう!

4

1 に答える 1

1

ストップワードはファセットに適用されます。つまり、ストップワードで索引付けされたフィールドのファセットを要求した場合、ファセットにストップワードが表示されないようにする必要があります。

私の推測では、あなたが考えている方法でインデックスを作成していない可能性があります。schema.xml が間違っているか、考えているフィールドとは異なるフィールドでインデックスを作成しています。

私はこのフィールドでファセットを使用しており、うまく機能しています:

<fieldType name="text_ws_stop" class="solr.TextField" positionIncrementGap="100">
  <analyzer>
<tokenizer class="solr.WhitespaceTokenizerFactory"/>
            <filter class="solr.StopFilterFactory"
    ignoreCase="true"
            words="stopwords_spanish.txt"
            enablePositionIncrements="true"
    />
  </analyzer>
</fieldType>

...

<field name="phrases" type="text_ws_stop" indexed="true" stored="true" required="false"/>
于 2011-05-23T21:48:43.833 に答える