0

索引付けされた膨大な数の段落から自動提案を実装しようとしています。しかし、自動提案に表示される特定の不要な単語を除外したいと思います。たとえば、「and」、「how」、「when」などの単語は避ける必要があります。どうすればいいですか。

これは、solrconfig.xml で autosuggest に対して行った構成です。

<requestHandler class="org.apache.solr.handler.component.SearchHandler" name="/suggest">
    <lst name="defaults">
      <str name="spellcheck">true</str>
      <str name="spellcheck.dictionary">suggest</str>
      <str name="spellcheck.onlyMorePopular">true</str>
      <str name="spellcheck.count">5</str>
      <str name="spellcheck.collate">true</str>
    </lst>
    <arr name="components">
      <str>suggest</str>
    </arr>
  </requestHandler>


<searchComponent class="solr.SpellCheckComponent" name="suggest">
<lst name="spellchecker">
  <str name="name">suggest</str>
  <str name="classname">org.apache.solr.spelling.suggest.Suggester</str>
  <str name="lookupImpl">org.apache.solr.spelling.suggest.tst.TSTLookup</str>

  <str name="field">keywords</str> 
  <float name="threshold">0.005</float>
  <str name="buildOnCommit">true</str>

</lst>

4

1 に答える 1

0

schema.xml ファイルのフィールドのバッキング定義にStopFilterFactoryを追加することをお勧めします。他の検索要件のためにフィールドにこれらの単語 (「and」、「how」、「when」) が必要な場合は、suggester用に schema.xml にカスタム フィールドを作成することをお勧めします。copyFieldディレクティブを使用して、この新しいフィールドに入力します。fieldTypekeywordskeywords

于 2013-04-18T11:59:19.263 に答える