0

このSolrドキュメントページには、次のコメントがあります。

注: おそらく、WordDelimiterFilter の前に ElisionFilter を使用するのが最善です。これにより、非常に遅いフレーズ クエリが回避されます。

http://wiki.apache.org/solr/LanguageAnalysis#French

スロー フレーズ クエリが発生する理由を誰か説明してもらえますか? 実際、私の WordDelimiterFilter 構成はファイルで動作し、ElisionFilter は WordDelimiterFilter 構成に何らかの形で既に含まれているため、必要ないと思います。

公演への影響はどうなのか気になります…

4

1 に答える 1

1

SOLR-1938に基づいて、 WordDelimiterFilter の前に ElisionFilter がある場合、l'avionトークンは 1 つだけ生成されますavion。しかし、ElisionFilter が存在しない場合、WordDelimiterFilter の設定によっては、次のような複数のトークンが生成される可能性があります。

l, avion, lavion

とにかく WordDelimiterFilter によって生成されるためavion、ElisionFilter が既にそこに含まれているかのように認識します。

スロー フレーズ クエリに関するコメントは、l'avionが検索された場合、ElisionFilter が存在しない場合に複数のトークンを検索することを意味していると思います。

更新:この投稿は問題を解決します: http://www.hahitrust.org/blogs/large-scale-search/tuning-search-performanceWhat we discovered is that the word “l’art” was being searched as a phrase query “l art”. Phrase queries are much slower than Boolean queries because the search engine has to read the positions index for the words in the phrase into memory and because there is more processing involved.

問題は、次のような二重引用符で検索することだと思います"l'avion"

于 2013-02-18T03:24:09.040 に答える