solr - Solrのハイライトフラグメントサイズは無制限に設定されていますが、それでも大きなドキュメントを切り捨てていますか？

Question

さまざまなサイズのSolrに約15kのドキュメントをロードしました。私が測定した最大のものは、59,455文字のプレーンテキストです。強調表示と無制限のフラグメントサイズを使用してクエリを実行すると、この大きなドキュメントは51,253に切り捨てられます（これには、preタグとpostタグが含まれます）。

クエリのURLは次のとおりです。

http://solr.nowhere.org:8080/solr/select?fl=*,score&sort=score%20desc&hl=true&hl.fragsize=-1&hl.fl=note&hl.simple.pre=<hit>&hl.simple.post=</hit>&hl.q=corn&q=corn

Solrがまだ切り捨てられているのはなぜですか？

Solr4.0を使用しています。

score 3 · Accepted Answer

また、 hl.maxAnalyzedCharsの値を上げる必要があります。これは、この値も強調表示の結果を制限しているためです。

適切なスニペットを探すためのドキュメントへの文字数。このパラメーターは、元の蛍光ペンにのみ意味があります。

デフォルト値は「51200」です。

このパラメーターに大きな値を割り当て、hl.fragsize = 0を使用して、51200文字を超えるサイズの大きなフィールドで強調表示を返すことができます。

したがって、この変更に基づいてhl.fragsize=0、最長のドキュメントよりも大きい値をhl.max.analyzedCharsパラメータに追加します。

solr - Solrのハイライトフラグメントサイズは無制限に設定されていますが、それでも大きなドキュメントを切り捨てていますか？

1 に答える 1

Related

Reference