solr - コンテンツ全体ではなく、強調表示された solr フィールドのみを取得する

Question

solrを使用してpdf、wordドキュメントにインデックスを付けたいと思っていました。word/pdf ドキュメントのコンテンツ全体が、検索応答と強調表示されたフラグメントに表示されます。コンテンツは非常に長く、コンテンツの長さのために検索応答でそれを避けたかった.

コンテンツフィールドの強調表示されたフラグメントのみを取得することは可能ですか?

検索クエリはこちら

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content

ここにスキーマがあります

<field name="content" type="text_general" indexed="false" stored="true"multiValued="true"/>

<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>

 <copyField source="content" dest="text"/>

私はsolr 4.3を使用しています

score 1 · Accepted Answer

&hl.fragsize=100 (フラグメントサイズ) をクエリに追加することをお勧めします。デフォルトでは 100 になっているはずですが、完全なコンテンツを取得する理由がわかりません。そのためには、solrconfig.xml を確認する必要があります。

検索クエリを次のように変更してみてください。

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content&hl.fragsize=100

fragsize に関するドキュメントは次のとおりです: http://wiki.apache.org/solr/HighlightingParameters#hl.fragsize

score 0 · Accepted Answer

リクエスト URL で、返されるフィールドを指定できます。

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content&fl=text

または、コンテンツフィールドを格納できませんでした (ただし、格納もインデックスもされていないフィールドの有用性についてはわかりません)。

<field name="content" type="text_general" indexed="false" stored="false" multiValued="true"/>

2 に答える 2