1

solrを使用してpdf、wordドキュメントにインデックスを付けたいと思っていました。word/pdf ドキュメントのコンテンツ全体が、検索応答と強調表示されたフラグメントに表示されます。コンテンツは非常に長く、コンテンツの長さのために検索応答でそれを避けたかった.

コンテンツ フィールドの強調表示されたフラグメントのみを取得することは可能ですか?

検索クエリはこちら

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content

ここにスキーマがあります

<field name="content" type="text_general" indexed="false" stored="true"multiValued="true"/>

<field name="text" type="text_general" indexed="true" stored="false" multiValued="true"/>

 <copyField source="content" dest="text"/>

私はsolr 4.3を使用しています

4

2 に答える 2

1

&hl.fragsize=100 (フラグメント サイズ) をクエリに追加することをお勧めします。デフォルトでは 100 になっているはずですが、完全なコンテンツを取得する理由がわかりません。そのためには、solrconfig.xml を確認する必要があります。

検索クエリを次のように変更してみてください。

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content&hl.fragsize=100

fragsize に関するドキュメントは次のとおりです: http://wiki.apache.org/solr/HighlightingParameters#hl.fragsize

于 2013-05-14T18:10:51.750 に答える
0

リクエスト URL で、返されるフィールドを指定できます。

http://localhost:8080/solr4x/collection1/select?q=Scripting&wt=xml&hl=true&hl.fl=content&fl=text

SOLR フィールド パラメータ

または、コンテンツ フィールドを格納できませんでした (ただし、格納もインデックスもされていないフィールドの有用性についてはわかりません)。

<field name="content" type="text_general" indexed="false" stored="false" multiValued="true"/>
于 2013-05-14T21:00:49.110 に答える