5

ExtractingRequestHandler を使用して、Solr で PDF のインデックスを作成しています。ドキュメントのヒットとともにページ番号を表示したいと思います。たとえば、「用語は2、3、5 ページfooに見つかりました」などです。bar.pdf

このようにクエリ結果にページ番号を含めることはできますか?

4

1 に答える 1

5

多少の開発作業が必要になりますが、各ドキュメントの各ページを個別の Solr ドキュメントとしてインデックス化し、フィールドの折りたたみを使用して各ドキュメントの異なるページ ヒットをグループ化することで、これを実現できます。

これにはナイトリーが必要であることに注意してください。フィールドの折りたたみは、現在リリースされている Solr バージョンには実装されていません。

また、注意: フィールドの折りたたみはバージョンSolr 3.3で実装されています。次の大きなバージョン ( Solr 4.0 )では、さらに多くの更新が予定されています。

于 2010-11-04T11:04:16.593 に答える