ExtractingRequestHandler を使用して、Solr で PDF のインデックスを作成しています。ドキュメントのヒットとともにページ番号を表示したいと思います。たとえば、「用語は2、3、5 ページfoo
に見つかりました」などです。bar.pdf
このようにクエリ結果にページ番号を含めることはできますか?
ExtractingRequestHandler を使用して、Solr で PDF のインデックスを作成しています。ドキュメントのヒットとともにページ番号を表示したいと思います。たとえば、「用語は2、3、5 ページfoo
に見つかりました」などです。bar.pdf
このようにクエリ結果にページ番号を含めることはできますか?
多少の開発作業が必要になりますが、各ドキュメントの各ページを個別の Solr ドキュメントとしてインデックス化し、フィールドの折りたたみを使用して各ドキュメントの異なるページ ヒットをグループ化することで、これを実現できます。
これにはナイトリーが必要であることに注意してください。フィールドの折りたたみは、現在リリースされている Solr バージョンには実装されていません。
また、注意: フィールドの折りたたみはバージョンSolr 3.3で実装されています。次の大きなバージョン ( Solr 4.0 )では、さらに多くの更新が予定されています。