0

solrで検索結果が見つかった場所からページ番号を取得しようとしています。各ページを個別のsolrドキュメントとしてインデックス化するとうまくいくことがわかりました。しかし、pdf ファイルから単一のページにインデックスを付ける方法が見つからないようです。

ドキュメントの 1 ページを solr でインデックス化する方法を見つけた人はいますか?

4

1 に答える 1

1

各ページからテキストを個別に抽出し、個別のドキュメントをSolrに送信するために、pdfboxなどの任意のライブラリを使用できます

于 2012-08-16T12:04:29.527 に答える