Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
solrで検索結果が見つかった場所からページ番号を取得しようとしています。各ページを個別のsolrドキュメントとしてインデックス化するとうまくいくことがわかりました。しかし、pdf ファイルから単一のページにインデックスを付ける方法が見つからないようです。
ドキュメントの 1 ページを solr でインデックス化する方法を見つけた人はいますか?
各ページからテキストを個別に抽出し、個別のドキュメントをSolrに送信するために、pdfboxなどの任意のライブラリを使用できます