Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
PDFTextStripper クラスを使用して、Lucene インデックス作成の前に PDF テキストを抽出します。
抽出されたテキストから pdf ヘッダーとフッターを除外する可能性はありますか?
ドキュメント内のヘッダーとフッターの正確な位置がわかっている場合は、領域ごとのテキスト抽出を使用できます。お役に立てれば。