PDFファイルからテキストコンテンツを抽出するにはどうすればよいですか。pdfboxを使用してPDFファイルからテキストを抽出していますが、ヘッダーとフッターを取得していますが、必要ありません。次のJavaコードを使用しています。
PDFTextStripper stripper = null;
try {
stripper = new PDFTextStripper();
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}
stripper.setStartPage(pageCount);
stripper.setEndPage(pageCount);
try {
String pageText = stripper.getText(document);
System.out.println(pageText);
} catch (Exception e) {
// TODO Auto-generated catch block
e.printStackTrace();
}