17

を使用してPDFファイルusinfPDFBox全体のテキストを読み取る方法を知っていますPDFTextStripper.getText(PDDocument)

を使用して特定のページへのオブジェクト参照を取得する方法のサンプルもありますPDDocumentCatalog.getAllPages().get(i)

クラスにそのようなメソッドが表示されないので、PDFBoxを使用して1ページのテキストを取得するにはどうすればよいPDPageですか?

4

1 に答える 1

32

でパラメータを設定して、PDFTextStripper特定のページを読み取ることができます。

PDDocument doc; // document
int i; // page no.

PDFTextStripper reader = new PDFTextStripper();
reader.setStartPage(i);
reader.setEndPage(i);
String pageText = reader.getText(doc);

私が知る限り、PDPageテキストを抽出するよりも、画面上でページを表現するのに使用されています。そのため、これを使用してテキストを抽出することはお勧めしません。

于 2013-03-28T18:44:07.013 に答える