Javaのpdfbox APIでpdfに特定の単語を含むページ番号を取得するには?
私は単語を読むことができます:
PDFTextStripper s = new PDFTextStripper();
String contents = s.getText(pdoc);
if(contents.contains("SUBSCRIPTION DETAILS")){
...
}
しかし、この単語を含むページ番号が見つかりません
前もって感謝します。
PDFTextStripper
正確なページを読むことができます。したがって、すべてのページを繰り返し処理し、ページに特定の文字列が含まれているかどうかを確認する必要があります。
PDDocument pdoc = ...;
for(int pageNumber = 1; pageNumber < pdoc.getPageCount(); i++){
PDFTextStripper s = new PDFTextStripper();
s.setStartPage(pageNumber);
s.setEndPage(pageNumber);
String pageText = reader.getText(pdoc);
String contents = s.getText(pdoc);
if(contents.contains("SUBSCRIPTION DETAILS")){
...
}
}