java - ヘッダーとフッターなしでPDFファイルからテキストコンテンツを抽出するにはどうすればよいですか

翻译自：https://stackoverflow.com/questions/26971401 2014-11-17T11:11:17.080

4812 次

PDFファイルからテキストコンテンツを抽出するにはどうすればよいですか。pdfboxを使用してPDFファイルからテキストを抽出していますが、ヘッダーとフッターを取得していますが、必要ありません。次のJavaコードを使用しています。

PDFTextStripper stripper = null;
  try {
    stripper = new PDFTextStripper();
   } catch (Exception e) {
      // TODO Auto-generated catch block
      e.printStackTrace();
   }
     stripper.setStartPage(pageCount);
     stripper.setEndPage(pageCount);
   try {
      String pageText = stripper.getText(document);
       System.out.println(pageText);  
    } catch (Exception e) {
     // TODO Auto-generated catch block
     e.printStackTrace();
 }

java - ヘッダーとフッターなしでPDFファイルからテキストコンテンツを抽出するにはどうすればよいですか

1 に答える 1

Related

Reference