大きなpdfからテキストを抽出しようとしましたが、最初のページしか取得できません。すべてのテキストを文字列変数に渡す必要があります。
これがコードです
public class ParsePDF {
public static void main(String args[]) throws Exception {
try {
File file = new File("C:/vlarge.pdf");
String content = new Tika().parseToString(file);
System.out.println("The Content: " + content);
}
catch (Exception e) {
e.printStackTrace();
}
}
}