サイズが7GBを超える非常に大きなPDFを使用しています。PDF には最大 20,000 ページと多くのフル ページのカラー画像があります。PDFBox を使用して PDF を操作したいのですが、サイズが大きいため、PDF を開こうとすると OutOfMemoryError が発生します。
Intellij、Java 6を使用して、Windows 7でバージョンpdfbox-app-1.6.0を使用しています。
最初に、PDF を PDDocument で開き、各ページを別の PDDocument にコピーする単純なプログラムを作成してみました: http://ideone.com/arKhB
次に、PDFBox CopyDocの例を使用してみました。
どちらの例もメモリ不足です。
これは、PDFBox がドキュメント全体をメモリに読み込もうとしているからだと思います。一度に1ページだけ開く方法はありますか?処理が遅くなることはわかっていますが、現時点では何も処理できません。