重複の可能性:
Java で PDF ページを一連の画像にエクスポートする
PDFファイルから画像への変換に使用できる優れたJavaライブラリをいくつか提案してください。PDFBox: http://pdfbox.apache.org/を使用してみましたが、画像に変換した後、pdf ファイルのテキストのほとんどが画像で文字化けしました。「T」は「Y」、「C」は「#」などと読みます。
以下は、同じために使用したコードスニペットです。
PDDocument document = null;
document = PDDocument.load( pdfFile );
List pages = document.getDocumentCatalog().getAllPages();
for( int i=startPage-1; i<endPage && i<pages.size(); i++ )
{
try
{
PDPage page = (PDPage)pages.get( i );
BufferedImage image = page.convertToImage();
}
}
document.close();
フォントのレンダリングに問題があると思います。PDFBox の使用中に何かを見逃した可能性があると思われる場合は、お知らせください。
他の代替案も提案してください。
私は jPedal を使用してみました: http://www.jpedal.org/は問題なく動作しますが、無料ではないので、これに関するすべての良い代替案について提案してください。