次のタスクを実行するにはJavaライブラリが必要です1)PDFページを画像に変換します2)ページ上に場所があるPDFページからHTMLテキストを抽出します3)PDFページから画像を抽出します
私はすでに試しました
- PDFBox-エラーで失敗します-サポートされていない/無効な操作:BDCおよびEMC
- icePDF-タスク1)と3)で機能しますが、有料です。
- PDFRenderer-失敗します
- BFO-有料のライブラリですが、タスク1)および3)を実行できます
誰かがより良い解決策を提案できますか?