PDF ファイルから画像を抽出する必要があるサービスを開発しています。Linux コマンド ラインから、次のようにPoppler ライブラリを使用して画像を抽出できます。
pdfimages my_file.pdf /tmp/image
私は Python Flask フレームワークを使用していて、Heroku でサービスを実行したいので、純粋な Python (または Flask システムの Heroku で実行できる任意のライブラリ) を使用して画像を抽出したいと考えています。
純粋なPythonでpdfから画像を抽出する方法を知っている人はいますか? 私はオープンソース ソリューションを好みますが、必要に応じて喜んで支払います (Heroku で自分の制御下で動作する限り)。