ScraperWikiの最新バージョンは、 Popplerに依存しています (または GitHub によると)。残念ながら、Windows ではなく、macOS と Linux での取得方法しか指定されていません。
簡単なグーグル検索では、あまり有望なものは何も見つかりませんでした。Windows で ScraperWiki 用に Poppler を入手する方法を知っている人はいますか?
ScraperWikiの最新バージョンは、 Popplerに依存しています (または GitHub によると)。残念ながら、Windows ではなく、macOS と Linux での取得方法しか指定されていません。
簡単なグーグル検索では、あまり有望なものは何も見つかりませんでした。Windows で ScraperWiki 用に Poppler を入手する方法を知っている人はいますか?
更新 2
Owen Schwartz による回答を参照してください。
更新 1
このサイトはもう維持されていません。Poppler バージョン 0.68 は、今日では非常に古くなっています。Windows 用にコンパイルされた最新バージョンもここにあります: https://anaconda.org/conda-forge/poppler/files残念ながら 32 ビット バージョンはなく、64 ビットのみです。
…しかし、このパッケージには依存関係が含まれていません:
Anaconda の人々は、パッケージとすべての依存関係をダウンロードするためのツールを持っているようです。また、TAR パッケージにはファイル index.json があり、依存するパッケージがリストされています。依存関係を 1 つずつダウンロードしましたが、はい: 面倒でした。
元の答え
最新の Poppler Windows バイナリは、次の場所にあります。
Windows Subsystem for Linux (WSL) の使用を検討する必要があります。
Ubuntu コマンドラインで、次のコマンドを実行します。
sudo apt-get update
sudo apt-get upgrade
sudo apt install poppler-utils
pdftocairo -v
- インストールされているバージョンを確認するにはその後、次の 2 つの方法で pdftocairo (たとえば) を実行できます。
pdftocairo ...
wsl pdftocairo...
注: Ubuntu の各リリースには poppler のデフォルト バージョンがあります。Ubuntu に最新バージョンの poppler-utils をインストールする方法については、手順を参照する必要があります (インターネットにはたくさんあるはずです)。これには、ソース コードからコンパイルするかなりの数の手順が含まれる場合があります。たとえば、このhttps://askubuntu.com/a/722955のようなものです。そして、あなたは多くの問題を抱えているかもしれません。
Ubuntu 19.04 の最新バージョンは Poppler 74 をインストールできます。
Poppler を Windows に簡単にインストールするには、環境変数に触れずに以下の手順を実行します。
次に、画像変換のために Poppler を呼び出す Python コードに移動し、以下のコード スニペットを使用します。
from pdf2image import convert_from_path
pages = convert_from_path('MyPdf.pdf', 500, poppler_path = r'C:\User\Poppler\poppler-0.68.0_x86\poppler-0.68.0\bin')
for page in pages:
page.save('out.jpg', 'JPEG')