48

ScraperWikiの最新バージョンは、 Popplerに依存しています (または GitHub によると)。残念ながら、Windows ではなく、macOS と Linux での取得方法しか指定されていません。

簡単なグーグル検索では、あまり有望なものは何も見つかりませんでした。Windows で ScraperWiki 用に Poppler を入手する方法を知っている人はいますか?

4

15 に答える 15

9

更新 2

Owen Schwartz による回答を参照してください。


更新 1

Rumpel Stielzchenコメント:

このサイトはもう維持されていません。Poppler バージョン 0.68 は、今日では非常に古くなっています。Windows 用にコンパイルされた最新バージョンもここにあります: https://anaconda.org/conda-forge/poppler/files残念ながら 32 ビット バージョンはなく、64 ビットのみです。

…しかし、このパッケージには依存関係が含まれていません:

Anaconda の人々は、パッケージとすべての依存関係をダウンロードするためのツールを持っているようです。また、TAR パッケージにはファイル index.json があり、依存するパッケージがリストされています。依存関係を 1 つずつダウンロードしましたが、はい: 面倒でした。


元の答え

最新の Poppler Windows バイナリは、次の場所にあります。

http://blog.alivate.com.au/poppler-windows/

于 2015-07-07T10:28:03.123 に答える
5

Windows Subsystem for Linux (WSL) の使用を検討する必要があります。

  1. Windows 10 で WSL を有効にします (S エディションでは機能しません)。
  2. Windows ストアから WSL に Ubuntu (最新バージョン) をインストールします。
  3. Ubuntu コマンドラインを開く

Ubuntu コマンドラインで、次のコマンドを実行します。

  • sudo apt-get update
  • sudo apt-get upgrade
  • sudo apt install poppler-utils
  • pdftocairo -v- インストールされているバージョンを確認するには

その後、次の 2 つの方法で pdftocairo (たとえば) を実行できます。

  1. Ubuntu コマンドライン内:pdftocairo ...
  2. Windows コマンドラインから直接:wsl pdftocairo...

注: Ubuntu の各リリースには poppler のデフォルト バージョンがあります。Ubuntu に最新バージョンの poppler-utils をインストールする方法については、手順を参照する必要があります (インターネットにはたくさんあるはずです)。これには、ソース コードからコンパイルするかなりの数の手順が含まれる場合があります。たとえば、このhttps://askubuntu.com/a/722955のようなものです。そして、あなたは多くの問題を抱えているかもしれません。

Ubuntu 19.04 の最新バージョンは Poppler 74 をインストールできます。

于 2019-03-11T00:19:09.123 に答える
4

Poppler を Windows に簡単にインストールするには、環境変数に触れずに以下の手順を実行します。

  1. 次の URL から最新の Poppler バイナリをダウンロードします: http://blog.alivate.com.au/poppler-windows/index.html
  2. それを解凍し、C:/User/Poppler/poppler-0.68.0_x86/poppler-0.68.0/bin のパスに poppler-0.68.0_x86 フォルダーをコピーします。

次に、画像変換のために Poppler を呼び出す Python コードに移動し、以下のコード スニペットを使用します。

from pdf2image import convert_from_path
pages = convert_from_path('MyPdf.pdf', 500, poppler_path = r'C:\User\Poppler\poppler-0.68.0_x86\poppler-0.68.0\bin')
for page in pages:
    page.save('out.jpg', 'JPEG')
于 2020-09-07T09:16:42.587 に答える