4

windows8 のスレート パッケージを使用して、python 3.5.0 を使用して Pdf ファイルからテキストを抽出したいと考えています。

問題:スレート パッケージを正常にインストールしましたが、スレートをインポートしようとすると、特定のエラーが発生します。不足しているものを提案してください。

エラー:

トレースバック (最新の呼び出しが最後): ファイル ""、1 行目、インポート スレート ファイル "C:\Users\name\AppData\Local\Programs\Python\Python35-32\lib\site-packages\slate-0.4.1 -py3.5.egg\slate__init__.py"、66 行目、スレート インポート PDF から

ImportError: 名前 'PDF' をインポートできません

4

3 に答える 3

3

popplerライブラリからpdftotext( Windows バージョン) を試すことができます。

スタンドアロン プログラムとして、Python は必要ありません。しかし、次のように、Python からサブプロセスとしてよく使用します。

import subprocess

args = ['pdftotext', '-layout', '-q', 'input.pdf', '-']
txt = subprocess.check_output(args, universal_newlines=True)
于 2015-12-28T20:44:43.973 に答える
2

スレートは PDFMiner に依存します (Python 3 はサポートされていません)。

次の方法でインストールを試すことができます。

pip install PDFMiner

私は pdfminer3k - pypi - をインストールしまし、最初はうまく反応しませんでした (そしてドキュメントは良くありませんでした) 。これらのいずれかが満たされているかどうか教えてください。

于 2015-12-28T20:35:01.197 に答える
2

pdfminer.sixをインストールできます

pip install pdfminer.six

https://pypi.python.org/pypi/pdfminer.six/20160614

于 2017-02-16T10:52:29.357 に答える