0

PDFMiner 3k を使用したい、Windows で python 3.3.3 を使用している、PFDMiner 3k を使用するためにどのような手順を記述すればよいかわかりません。多くのコードを試しましたが、まだ機能しません。そのうちのいくつかはたとえば、PDFMiner(python 2.7)の場合、次のコードを試しました:

import nltk

from io import StringIO

from pdfminer.pdfinterp import PDFResourceManager, PDFPageInterpreter

from pdfminer.converter import TextConverter

from pdfminer.layout import LAParams

from pdfminer.pdfpage import PDFPage

スクリプトのファイルを、PDFMiner 3k のディレクトリを含むディレクトリに配置したことに注意してください。後者は pdfminer という名前です。

次のエラーが表示されます:

 ImportError: No module named 'pdfminer.pdfminer'; pdfminer is not a package

何か提案はありますか?、助けが必要です。

4

1 に答える 1

1

わかりにくいですが、PDFMiner3k をインストールせず、データと同じディレクトリに解凍したことが問題のようです。

そうしないでください。いくつかのパッケージはそのように機能しますが、ほとんどのパッケージは機能しません。

また、PDFMiner3kPython に付属していないいくつかのパッケージが必要ですply。それらがなければ、うまくいきません。

パッケージをインストールする正しい方法は、ほとんどの場合、pip.

実際、ダウンロードする必要さえありません。だけpip install PDFMiner3kで、pip最新バージョンと、必要なすべての最新バージョンを検索し、それらすべてをインストールします。


もちろん、作業する場合は NLTK もインストールする必要がありますnltk。しかし、おそらくそのコマンドを推測できます。

ビルドに C コンパイラが必要なパッケージがいくつかあります。これらのほとんどにはバイナリ ホイールがあるはずなので、pip install spamまだ機能しますが、一部のパッケージは完全に最新ではありません。そのため、コンパイラや vcvarsall などに関するエラーが発生した場合は、Christoph Gohlke のサイトをチェックしてください。彼は、独自に作成しないパッケージ用の車輪を持っています。

于 2015-04-20T09:37:32.403 に答える