PDFから情報を解析/抽出するための小さなpythonスクリプトを作成しました。ローカル マシンでテストしました。python 2.6.2 と pdftotext バージョン 0.12.4 を使用しています。
これを自分の Web ホスティング サーバー (dreamhost) で実行しようとしています。Python バージョン 2.5.2 と pdftotext バージョン 3.02 があります。
しかし、スクリプトを実行しようとすると、pdftotext 行で次のエラーが発生します (単純な破棄スクリプトでも確認しました)「エラー: ファイル '-' を開けませんでした」
def ConvertPDFToText(currentPDF):
pdfData = currentPDF.read()
tf = os.tmpfile()
tf.write(pdfData)
tf.seek(0)
if (len(pdfData) > 0) :
out, err = subprocess.Popen(["pdftotext", "-layout", "-", "-"], stdin = tf, stdout=subprocess.PIPE ).communicate()
return out
else :
return None
私はこの関数に同じ PDF ファイルを渡していることに注意してください。別の関数では、Web ホストで実行されている同じスクリプトから PDF ドキュメントを自分自身に電子メールで送信できます。
私は何を間違っていますか?私のローカル バージョンとウェブホスト バージョンの間で、subprocess/python/pdftext の使用方法にどのような違いがあるのでしょうか? コマンドを変更する必要があると思いますので、どんな助けでも大歓迎です。
前もって感謝します。