python - Python から pdftotext を実行する

Question

ソフトウェアを使用して PDF ドキュメントをテキストドキュメントに変換しようとしていpdftotextます。

ファイルを変換するには、Python スクリプトからこのアプリケーション inc コマンドプロンプトを呼び出す必要があります。

私は次のコードを持っています:

import os 
import subprocess

path = "C:\\Users\\..." 
pdffname = "pdffilename.pdf" 
txtfname = "txtfilename.txt"

subprocess.call(['pdftotext', '-layout', 
     os.path.join(path, pdffname),
     os.path.join(path, txtfname)])

このコードを実行すると、エラーが発生します

  File "C:/Users/.../code-1.py", line 44, in <module>
    os.path.join(path, txtfname)])

  File "C:\Anaconda\lib\subprocess.py", line 522, in call
    return Popen(*popenargs, **kwargs).wait()

  File "C:\Anaconda\lib\subprocess.py", line 710, in __init__
    errread, errwrite)

  File "C:\Anaconda\lib\subprocess.py", line 958, in _execute_child
    startupinfo)

WindowsError: [Error 2] The system cannot find the file specified

pdftotextPython からアプリケーションを呼び出して、pdf をテキストファイルに変換するのを手伝ってもらえますか。

score 1 · Accepted Answer

Popen を除いて、これと同じエラーが発生しました。サブプロセス呼び出しで pdftotext.exe へのフルパスを提供することで修正しました。バックスラッシュをエスケープすることを忘れないでください。

私はアナコンダについてあまり知りませんし、これを自分でテストしたこともありませんが、Windows でスクリプトを参照する際に Conda で問題が発生する可能性があると思います: Windowsでのスクリプトへの参照を修正する

python - Python から pdftotext を実行する

1 に答える 1

Related

Reference