Python を使用して pdftotext を実行しようとしていますが、何らかの理由でコードが機能しません。以下を実行すると、 content 変数に PDF のコンテンツが含まれると予想されますが、得られる結果は単なる空の文字列です。
私が欠けているものを誰か知っていますか?
def getPDFContent(path):
path = "/path/to/a valid/pdffile.pdf"
process = subprocess.Popen(["pdftotext", path], shell=False,
stdout=subprocess.PIPE, stderr=subprocess.STDOUT)
content, err = process.communicate()[0:2]
return content, err