PDFファイルをテキストに変換するためにPDFMinerをダウンロードしました。端末でこのコマンドを実行してファイルを変換します
python pdf2txt.py -o myOutput.txt simple1.pdf
それはうまくいきます。今度は、その関数を単純な Python スクリプトに埋め込みたいと思います。ディレクトリ内のすべての PDF ファイルを変換したい
# Lets say I have an array with filenames on it
files = [
'file1.pdf', 'file2.pdf', 'file3.pdf'
]
# And convert all PDF files to text
# By repeatedly executing pdf2txt.py
for x in range(0, len(files))
# And run something like
python pdf2txt.py -o output.txt files[x]
私も使用してみos.system
ましたが、点滅するウィンドウが表示されました(私の端末)。配列上のすべてのファイルをテキストに変換したかっただけです。