質問: Python パッケージ "slate" を使用して、同じパスにある多くの PDF を読み込むにはどうすればよいですか?
600 を超える PDF を含むフォルダーがあります。
次のコードを使用して、slate パッケージを使用して単一の PDF をテキストに変換する方法を知っています。
migFiles = [filename for filename in os.listdir(path)
if re.search(r'(.*\.pdf$)', filename) != None]
with open(migFiles[0]) as f:
doc = slate.PDF(f)
len(doc)
ただし、これにより、「migFiles [0]」で指定された一度に1つのPDFに制限されます-0はパスファイルの最初のPDFです。
一度に多くの PDF をテキストに読み込んで、それらを個別の文字列または txt ファイルとして保持するにはどうすればよいですか? 別のパッケージを使用する必要がありますか? パス内のすべての PDF を読み込む「for ループ」を作成するにはどうすればよいですか?