sejda - 複数ページの PDF のコレクションからページレベルの ASCII テキストを抽出しますか?

翻译自：https://stackoverflow.com/questions/19583044 2013-10-25T06:55:10.957

222 次

一連の複数ページの PDF からページレベルのASCIIテキストを取得しようとしています。私の現在のプロセスは、Sejda (素晴らしいツール) を使用してすべての PDF をバッチで分割し、分割された PDF (Sejda でバッチとして) からテキストを抽出して対応するテキストファイルにすることです。分割フェーズをバイパスして、ページレベルのTXTファイルに直接移動する簡単な方法はありますか? 複数ページのPDFのコレクションを入力し、各PDFの各ページに対応するTXTファイルを出力したいと思います。任意の入力または洞察をいただければ幸いです。

私のプロセス

File.pdf --> File-001.pdf; File-002.pdf; etc. --> File-001.txt; File-002.txt; etc

sejda - 複数ページの PDF のコレクションからページレベルの ASCII テキストを抽出しますか?

1 に答える 1

Related

Reference