1

一連の複数ページの PDF からページ レベルのASCIIテキストを取得しようとしています。私の現在のプロセスは、Sejda (素晴らしいツール) を使用してすべての PDF をバッチで分割し、分割された PDF (Sejda でバッチとして) からテキストを抽出して対応するテキスト ファイルにすることです。分割フェーズをバイパスして、ページ レベルのTXTファイルに直接移動する簡単な方法はありますか? 複数ページのPDFのコレクションを入力し、各PDFの各ページに対応するTXTファイルを出力したいと思います。任意の入力または洞察をいただければ幸いです。

私のプロセス

File.pdf --> File-001.pdf; File-002.pdf; etc. --> File-001.txt; File-002.txt; etc
4

1 に答える 1