テキスト ファイルと同じように、PDF ファイルのテキストを出力するコマンド ライン プログラムを探していcat
ます。
私は を見つけましたが、それは実行可能ですが、 にパイプしたいので、機能pdftotxt
を複製するものを好むでしょう。ありがとう!cat
grep
テキスト ファイルと同じように、PDF ファイルのテキストを出力するコマンド ライン プログラムを探していcat
ます。
私は を見つけましたが、それは実行可能ですが、 にパイプしたいので、機能pdftotxt
を複製するものを好むでしょう。ありがとう!cat
grep
のマニュアルページでpdftotext
、これを見つけました:
pdftotext [オプション] [PDFファイル [テキストファイル]]
説明 Pdftotext は、Portable Document Format (PDF) ファイルをプレーン テキストに変換します。
Pdftotext は、PDF ファイル PDF-file を読み取り、テキスト ファイル text-file に書き込みます。text-file が指定されていない場合、pdftotext は file.pdf を file.txt に変換します。text-file が「-」の場合、テキストは stdout に送信されます。
stdout
したがって、これを使用するためにパイプするために出力するにはgrep
:
pdftotext mydoc.pdf - | grep mysearchterm