12

テキスト ファイルと同じように、PDF ファイルのテキストを出力するコマンド ライン プログラムを探していcatます。

私は を見つけましたが、それは実行可能ですが、 にパイプしたいので、機能pdftotxtを複製するものを好むでしょう。ありがとう!catgrep

4

2 に答える 2

36

のマニュアルページでpdftotext、これを見つけました:

pdftotext [オプション] [PDFファイル [テキストファイル]]

説明 Pdftotext は、Portable Document Format (PDF) ファイルをプレーン テキストに変換します。

Pdftotext は、PDF ファイル PDF-file を読み取り、テキスト ファイル text-file に書き込みます。text-file が指定されていない場合、pdftotext は file.pdf を file.txt に変換します。text-file が「-」の場合、テキストは stdout に送信されます。

stdoutしたがって、これを使用するためにパイプするために出力するにはgrep

pdftotext mydoc.pdf - | grep mysearchterm
于 2011-10-10T22:50:20.537 に答える