php - PHPでPDFデータストリームからテキストを抽出する

Question

重複の可能性：
PHPを使用してpdfからコンテンツを抽出する

いくつかの pdf データと html を含むページを返す URL があります... HTML 部分を削除したところ、データ文字列に pdf 形式のデータが含まれるようになりました。この文字列から pdf ファイルのテキストコンテンツを抽出する必要があります。 PHPでそれを行う方法は?私はグーグルで検索しましたが、それを行う方法が見つかりませんでした..データは%PDFで始まり、EOFで終わります.B/w認識できない文字(おそらくバイナリデータ)があります

score 0 · Accepted Answer

0

pdftotextアプリケーションを使用してpdfの内容を取得できます。

于 2012-11-08T14:49:24.880 に答える

php - PHPでPDFデータストリームからテキストを抽出する

1 に答える 1

Related

Reference