0

重複の可能性:
PHPを使用してpdfからコンテンツを抽出する

いくつかの pdf データと html を含むページを返す URL があります... HTML 部分を削除したところ、データ文字列に pdf 形式のデータが含まれるようになりました。この文字列から pdf ファイルのテキスト コンテンツを抽出する必要があります。 PHPでそれを行う方法は?私はグーグルで検索しましたが、それを行う方法が見つかりませんでした..データは%PDFで始まり、EOFで終わります.B/w認識できない文字(おそらくバイナリデータ)があります

4

1 に答える 1

0

pdftotextアプリケーションを使用してpdfの内容を取得できます。

于 2012-11-08T14:49:24.880 に答える