重複の可能性:
phpでpdfファイルを読む
やあ、
私は大量のPDF文書を持っています。PHPスクリプトを使用してそれを読みたいです。いろいろ調べましたが、みんなpdfファイルの作成についてです。ここでは、pdfファイルを作成したくありませんが、読みたいです。それをphpで読む方法はありますか?
-アルン
重複の可能性:
phpでpdfファイルを読む
やあ、
私は大量のPDF文書を持っています。PHPスクリプトを使用してそれを読みたいです。いろいろ調べましたが、みんなpdfファイルの作成についてです。ここでは、pdfファイルを作成したくありませんが、読みたいです。それをphpで読む方法はありますか?
-アルン
execを介して呼び出すことができるPdftotextなどのコマンドラインユーティリティを使用して、PDFファイルの内容を簡単に読み取ることができます。
これは私が言っていることの例であり、実際にシステムを使用しています
system("pdftotext your.pdf /tmp/txtfile.txt");
$text = file_get_contents("/tmp/txtfile.txt");
編集
ダッシュ構文について知りませんでした-これはさらに優れています:
$content = shell_exec('pdftotext your.pdf -');
ただし、これにはpdftotextをサーバーにインストールする必要があります。CentOSサーバーでは、これは次のようになります。
yum install xpdf
PDFファイルからテキストを取得するには、次のコマンドを試してください。
- http
://davidwalsh.name/read-pdf-doc-file-php-http
: //www.webcheatsheet.com/php/reading_clean_text_from_pdf.php(詳細-深さ)
よりヘビーウェイトなソリューションについては、以下をご覧ください。
- http ://www.setasign.de/products/pdf-php-solutions/fpdi/