php - PHPを使用してPDFファイルから画像を抽出するにはどうすればよいですか？

Question

PHPのPDFから画像を抽出する方法について何かアイデアはありますか？

score 3 · Accepted Answer

pdfimagesを見てください。このページの説明は次のとおりです。

Pdfimagesは、Portable Document Format（PDF）ファイルの画像をPortable Pixmap（PPM）、Portable Bitmap（PBM）、またはJPEGファイルとして保存します。

Pdfimagesは、PDFファイルを読み取り、1つ以上のページのPDFファイルをスキャンし、画像ごとに1つのPPM、PBM、またはJPEGファイルを書き込みます。image-root-nnn.xxxここで、nnnは画像番号、xxxは画像タイプです。（.ppm、.pbm、.jpg）。

注意：pdfimagesは、追加の変換を実行せずに、PDFファイルから生の画像データを抽出します。PDFコンテンツストリームによって行われる回転、クリッピング、色の反転などはすべて無視されます。

score 2 · Accepted Answer

imagemagicも使えると思います。コマンドライン引数を送信して、指定できる座標を指定して写真を撮ることができます。いくつかのrpmなどをインストールする必要があります。

score 1 · Accepted Answer

PDFLibをチェックしてください。彼らのTET製品はまさにそれを行います。あなたは画像とテキストを出すことができます...それがカバーしていないのはベクター画像だけです。

score 0 · Accepted Answer

既存のPDFファイルがある場合、PHPを使用してそこから画像を抽出することはかなり不可能だと思います。おそらく、Cを使用した方が幸運です。バイナリファイルを逆アセンブルし、デコード/解凍/逆コンパイルして、画像の場所を見つける必要があります。が保存されたら、それをコピーします。

コピーして貼り付けるだけの方が簡単です。

php - PHPを使用してPDFファイルから画像を抽出するにはどうすればよいですか？

4 に答える 4

Related

Reference