PHPのPDFから画像を抽出する方法について何かアイデアはありますか?
4 に答える
pdfimagesを見てください。このページの説明は次のとおりです。
Pdfimagesは、Portable Document Format(PDF)ファイルの画像をPortable Pixmap(PPM)、Portable Bitmap(PBM)、またはJPEGファイルとして保存します。
Pdfimagesは、PDFファイルを読み取り、1つ以上のページのPDFファイルをスキャンし、画像ごとに1つのPPM、PBM、またはJPEGファイルを書き込みます。image-root-nnn.xxxここで、nnnは画像番号、xxxは画像タイプです。 (.ppm、.pbm、.jpg)。
注意:pdfimagesは、追加の変換を実行せずに、PDFファイルから生の画像データを抽出します。PDFコンテンツストリームによって行われる回転、クリッピング、色の反転などはすべて無視されます。
imagemagicも使えると思います。コマンドライン引数を送信して、指定できる座標を指定して写真を撮ることができます。いくつかのrpmなどをインストールする必要があります。
PDFLibをチェックしてください。彼らのTET製品はまさにそれを行います。あなたは画像とテキストを出すことができます...それがカバーしていないのはベクター画像だけです。
既存のPDFファイルがある場合、PHPを使用してそこから画像を抽出することはかなり不可能だと思います。おそらく、Cを使用した方が幸運です。バイナリファイルを逆アセンブルし、デコード/解凍/逆コンパイルして、画像の場所を見つける必要があります。が保存されたら、それをコピーします。
コピーして貼り付けるだけの方が簡単です。