python - Python 画像検出 PDF

Question

PDF ファイル内の画像を検出する方法 (Python)。

PDFファイルに画像が存在するかどうかを検出する必要があります。そうする方法はありますか？

私はPyPdfを試しましたが、成功しませんでした。私を助けてください

感謝します

score 3 · Accepted Answer

PDFマイナーがあります。また、Python-APIも備えています。これは、画像の検索に役立ちます。以下を使用して:

from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator

# Set parameters for analysis.
laparams = LAParams()
# Create a PDF page aggregator object.
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in doc.get_pages():
    interpreter.process_page(page)
    # receive the LTPage object for the page.
    layout = device.get_result()

layoutLTPage基本的に、ページ上のすべてのレイアウトオブジェクトのツリーであるオブジェクトです。このツリーのすべての枝に沿って歩き、オブジェクトがLTImageどこかにあるかどうかを確認すると、画像があることがわかります。

PDFMiner は Python 2.x でのみ動作します。

python - Python 画像検出 PDF

1 に答える 1

Related

Reference