PDF ファイル内の画像を検出する方法 (Python)。
PDFファイルに画像が存在するかどうかを検出する必要があります。そうする方法はありますか?
私はPyPdfを試しましたが、成功しませんでした。私を助けてください
感謝します
PDF ファイル内の画像を検出する方法 (Python)。
PDFファイルに画像が存在するかどうかを検出する必要があります。そうする方法はありますか?
私はPyPdfを試しましたが、成功しませんでした。私を助けてください
感謝します
PDFマイナーがあります。また、Python-APIも備えています。これは、画像の検索に役立ちます。以下を使用して:
from pdfminer.layout import LAParams
from pdfminer.converter import PDFPageAggregator
# Set parameters for analysis.
laparams = LAParams()
# Create a PDF page aggregator object.
device = PDFPageAggregator(rsrcmgr, laparams=laparams)
interpreter = PDFPageInterpreter(rsrcmgr, device)
for page in doc.get_pages():
interpreter.process_page(page)
# receive the LTPage object for the page.
layout = device.get_result()
layout
LTPage
基本的に、ページ上のすべてのレイアウト オブジェクトのツリーであるオブジェクトです。このツリーのすべての枝に沿って歩き、オブジェクトがLTImage
どこかにあるかどうかを確認すると、画像があることがわかります。
PDFMiner は Python 2.x でのみ動作します。