5

pypdf モジュールを使用して、空白の白い pdf ページを含む pdf ドキュメントの数を印刷しようとしました。ただし、空白ページを回避し、残りのページの数を出力します。以下はコードです。

import sys

import pyPdf

from pyPdf import PdfFileReader, PdfFileWriter

pdf_document = PdfFileReader(file(normalpdfpath,"r"))

normal = pdf_document.getNumPages()
print normal
4

2 に答える 2

1

これを試すことができます。これは私にとってはうまくいきました:

import re
import os

rxcountpages = re.compile(r"/Type\s*/Page([^s]|$)", re.MULTILINE|re.DOTALL)

def count_pages(filename):
    data = file(filename,"rb").read()
    return len(rxcountpages.findall(data))

if __name__=="__main__":
    parent = "/Users/username/"
    os.chdir(parent)
    filename = 'LaTeX20120726.pdf'
    print count_pages(filename)

よろしく

于 2013-05-20T12:43:56.090 に答える