1

私はpdfのライブラリを持っています(大部分はランダムに圧縮されたものとdjvuも持っています)。これらの PDF の一部は破損しているため、削除する必要があります。

Pythonでpdfの整合性チェックを行うことができる方法はありますか?

4

1 に答える 1

4

pyPDF を使用して pdf を読み取り、読み取りプロセスでエラーが発生した場合は無効であると宣言できます...そのように、

from pyPdf import PdfFileReader 
try :
     mypdf = PdfFileReader(file( 'filename', 'rb'))
except:
     print filename,' is invalid pdf'
于 2012-04-07T02:53:01.467 に答える