Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私はpdfのライブラリを持っています(大部分はランダムに圧縮されたものとdjvuも持っています)。これらの PDF の一部は破損しているため、削除する必要があります。
Pythonでpdfの整合性チェックを行うことができる方法はありますか?
pyPDF を使用して pdf を読み取り、読み取りプロセスでエラーが発生した場合は無効であると宣言できます...そのように、
from pyPdf import PdfFileReader try : mypdf = PdfFileReader(file( 'filename', 'rb')) except: print filename,' is invalid pdf'