破損したPDFを検出するにはどうすればよいですか(pythonを使用)?
私は多くのpdfを持っています。これらの PDF の一部は破損しているため、削除する必要があります。どうすれば検出して削除できますか?
私が使用した:
from pyPdf import PdfFileReader
try :
mypdf = PdfFileReader(file( 'sample.pdf', 'rb'))
except:
print ' is invalid pdf'
しかし、ファイルから PDF を自動的に読み取り、破損した PDF を削除するにはどうすればよいでしょうか。