削除したいドキュメントの最初のページの情報ページがあるPDFのコレクションがあります。
この情報ページをすべてのPDFからすばやく削除する方法、または少なくとも複数のページがあるすべてのPDFを表示して、修正が必要なPDFをより適切に見つける方法がある場合はどうでしょうか。
これを実行できるプログラムを知っていますか?または、Pythonでこれを行う方法はありますか?
注:情報ページには、常に同じ「土地所有権事務所」であるというテキストがあります
Windows7OSの使用
ありがとう
いくつかの研究は次のことを明らかにしました:
http://www.python.org/workshops/2002-02/papers/17/index.htm
http://www.unixuser.org/~euske/python/pdfminer/index.html
http://pybrary.net/pyPdf/pythondoc-pyPdf.pdf.html#pyPdf.pdf.PdfFileWriter-class