pdfminerに基づくプログラムを使用して 12 ページの pdf ファイルからコンテンツを抽出すると、11 ページしかない間違った結果が得られました。他のファイルでテストしたところ、ほとんどの場合、正しい結果が得られました。
うっかりOS X Yosemite(v10.10.4)のプレビューアプリで開いてしまい、そのまま保存してしまいました。その後、プログラムから得た結果は正しかった。このファイルのサイズがプレビューで 2m から 300k に変更されていることがわかりましたが、それが何をしたのかわかりません。
私は答えを探してみましたが、ほとんどのトピックはプレビューアプリのエクスポート機能を使用してpdfファイルを圧縮することに関するものであり、誰もpdfminerでも同じ問題に遭遇していないようです.
1、「保存」すると、プレビューアプリはPDFファイルで何をしますか?
2、どうすれば問題に対処できますか?
前もって感謝します!