Nitro Readerによって作成された圧縮されたpdfストリームからの情報を検査するためにpdftkを使用しようとしていますが、pdftkはストリームを収縮させません。エラーは発生しませんが、pdfオブジェクトを並べ替える以外には何もしないようです。 これらのPDFの1つの最小限の例を次に示します。
pdftk test.pdf output test-d.pdf uncompress
他のPDFでpdftkを試してみると、うまくいくようです。データストリームを手動で抽出し、Pythonでzlibを使用して解凍すると、正しく解凍されます。また、Adobe ReaderでPDFを開いて再保存すると、pdftkは結果のpdfで正常に機能します。
Nitro pdfを可能な限り手動で検査しましたが、有効なpdfのようです。私はここで何が起こっているのか非常に混乱しています。
問題の背景として、私はこれらのpdfを何百も持っており、特定のキーワードを検索しようとしています。これは、解凍を自動化できれば実行できるはずです。
pdftkバージョン1.45Windows7
Home Premium SP1
NitroReader2バージョン2.5.0.36
ありがとう、ジェームズ