スキャンしたページで構成される PDF のバッチ (約 80,000 ファイル) があります。画像レイヤーのピクセルサイズは300dpiで統一していますが、72dpiに設定されているようです。その結果、ページ サイズは 46x35 インチのように表示されます。これらのファイルを調整して、8.5 x 11、または本来のサイズに合わせて登録する必要があります。また、プロセスをスクリプト化して、80,000 ドキュメント (ドキュメントあたり 2 ~ 5 ページ) をチャーンできるようにする必要があります。
画像レイヤーのリサンプリングは避けたいと思います。これにより、損失が増える可能性があり、プロセスが大幅に遅くなる可能性があります。私はもう試した:
convert -density 300x300 input.pdf output.pdf
しかし、それは画像をリサンプリングします。次のようなゴーストスクリプトでさまざまなバリアントを試しました
gs \
-o output.pdf \
-sDEVICE=pdfwrite \
-dDownsampleMonoImages=false \
-dMonoImageResolution=300 \
input.pdf
これによりファイルが生成されますが、変更されていないように見え、それでも特大サイズとして登録されます。また、ページのサイズと向きが異なります。したがって、それらすべてを 1 つのサイズ/向きに強制しても機能しません。
(参考までに、本当に気にしませんが、次のステップは、これらすべてのファイルを Acrobat Pro OCR で処理することです。その OCR は、45 インチを超えるものをすべて詰まらせます。)