3

スキャンしたページで構成される PDF のバッチ (約 80,000 ファイル) があります。画像レイヤーのピクセルサイズは300dpiで統一していますが、72dpiに設定されているようです。その結果、ページ サイズは 46x35 インチのように表示されます。これらのファイルを調整して、8.5 x 11、または本来のサイズに合わせて登録する必要があります。また、プロセスをスクリプト化して、80,000 ドキュメント (ドキュメントあたり 2 ~ 5 ページ) をチャーンできるようにする必要があります。

画像レイヤーのリサンプリングは避けたいと思います。これにより、損失が増える可能性があり、プロセスが大幅に遅くなる可能性があります。私はもう試した:

convert -density 300x300 input.pdf output.pdf

しかし、それは画像をリサンプリングします。次のようなゴーストスクリプトでさまざまなバリアントを試しました

gs \
  -o output.pdf \
  -sDEVICE=pdfwrite \
  -dDownsampleMonoImages=false \
  -dMonoImageResolution=300 \
   input.pdf

これによりファイルが生成されますが、変更されていないように見え、それでも特大サイズとして登録されます。また、ページのサイズと向きが異なります。したがって、それらすべてを 1 つのサイズ/向きに強制しても機能しません。

(参考までに、本当に気にしませんが、次のステップは、これらすべてのファイルを Acrobat Pro OCR で処理することです。その OCR は、45 インチを超えるものをすべて詰まらせます。)

4

3 に答える 3

3

PDF は解像度に依存しない形式であるため、画像の解像度などはほとんど関係ありません。ページの「自然なサイズ」は、Acrobat が言うとおりです。これは、ファイル内の MediaBox (または CropBox) 情報から収集されます。

私には、元の PDF への変換に問題があるように思えます。ファイルは、現在主張している (メディア) サイズです。

おそらく必要な結果が得られると思います。ドキュメントのサイズを「単に」変更する必要があります。問題は、メディアのサイズが異なる場合、これは些細なことではないということです (あなたが言うように)。

ただし、先に進む前に、8.5x11 にしたいファイルを取得して、これを試すことをお勧めします。

gs -dBATCH -dNOPAUSE \
   -sDEVICE=pdfwrite \
   -dDEVICEWIDTHPOINTS=612 -dDEVICEHEIGHTPOINTS=792 \
   -dFIXEDMEDIA \
   -dPDFFitPage \
   -sOutputFile=output.pdf \
    input.pdf

これにより、使用されているメディアが 8.5x11 で固定され、ページに合わせてドキュメントのサイズを変更するように Ghostscript に指示します (倍率を計算して適用することにより)。圧縮以外の画像データには影響しないはずです。カラー画像がある場合は、JPEG アーティファクトを心配する必要があるかもしれませんが、個別に処理できます。

于 2012-07-17T07:15:36.250 に答える
2

cpdf -scale-pages usletterportrait in.pdf -o out.pdf

変換マトリックスでラップしてスケーリングを行い、メディア/クロップ/アート/ブリード/トリム ボックスもスケーリングする以外は、ページ コンテンツには触れません。

(コマーシャル、恐るべし:

http://www.coherentpdf.com/

免責事項:私が書きました。)

于 2012-07-17T10:49:26.157 に答える
1

元のgsコマンドを次のように変更します。

gs \
  -o output.pdf \
  -sDEVICE=pdfwrite \
  -dPDFFitPage \
  -g6120x7920 \
   input.pdf

次に、次の 2 点を確認します。

  1. 現在、ページのサイズは「文字」(または 612x792 pts、または 8.5x11 インチ) として表示されています。
  2. ファイルサイズは元のものとわずかに異なるだけです (ページ画像の再サンプリングが行われていないことを示しています)。

入力がグレースケールのみのスキャン文書である場合 (そのように思われます)、設定-dDownSample*Imagesまたは設定の必要はありません-d*ImageResolution

于 2012-07-17T11:05:35.393 に答える