文字をスキャンし、スキャンしたビットマップを PDF に変換するシステムを試して、高解像度と小さな PDF ファイル サイズを実現しようとしています。
スキャナー、ビットマップ操作用の GIMP、ビットマップから PDF への変換用の ImageMagick でプロトタイプを作成しています。
私のプロセスは次のようになります。
3x8bit カラー、600 DPI、LZW 圧縮のトゥルーカラー TIFF ファイル サイズでスキャンすると、約 8 Mb になります。
GIMP を使用して、ビットマップを 4 ~ 8 色の一般的なカラー テーブルを持つインデックス付きイメージに変換します。これにより、画像の圧縮性が向上します。
ImageMagick を使用して、LZW 圧縮のインデックス付き TIFF ファイル PDF を、1 ページあたり約 500K に変換します。
画像をさらに圧縮しやすくするために、ビットマップをより圧縮しやすくすることができます。ここで実験する前に、PS/PDF がビットマップを格納する方法を知りたいと思います。
PS/PDF のビットマップはランレングスでエンコードされていますか? 次に、ビットマップ行から単一のピクセルを削除して圧縮します。
ここでさらに最適化するためのアイデアはありますか?
PS/PDF のビットマップ ストレージ形式に関する参照情報を知っていますか?