1

文字をスキャンし、スキャンしたビットマップを PDF に変換するシステムを試して、高解像度と小さな PDF ファイル サイズを実現しようとしています。

スキャナー、ビットマップ操作用の GIMP、ビットマップから PDF への変換用の ImageMagick でプロトタイプを作成しています。

私のプロセスは次のようになります。

  • 3x8bit カラー、600 DPI、LZW 圧縮のトゥルーカラー TIFF ファイル サイズでスキャンすると、約 8 Mb になります。

  • GIMP を使用して、ビットマップを 4 ~ 8 色の一般的なカラー テーブルを持つインデックス付きイメージに変換します。これにより、画像の圧縮性が向上します。

  • ImageMagick を使用して、LZW 圧縮のインデックス付き TIFF ファイル PDF を、1 ページあたり約 500K に変換します。

画像をさらに圧縮しやすくするために、ビットマップをより圧縮しやすくすることができます。ここで実験する前に、PS/PDF がビットマップを格納する方法を知りたいと思います。

PS/PDF のビットマップはランレングスでエンコードされていますか? 次に、ビットマップ行から単一のピクセルを削除して圧縮します。

ここでさらに最適化するためのアイデアはありますか?

PS/PDF のビットマップ ストレージ形式に関する参照情報を知っていますか?

4

5 に答える 5

1

PDF は、多くの種類の画像圧縮をサポートしています。次を参照してください: http://en.wikipedia.org/wiki/Pdf#Raster_images

imagemagick -compress オプションでどちらを使用するかを指定できると思います: http://www.imagemagick.org/script/command-line-options.php#compress

于 2009-04-03T08:48:00.650 に答える
1

いくつかの会社 (私が知っているのは Luratech と CamiNova だけです) は、PDF で「混合ラスター コンテンツ」モデルを作成しています。ファイルは標準の Adob​​e Reader で表示できますが、サイズは非常に小さく、DjVu に匹敵します。

「混合ラスター コンテンツ」とは、画像を高解像度の B&W マスク (ハード エッジ、線、文字) と低解像度のスムーズ トーン画像 (背景画像) に分割することを意味します。マスクはモノクロ圧縮アルゴリズム (おそらく JBIG2) を使用して保存され、スムーズ トーン イメージは JP2K (おそらく) を使用して圧縮されます。

于 2009-12-11T05:13:57.963 に答える
0

ビットマップ、IIRC、PDF の場合、deflate を使用します。ただし、PDF は、JPEG (非可逆)、CCITT (可逆)、JBIG2 (非可逆および可逆)、JPX (JPEG2000 の非可逆および可逆) など、より具体的な画像圧縮アルゴリズムを使用して画像を保存することもできます。

于 2009-04-03T08:48:22.707 に答える
0

Adobe の PDF リファレンスは、開始するのに適した場所かもしれません。ざっと見てみると、画像は非圧縮で保存されているように見えますが、それはまったく正しくありません。また、JPEG などの外部画像にリンクすることもできます。

于 2009-04-03T09:01:46.013 に答える