画質と画像サイズの間にはまだ柔軟な余地があるため、これはどちらかというと未解決の問題です...結局、白黒にして、CCITT T.6 白黒 (ファックス スタイル) 圧縮で圧縮します。すべてのカラー対応圧縮アルゴリズムではないにしても、ほとんどのズボンを打ち負かします。
モノクロ (グレースケールではなく) を使用する場合は、それを実行してください。ドキュメントが非常に小さくなります。
それ以外の場合は、一連のマイナーな画像変換と適応予測ツリーをお勧めします (こちらを参照)。APT ソフトウェア パッケージはオープンソースまたはパブリック ドメインであり、コンパイルと使用が非常に簡単です。その利点は、さまざまな種類の画像、特にテキストで適切に機能し、読みやすさを損なうことなく、画像サイズと画質をより適切にスケーリングできることです。(example_1000 サイズのカラー バージョンを読みやすさのしきい値で 48 KB に縮小し、明らかなアーティファクトはあるが読みやすい 64 K に縮小していることに気付きました。)
APT と imagemagick の微調整を組み合わせました。
convert example.png -resize 50% -selective-blur 0x4+10% -brightness-contrast -5x30 -resize 80% example.ppm
./capt example.ppm example.apt 20 # The 20 means quality in the range [0,100]
そしてプロセスを逆にするには
./dapt example.apt out_example.ppm
convert out_example.ppm out_example.png
imagemagick の設定を説明するには:
-resize 50%
処理を高速化するには、サイズを半分にします。また、一部の印刷およびスキャン アーティファクトを非表示にします。
-selective-blur 0x4+10%
: シャープにすると、実際にはより多くのノイズが発生します。実際に必要なのは、「エッジ」がないときにぼかす選択的ぼかし (Photoshop のようなもの) です。
-brightness-contrast -5x30
: ここでは、コントラストを少し上げて、ページのアウトラインによって発生する不適切な配色をクリップします (データの圧縮率が低くなります)。また、黒をより黒くするために少し暗くします。
-resize 80%
最後に、example_1000 の画像サイズより少し大きくサイズ変更します。(十分に近いです。)これにより、ピクセルがマージされると多少隠れてしまうため、明らかなアーティファクトの数も減少します。
この時点で、この例では見栄えの良い画像が得られます。きれいで滑らかな色と鮮明なテキストです。次に、圧縮します。品質値 20 はかなり低い設定で、見栄えは良くありませんが、ドキュメントは非常に読みやすくなっています。品質値が 0 でも、ほとんど判読可能です。
繰り返しますが、ADT を使用しても、この画像で必ずしも最良の結果が得られるわけではありませんが、グラデーションなどの写真のようなコンテンツで完全に認識できない混乱になるわけではないため、より多くのタイプや予期しない書類の種類。
結果:
88kb
76kb
64kb
48kb
圧縮前の処理画像