2

スキャンしたテキスト(モノクロまたは数色)を圧縮して、pdf(多分djvu)ファイルに保存したいと思います。Windows/Acrobatと「ZRLE」圧縮モノクロtiffをPDFに埋め込んで非常に良い結果が得られたことを覚えています。私が覚えている限り、アルゴリズムはルーズレスでした。今、私はLinuxで良い結果を得る方法を探しています。それはストレージを節約し、損失を回避する必要があります(色を失うことは気になりませんが、テキストスキャンでノイズの多い結果を生成するjpeg圧縮などは必要ありません)。バッチ変換に必要なので、ImageMagick変換コマンドを考えていました。しかし、良い結果を得て、それをpdfファイルに埋め込むことができるようにするには(たとえばpdflatexを使用して)、どの出力形式を使用する必要がありますか?それとも、一般的にdjvuファイルを使用する方が良いですか?

4

2 に答える 2

3

jbig2圧縮を使用する画像用のjbig2encエンコーダーは、もともとAdamLangleyによってGoogleBooks用に作成されました

https://github.com/agl/jbig2enc

Rubypdfなどによる最新の改善点を含めるようにフォークしました

https://github.com/DingoDog/jbig2enc

また、パピーリナックス用にjbig2encのバイナリをいくつか作成しました(他のディストリビューションでも動作する可能性があります)

http://dokupuppylinux.info/programs:encoders

于 2011-12-04T22:17:24.147 に答える
2

DJVUは悪い選択ではありませんが、互換性を高めるためにPDFを使用したい場合は、ロスレスJBIG2圧縮を検討することをお勧めします。

ウィキペディアからの引用:

全体として、テキストを圧縮するためにJBIG2で使用されるアルゴリズムは、バイナリイメージをコーディングするためにDjVuファイル形式で使用されるJB2圧縮スキームと非常によく似ています。

于 2011-12-02T15:37:06.303 に答える