ドキュメント管理システムには、多数のマルチページ TIF ファイル (主にドキュメント スキャン) が含まれています。さまざまな歴史的問題とエンド ユーザーの誤解により、これらの多くは必要以上に大きくなっています (たとえば、必要以上に高い解像度でスキャンされたり、圧縮せずに保存されたりします)。
私が見ているのは、これらのドキュメントのいくつかを調べて、貴重なストレージスペースを取り戻すためにいくつかの最適化を行うことです (私はすでに、非常に簡単にぶら下がっている果物を取り出しただけで 25GB を回復しました)。
これまでは ImageMagick と Irfanview を組み合わせて使用してきましたが、現時点ではかなり労力がかかるため、このプロセスをもっと自動化したいと考えています。私はいくつかのスクリプトを作成することに問題がありましたが、残念ながら、問題の TIF の性質に問題があることが判明しています。
特に、それらの大部分には混合ページ形式が含まれています。基本的なレター ページ用のバイレベル/1 ビット ページと、画像/地図/図面用のフル カラー RGB ページ。ほとんどのドキュメントにはこれらのタイプが混在しており、常に特定の順序であるとは限りません (実際、これら 2 つの形式の間を行き来する場合があります)。
理想的には、2 値ページでグループ 4 ファックス圧縮を使用し、カラー ページで JPEG 圧縮を使用したい (したがって、ImageMagick で -compress group4 / -compress jpeg フラグを使用する) 方法はないようです (私が知ることができる - 私はIM の経験が限られている場合) を使用して、ページ形式ごとに圧縮を設定します。これが可能かどうか誰にもわかりますか?または、この機能を備えたスクリプト可能なツールを推奨できる人はいますか?
Irfanview はページごとの圧縮を行うことができますが、GUI を使用してページごとに手動で設定する必要があり、これは明らかに理想的ではありません。
どんなヒントでも大歓迎です!