html2ps が必要で、パッケージ ImageMagick から変換します。
html2ps index.html index.ps
convert index.ps index.png
2 番目のプログラムは、長い html ページのページごとに 1 つの png を生成します。ページ レイアウトは html2ps によって行われました。
次のように報告されたプログラム evince-thumbnailer を見つけました。
apropos postscript | grep -i png
evince-thumbnailer (1) - create png thumbnails from PostScript and PDF documents
しかし、単純な最初のテストでは機能しませんでした。
複数のページを 1 つの大きな画像に結合したい場合は、convert が役立ちます。
これで、 convert が html で直接動作することがわかりました。
convert index.html index.png
も動作します。出力に違いは見られず、画像のサイズはほぼ同じです。
マルチパート MIME タイプの電子メールの場合、通常、メール ヘッダー、おそらくプレ HTML テキスト、HTML、および添付ファイルがあります。
HTML を抽出して個別にフォーマットすることはできますが、埋め込まれたものをレンダリングするのはそれほど簡単ではないかもしれません。
これは私がテストした 4 月 14 日のファイルです。そのため、メールフォルダーから 1 つのメールを抽出します。
sed -n "/From - Sat Apr 14/,/From -/p" /home/stefan/.mozilla-thunderbird/k2jbztqu.default/Mail/Local\ Folders-1/Archives.sbd/sample | \
sed -n '/<html>/,/<\/html>/p' | wkhtmltopdf - - > sample.pdf
次に、その html 部分だけを抽出します。
wkhtmltopdf は- -
、stdin の読み取り/stdout への書き込みに必要です。PDF はレンダリングされますが、ワークフローに統合する方法がわかりません。
wkhtml ...
あなたはと置き換えることができます
convert - sample.jpg