このPDFからズーム 1 で72 dpi の画像とXMLを生成しました。
DPI は 72 でしたが、XML の座標をピクセルに変換できるようにするには、このシートを使用して DPI を繰り返し微調整する必要がありました。90.5はうまくいくようです。ただし、これは適切な方法のようには見えません。
XML を生成するコマンド:
pdftohtml -xml -zoom 1 -fontfullname -s -c input.pdf output
イメージを生成するコマンド:
pdftoppm -jpeg -r 72 input.pdf output
注: 72 dpi では、出力される画像が PDF および XML 出力と同様の寸法であったため、画像の生成時に 72 dpi が使用されました。
これにより HTML の構築が可能になるため、この変換は不可欠です。poppler 自体が HTML を生成できることは承知していますが、生成された HTML は電子メール互換にする必要があるため、XML を使用して HTML をゼロから構築しています。
XML の座標から PDF への変換をより確実に行うには、どのような方法がありますか?