0

PDF から HTML への変換でのフォントの問題

  1. 「ti」、「fi」、「tt」の文字がすべて欠落しています

サンプルのスクリーンショット

  1. フォントの重複の問題

サンプルのスクリーンショット

  • 注: Firefox ではこの問題は発生しません。Safariブラウザのクロムで上記の問題を取得する

私は使っている

  • pdf2htmlEX の0.13.6バージョンを使用する
  • 次のコマンドを使用して pdf を html に変換します

pdf2htmlEX --split-pages 1 --zoom 3 --fit-width 920 --correct-text-visibility 1 --dest-dir $1 $2 2>&1

試した

--fallback 1オプションを使用すると、上記の問題がすべて解決されます。しかし

  1. フォールバック オプションは、ドキュメントの明瞭性を低下させます。
  2. ページ内の表が消え、空のスペースに置き換わります。

疑問

  1. フォールバックについてもう少し説明していただけますか?

  2. 上記のものを試しました(フォールバックを使用)。フォントに関する上記の問題を解決する別のアプローチを好む場合は、私に提案してください。

上記の問題は chrome と safari で発生しますが、Firefox では正常に動作しています。

4

1 に答える 1