0

popper pdftohtmlHTMLファイルを使用して正常に生成しました。しかし、以下の点を解決する方法がわかりません。

コマンドプロンプトで使用:

pdftohtml -c -s -enc Latin2 Sample.pdf

  1. エンティティには、UTF 文字の代わりにnamed entity formatlikeが必要です。ŪÜ
  2. 合字の問題selfl essnessselflessness.
  3. 句読点の余分なスペースを削除します。

Pdftohtml の21.04.0バージョンWindows-10。上記の点を解決するには?

4

0 に答える 0