2

私は pdftohtml を試していますが、テーブルを正しく解析するのが難しい場合があります。2 つの列のテキストを 1 つのセルにグループ化しているため、結果のデータを解析しようとしても無駄です!

これは PDF 内で 1 回か 2 回しか発生しないため、まったく予測できないことに注意してください。

pdftohtml の最新バージョン (0.40a ベータ版を含む) を試しましたが、役に立ちませんでした。

試してみる価値のある Linux 互換の同等品を知っている人はいますか?

ありがとう、

サム

4

1 に答える 1

1

pdf2htmlEXは、私が見た中で最高の pdf-to-html です。

インストール:brew install pdf2htmlex

私は使用しなければならなかったbrew install -f pdf2htmlex

実行例:pdf2htmlEX --embed cfijo --dest-dir 'your-directory' your.pdf

.html と ref'd 画像を含む新しいディレクトリを作成します

于 2015-01-29T11:19:26.377 に答える