0

勘定科目表と貸借対照表を含む複数の PDF があります。多くのコンバーターを試しましたが、結果は満足のいくものではありませんでした。PDFのコンテンツをHTMLの正確な構造に複製する優れたコンバーターを誰か提案してください。有料のコンバーターがあれば、私に提案してください。

  This is the PDF we want to convert and Show in html "http://www.marico.com/html/investor/pdf/Quarterly_Updates/Consolidated%20Financial%20Results%20-%20Q3FY11.pdf"
4

2 に答える 2

1

これを調べましたか?http://pdftohtml.sourceforge.net/

これもオープンソースなので無料で、必要に応じて変更できます。

以前の PDF と後の HTML バージョンを示すデモもあります。私に言わせれば悪くない。

特に PDF の表に問題がある場合は、表自体と、表を生成するために使用されているプログラムに問題がある可能性があります。すべての PDF が同じように作成されるわけではありません。

また: 私が作成し、何年にもわたって出会ってきたすべての PDF には、特定のページに他のブロック/行のテキストが同じかそれ以上の高さであるテキストのブロック/行をコピー/貼り付けするときに多くの問題があることに注意してください。 . Acrobat には、どのブロックが次に選択されるかの「順序」を定義する機能がないと思います (または、ほとんどのプログラムはそれを適切に使用していません)。コンテンツの選択 .....それが大きな空白領域を飛び越えたり、予期しないときに複数の列から一度に行を取得したりすることを意味する場合でも. これは、表形式のデータの問題の一部である可能性があります。ここでの弱点は PDF 形式そのものであり、おそらく期待しすぎているのではないかと思います。何でも PDF に変換することは、ほぼ一方通行です。

于 2012-04-10T09:14:35.197 に答える
0

http://www.jpedal.org/html_index.phpを試してみましたか- 無料のオンライン バージョンもあります

于 2012-04-10T12:01:23.653 に答える