2

PDF から HTML に変換された請求書を受け取り、請求書の行を解析する WebApp を開発しています。

コンテンツをdiv表示するメイン ウィンドウに があります。

しかし、その請求書の内容を表示するとdiv、すべての内容が重なって表示されます。

変換された請求書にはテーブルがなくdivs、絶対位置のみがあります。少なくともこのアプローチでは、それがコンバーターの動作方法であるため、他の方法では作成できません。

したがって、解決策として、「divからテーブル」に変換し、対応するdivのトップパラメーターに基づいて、行の変更があるかどうかを判断しようとしています。

ただし、請求書データの他に、請求書ヘッダーもあります。テーブルが同じかどうかを判断するのに苦労しています。

しかし、これまでのところ、会社のロゴ用、ヘッダー用、データ用の 3 つのテーブルを作成することで解決できると思います。

しかし、これらすべてのテーブルを正しい位置に正しいサイズで表示する必要があります。

現時点では、請求書の例を貼り付けることはできません。また、初期段階 (アルゴリズム段階に近い) で立ち往生しているためです。私のコードと請求書の例は、誰かが状況をよりよく理解するのに役立つとは思いません。

しかし、これをすぐに例で更新することを約束します。

別の解決策として、PDF を自分で解析することもできますが、これまでのところ、それを行う方法が見つかりませんでした。

私はPHPを使用してWebAppを作成し、verypdf pdf2htmlを使用して変換を行っています。

そのわずかな情報では、助けを得るのが難しいことを私は知っています。

どんなアイデアでも大歓迎です。

4

1 に答える 1

0

重なり自体を治してみるのはいかがでしょうか。たとえば、PDF が DIV に解析された後、DIV からすべてのスタイル情報を取り除くことができます。その後、独自のスタイルを適用できます。すべての請求書が同じ形式/配置であるかどうかを知っておくと便利な場合があります。

于 2013-04-12T14:45:33.243 に答える