PDF から HTML に変換された請求書を受け取り、請求書の行を解析する WebApp を開発しています。
コンテンツをdiv
表示するメイン ウィンドウに があります。
しかし、その請求書の内容を表示するとdiv
、すべての内容が重なって表示されます。
変換された請求書にはテーブルがなくdivs
、絶対位置のみがあります。少なくともこのアプローチでは、それがコンバーターの動作方法であるため、他の方法では作成できません。
したがって、解決策として、「divからテーブル」に変換し、対応するdivのトップパラメーターに基づいて、行の変更があるかどうかを判断しようとしています。
ただし、請求書データの他に、請求書ヘッダーもあります。テーブルが同じかどうかを判断するのに苦労しています。
しかし、これまでのところ、会社のロゴ用、ヘッダー用、データ用の 3 つのテーブルを作成することで解決できると思います。
しかし、これらすべてのテーブルを正しい位置に正しいサイズで表示する必要があります。
現時点では、請求書の例を貼り付けることはできません。また、初期段階 (アルゴリズム段階に近い) で立ち往生しているためです。私のコードと請求書の例は、誰かが状況をよりよく理解するのに役立つとは思いません。
しかし、これをすぐに例で更新することを約束します。
別の解決策として、PDF を自分で解析することもできますが、これまでのところ、それを行う方法が見つかりませんでした。
私はPHPを使用してWebAppを作成し、verypdf pdf2htmlを使用して変換を行っています。
そのわずかな情報では、助けを得るのが難しいことを私は知っています。
どんなアイデアでも大歓迎です。