解釈できる構造化された形式(HTML / XMLなど)に変換する必要のあるPDFがたくさんあります。
PDFは次の形式です:http: //img840.imageshack.us/img840/5407/pdfv.png
私はこれまでHTMLに変換する多くのソフトウェアを試しましたが、それらはすべて画像を分離する機能がなく、テキストのないページの印刷画面のようになり、この画像をhtmlの背景として使用します。テキストを配置するcss
このように:http://img37.imageshack.us/img37/5015/examplelp.jpg
私はたくさんのPDFを持っているので、それぞれの画像を手動で処理することはできません。誰かがこれに対する解決策を知っていますか(有料のソフトウェアでさえ)?