モバイル デバイスのプラグインを必要とせずに、ブラウザーを介して pdf を表示するアプリケーションを構築しています。ImageMagick と Ghostscript を使用してページを画像に変換しようとしましたが、大きすぎてテキストが不明瞭になります。PDFをHTMLに変換するサービスを提供しているWebサイトを見て、降下作業を行いますが、これがどのように達成されるかの例が見つかりません。どんな助けでも大歓迎です。ありがとう!
3 に答える
私はグーグルで、scridb.comが変換を実装する方法を説明する以下のリンクに出くわしました. http://coding.scribd.com/2010/06/01/the-perils-of-stacking/
PDF から HTML への変換を検討していて、サーバー上で変換を実行することを計画している場合は、pdf2html を試すことができます。poppler-utils の一部としてパッケージ化されたプログラムです。プログラムがそれをどのように達成するのかわかりません。
編集:質問を逆に読んだようです。この場合、PDF を解析してから、見つけた内容に基づいて HTML をフォーマットするのが最善の方法です。javapdf オプションがこれに対応していると思いますが、これらを使用したことがないのでわかりません。最悪の場合、PDF を逆アセンブルするソフトウェアが見つからない場合は、PDF の仕様を読んで、Java または PHP で独自の逆アセンブラーを作成できる可能性があります。頑張ってください!
http://www.adobe.com/devnet/pdf/pdf_reference.html - PDF 仕様 (Adobe 修正版。最も人気があるため、拡張機能をサポートすることができます)
-- 古い -- これらの Web サイトは、おそらく独自の独自ソフトウェアを作成して、このトリックを実行します。この取り組みに本当に興味がある場合は、HTML を解析してデータとスタイル情報を取得し、それを使用して何らかの PDF ライター API をフォーマットすることをお勧めします。Google で簡単に検索すると、次のような結果が得られます: -- END OLD --
http://www.cutepdf.com/Solutions/