1

私はかなり長い間それに取り組んできました、そして私が発見することができたのはこのpdf2domパーサーとおそらくこれのリバースエンジニアリングされたバージョンだけでし。とにかく、ここに私の質問があります。どのレンダリングエンジンでも、その入力はデータのストリーム(私の場合はpdfコンテンツ)であり、その出力は選択された形式(私の場合はDOM、HTML、CSS)である必要があります。

  1. ただし、javaまたはc ++を使用する代わりに、サーバーから「pdfデータ」のストリーム(これは私にはわかりません)を取得し、javascript変数に格納し、javascriptを使用してレンダリングして追加することは可能ですか? DOMに?

  2. 生の「pdfデータ」はどのように表示されますか(特定の形式などはありますか)?

すべての入力を歓迎します。

注: IEと互換性がある必要があります。

4

2 に答える 2

6

すでに行われています。結果はpdf.jsです。PDFをキャンバスにレンダリングすることで機能していることに注意してください。結果はそのように保証することができます。PDFの一部の機能は、現在キャンバスの外では使用できません。

于 2011-12-19T10:19:32.920 に答える
2

PDFは通常、Flash、JavaScript、およびその他のあらゆる種類のものを埋め込むためのPostScript+オプションのサブセットです。

PDFを簡単にHTML(/ DOM)に変換し、それを正しい方法でレンダリングすることはほとんど不可能です。例として、PDFはJPEG画像を使用しますが、あちこちで微妙な変更があります。つまり、他の場所で使用する前にそれらを変換する必要があります。PDF.js-guysからいくつかのプレゼンテーションを読んでみてください。そうすれば、WTFのかなり長いリストが見つかります。

ただし、単純なPDF(プレーンテキスト、画像なしなど)しかなく、最も単純なレイアウト以外は何も保存しない場合は、PDFから文字列データを取得してDOMに配置できるはずです。 。

ただし、個人的には、ユーザーにプラグイン(flash / acrobat / ...)を強制するか、PDFのサーバー側をレンダリングしてブラウザーへの画像として提供する方が簡単だと思います。

于 2011-12-19T11:00:10.523 に答える