4

A.nnotate.com、Scribd、Google Docs などのサービスが PDF、.doc、またはその他のドキュメントを HTML にレンダリングする方法と、注釈システムがどのように機能するかを知りたいです。

4

1 に答える 1

5

A.nnotate.com は、xpdf を使用して、指定されたズーム レベルで PDF ページを PNG 画像にサーバー側で変換します。これがブラウザに表示されます。

テキストの強調表示は、PDF からテキストの位置を抽出し、ページ画像の上に透明なオーバーレイを追加して、単語の上に html DIVS を絶対配置することによって行われます。次に、注釈は ajax GUI を使用して、強調表示されたテキストにメモを添付します。

他の形式 (MS Word、PPT など) は、最初に openoffice を使用して PDF に変換され、次に PDF の場合と同様に画像とテキスト オーバーレイに変換されます。

他の HTML ドキュメント サイトは、PDF を HTML としてレンダリングするために似たようなことをしていると思います (つまり、ページ画像 + ワード オーバーレイを透明な div として) - 別のトリックは、PDF 埋め込みフォントを HTML5 CSS フォントに変換し、テキストに絶対位置の div を使用することです ( & 画像も抽出して配置します)。

于 2011-07-25T14:07:47.537 に答える