html - A.nnotate.com の背後で使用されているテクノロジーは何ですか?

Question

A.nnotate.com、Scribd、Google Docs などのサービスが PDF、.doc、またはその他のドキュメントを HTML にレンダリングする方法と、注釈システムがどのように機能するかを知りたいです。

score 5 · Accepted Answer

A.nnotate.com は、xpdf を使用して、指定されたズームレベルで PDF ページを PNG 画像にサーバー側で変換します。これがブラウザに表示されます。

テキストの強調表示は、PDF からテキストの位置を抽出し、ページ画像の上に透明なオーバーレイを追加して、単語の上に html DIVS を絶対配置することによって行われます。次に、注釈は ajax GUI を使用して、強調表示されたテキストにメモを添付します。

他の形式 (MS Word、PPT など) は、最初に openoffice を使用して PDF に変換され、次に PDF の場合と同様に画像とテキストオーバーレイに変換されます。

他の HTML ドキュメントサイトは、PDF を HTML としてレンダリングするために似たようなことをしていると思います (つまり、ページ画像 + ワードオーバーレイを透明な div として) - 別のトリックは、PDF 埋め込みフォントを HTML5 CSS フォントに変換し、テキストに絶対位置の div を使用することです ( & 画像も抽出して配置します)。

html - A.nnotate.com の背後で使用されているテクノロジーは何ですか?

1 に答える 1

Related

Reference