私のクライアントは、アプリ用のカスタム ドキュメント ビューアを構築することを望んでいます。(アプリケーション固有の機能がたくさん必要なため、本当にカスタマイズする必要があります。)
昨年、PDF を取得し、ページ画像を生成し、選択してコピーできるテキストの非表示レイヤーを使用して画像を裏打ちするものを作成しました。Flex でそれを行いました。悪夢でした。PDFは恐ろしいです。
今年は、同様の要件を持つ HTML 5 で作成する必要がありますが、ほとんどのドキュメントが現在 Word または HTML で作成されています。つまり、PDF の固定レイアウトとグリフではなく、リフロー可能なテキストが含まれています。しかし、彼らは同じビューアーで PDF を実行したいと考えています。
すべてのドキュメントを、リフロー可能なテキストと PDF の固定位置グリフの両方を処理できる一般的なファイル形式に変換する必要があると考えています。(各ドキュメントはおそらくどちらか一方をサポートしますが、両方はサポートしません)。次のような XML ライクなマークアップ言語があればいいのですが。
<text>here's some text</text>
-- or --
<glyph letter="a" name="my_a_glyph" position="10,10"/>
<image src="my_image" position="20,20"/>
またはそのようなもの。
それを処理できる既存のファイル形式はありますか?EPUB は固定位置のテキストを処理しませんし、PDF は説明する方法が多すぎます。