Appleのワードプロセッサ/DTPアプリPagesは、ファイルをzip形式のフォルダとして保存します。このフォルダには、コンテンツを含むXMLファイルと、ファイルとして保存された添付ファイル(画像など)が含まれています。
私はこのコンテンツをまともなHTMLに変換しようとしています。<p>
■段落のように見えるもの、HTMLテーブルに変換されたテーブル、維持されている画像とリンク。
Pagesドキュメントからスタイルをコピーする必要はありません。
これを行うXSLTはインターネットのどこかに浮かんでいますか?Davin Granrothと呼ばれるチャップは、テキストを取り出すための良い出発点となるものを書きましたが、画像、表、またはリンクを処理しません。
私は自分で行くのがとても好きですが、誰かがすでにこれを書いているようです。