HTMLドキュメント(DocBook XMLドキュメントから生成されたもの)をWikiマークアップ言語、特にPMWikiマークアップ言語に変換する必要があります。目標は、新しく作成されたwikiに会社のアプリケーション操作ガイドを含めることです。これは、実際には2つのオプションがあることを意味します。
- HTML(DocBook XMLから生成)をwikiに変換します
- DocbookXMLを直接wikiに変換します
HTMLはDocBookからHTMLへのコンバーターによって生成されるため、HTMLドキュメント内でのタグの定義方法は大きく異なり、ドキュメントの内容のみが異なります。
自分ですぐに実装できるソリューションを探しています。この変換は、アプリケーション操作ガイドの新しいバージョンが作成されるたびに一度行う必要があります。
私がこれまで考えてきた解決策:
- 正規表現に基づいて、PerlまたはPHPスクリプトを使用してHTMLをwikiに変換します。
- DocbookXMLを直接wikiに変換します。XMLなので、XMLの解析にはJavaを使うことができます。ここでのリスクは、私がDocBooks XML形式に精通していないことです(HTMLを使用しているため)。そのため、学習に時間がかかります。
この作業にはどのようなアプローチを選択しますか?
アップデート:
ConvertHTMLというPMWiki拡張機能を試しました。ドキュメントに記載されているように、HTMLタグを変換しないため(たとえば、wikiに残されているように変換されないため)、うまく機能しませんでした。
PmWikiマークアップはすべてのHTMLマークアップをサポートしているわけではないため、100%変換することはできません。ただし、PmWikiは、編集中または保存中のテキストを置き換えることができます。ConvertHTMLは、HTMLタグをwikiマークアップに変換するための比較的包括的な一連のルールを実装しています。