無効なXHTMLのWebサイトがあります(一部の終了タグがありません)。
その内容をXSLTで処理したいのですが、そのため、有効なXML入力が必要です。
ブラウザが無効なXHTML入力から作成したDOMドキュメントを有効なXML/XHTMLとして保存することは可能ですか?
はい、そうです。無効なマークアップを処理して有効な xml/xhtml として返すライブラリがいくつかあります。そのうちの 1 つは整然としたhttp://tidy.sourceforge.net/です。
ウェブサイトにアクセスできる場合は、出力をバッファに出力してからクリーンアップできます...ところで:有効なxhtmlは有効なxmlでもあります。
サーバー側のテクノロジとして .NET を使用している場合は、Html Agility Packを試すことができます。無効な HTML/XHTML を読み込んで、有効な XML に変換できます。