さて、私はHTML tidyを利用して、通常のHTMLWebページを解析に適したXHTMLに変換してきました。問題は、Firefoxに保存したテストページのhtmlが、保存中にFirefoxによって多少事前にクリーンアップされていることです。これをファイルFと呼びます。HtmltidyはファイルFで正常に機能しますが、.NET(ファイルN)を介してファイルに書き込まれた生データでは失敗します。 )。Html tidyは、フォームタグがテーブルタグと混在していることに不満を持っています。HTMLは私のものではないので、ソースを修正することはできません。
ファイルNを十分にクリーンアップして、Htmlを整理して実行できるようにするにはどうすればよいですか?Firefox(マウスやキーボードを使用せずに完全にプログラムで)またはHTMLに追加の修正を適用する別のツールに接続する標準的な方法はありますか?