私は.netのHtmlTidyにこのライブラリラッパーを使用しています
https://github.com/markbeaton/TidyManaged
簡単な例があります:
using System;
using TidyManaged;
public class Test
{
public static void Main(string[] args)
{
using (Document doc = Document.FromString("<hTml><title>test</tootle> <body>asd</body>"))
{
doc.ShowWarnings = false;
doc.Quiet = true;
doc.OutputXhtml = true;
doc.CleanAndRepair();
string parsed = doc.Save();
Console.WriteLine(parsed);
}
}
}
「html」タグと「body」タグを含む完全なページではなく、HTML の一部にライブラリを使用したいのですが、可能ですか?
私は基本的に、開始タグと終了タグなどを検証し、一致する開始タグがないタグを削除したいと考えています。他の優れたツールが適しています。