BeautifulSoup
for に似たライブラリはありますC#
か?
HTML と XML、特にエラーのある HTML を単純に解析したい。
過去にHTMLAgilityPackを使用してある程度の成功を収めましたが、HTML の形式が正しくないか終了タグが欠落している HTML の解析に問題がありました。ただし、それは約2年前のことです。
私は通常、XML リーダーでラップできるようにするSGMLReaderを使用する傾向があるため、C# で XDocument または XmlDocument を簡単に使用して HTML を読み取ることができます。SGMLReader は、私がスローしたすべての不正な HTML に対応しています。