htmlを含む文字列があります。この文字列の中にhtmlタグがあり、その内部テキストを取得したいと思います。どうすればC#でそれを行うことができますか?
これが、内部テキストを取得したいhtmlタグです。
<td width="100%" class="container">
HtmlAgilityPackを使用します。
このようなものを編集します(テストされていません)
HtmlDocument doc = new HtmlDocument();
string html = /* whatever */;
doc.LoadHtml(html);
foreach(HtmlNode td in doc.DocumentElement.SelectNodes("//td[@class='container']")
{
string text = td.InnerText;
// do whatever with text
}
別のXPathセレクターを使用してテキストを直接選択することもできます。
関連する質問: