を使用してページのテキストを取得したいHTMLAgilityPack
。私はこれのためにいくつかのコードを持っています:
HtmlAgilityPack.HtmlWeb TheWebLoader = new HtmlWeb();
HtmlAgilityPack.HtmlDocument TheDocument = TheWebLoader.Load(textBox1.Text);
List<string> TagsToRemove = new List<string>() { "script", "style", "link", "br", "hr" };
var Strings = (from n in TheDocument.DocumentNode.DescendantsAndSelf()
where !TagsToRemove.Contains(n.Name.ToLower())
select n.InnerText).ToList();
textBox2.Lines = Strings.ToArray();
問題は、script
タグの内容も返すことです。なぜそうなるのかわかりません。誰か助けてもらえますか?