ウィキペディアのページからコンテンツを読み取り、html を取得する小さなプログラムを作成しようとしています。SO の他の場所でこのコードを見つけました。
HtmlDocument doc = new HtmlDocument();
StringBuilder output = new StringBuilder();
doc.LoadHtml("http://en.wikipedia.org/wiki/The Metamorphosis of Prime Intellect");
var text = doc.DocumentNode.SelectNodes("//body//text()").Select(node => node.InnerText);
foreach (string line in text)
output.AppendLine(line);
string textOnly = HttpUtility.HtmlDecode(output.ToString());
Console.WriteLine(textOnly);
ただし、実行時エラー「ArgumentNullException was unhandled」が発生し、次の行が強調表示されます。
var text = doc.DocumentNode.SelectNodes("//body//text()").Select(node => node.InnerText);
誰かが問題を見ていますか?