3

重複の可能性:
C# で html を解析する最良の方法は何ですか?

Web サイトから情報を簡単に抽出できるように、HTML を解析したり、HTML を XML に変換したりする方法はありますか?

私はC#で作業しています。

ありがとうございました、

4

2 に答える 2

5

HTMLAgilityPackはあなたが探しているものです。HTMLAgilityPack を使用した HTML ドキュメントの解析のチュートリアルを確認してください。

于 2012-07-03T04:24:29.407 に答える
5

COM オブジェクトを使用してMicrosoft HTML Object LibraryHTML をロードし、そのオブジェクト モデルを使用してナビゲートできます。以下に例を示します。

string html;
WebClient webClient = new WebClient();
using (Stream stream = webClient.OpenRead(new Uri("http://www.google.com")))
using (StreamReader reader = new StreamReader(stream))
{
  html = reader.ReadToEnd();
}
IHTMLDocument2 doc = (IHTMLDocument2)new HTMLDocument();
doc.write(html);
foreach (IHTMLElement el in doc.all)
  Console.WriteLine(el.tagName);
于 2012-07-03T05:01:52.687 に答える