重複の可能性:
C# で html を解析する最良の方法は何ですか?
Web サイトから情報を簡単に抽出できるように、HTML を解析したり、HTML を XML に変換したりする方法はありますか?
私はC#で作業しています。
ありがとうございました、
重複の可能性:
C# で html を解析する最良の方法は何ですか?
Web サイトから情報を簡単に抽出できるように、HTML を解析したり、HTML を XML に変換したりする方法はありますか?
私はC#で作業しています。
ありがとうございました、
HTMLAgilityPackはあなたが探しているものです。HTMLAgilityPack を使用した HTML ドキュメントの解析のチュートリアルを確認してください。
COM オブジェクトを使用してMicrosoft HTML Object Library
HTML をロードし、そのオブジェクト モデルを使用してナビゲートできます。以下に例を示します。
string html;
WebClient webClient = new WebClient();
using (Stream stream = webClient.OpenRead(new Uri("http://www.google.com")))
using (StreamReader reader = new StreamReader(stream))
{
html = reader.ReadToEnd();
}
IHTMLDocument2 doc = (IHTMLDocument2)new HTMLDocument();
doc.write(html);
foreach (IHTMLElement el in doc.all)
Console.WriteLine(el.tagName);