ID、タグ、または div などの特定の要素を取得するためにWebBrowser.Documentを使用してきました...しかし、WebBrowser は多くの URL アドレスを処理するには遅すぎるようです...何か考えはありますか?
質問する
648 次
2 に答える
0
いくつかのオープンソース ブラウザーを含めて、それらをコードに含めることができます。
于 2012-05-11T11:40:19.037 に答える
0
ID、タグ、または div などの特定の要素を取得するために WebBrowser.Document を使用しています。
質問のタイトルと内容から、HTML を取得、解析、およびレンダリングするコントロールを使用する必要があることは、このステートメントから明らかではありません。
HTML を取得して解析するだけのようですね。これが当てはまる場合は、おそらくHtml Agility Packを使用する必要があります。HAP は URL から HTML を取得し、それを解析します。その後、linq、XPath、またはトラバーサル メソッドを使用して、タグと div を取得できます。
hap の使用方法については、例とリンクを含むHTML Agility パックの使用方法に関する記事がたくさんあります。
リンクの 1 つには、ドキュメント内のすべてのリンクを取得して「リスト」に追加する Farooq Kaiser によるこの例が含まれています。
HtmlDocument doc = new HtmlDocument();
doc.Load(url);
HtmlNode root = doc.DocumentNode;
List<string> anchorTags = new List<string>();
foreach (HtmlNode link in root.SelectNodes("//a"))
{
string att = link.OuterHtml;
anchorTags.Add(att);
}
于 2012-05-11T16:12:20.617 に答える