1

ID、タグ、または div などの特定の要素を取得するためにWebBrowser.Documentを使用してきました...しかし、WebBrowser は多くの URL アドレスを処理するには遅すぎるようです...何か考えはありますか?

4

2 に答える 2

0

いくつかのオープンソース ブラウザーを含めて、それらをコードに含めることができます。

http://duckwebbrowser.codeplex.com/

http://xplora.codeplex.com/

于 2012-05-11T11:40:19.037 に答える
0

ID、タグ、または div などの特定の要素を取得するために WebBrowser.Document を使用しています。

質問のタイトルと内容から、HTML を取得、解析、およびレンダリングするコントロールを使用する必要があることは、このステートメントから明らかではありません。

HTML を取得して解析するだけのようですね。これが当てはまる場合は、おそらくHtml Agility Packを使用する必要があります。HAP は URL から HTML を取得し、それを解析します。その後、linq、XPath、またはトラバーサル メソッドを使用して、タグと div を取得できます。

hap の使用方法については、例とリンクを含むHTML Agility パックの使用方法に関する記事がたくさんあります。

リンクの 1 つには、ドキュメント内のすべてのリンクを取得して「リスト」に追加する Farooq Kaiser によるこの例が含まれています。

HtmlDocument doc = new HtmlDocument();
doc.Load(url);
HtmlNode root = doc.DocumentNode;

List<string> anchorTags = new List<string>();

foreach (HtmlNode link in root.SelectNodes("//a"))
{
    string att = link.OuterHtml;
    anchorTags.Add(att);
}
于 2012-05-11T16:12:20.617 に答える