私の要件は、Web ページから必要なコンテンツを抽出することです。このページには、ajax を使用して入力されているセクションがあります。ページ ソースを表示すると、ajax を使用して読み込まれたコンテンツが表示されません。セクションの内容は、選択したチェック ボックスに基づいて変更されます。「インド」チェックボックスを選択すると、セクションにはインドのすべての詳細が表示されます。ページ ソースには、ajax を使用して表示されるコンテンツではなく、デフォルトのコンテンツのみが表示されます。チェックボックスを選択した後にページソースを確認しましたが、それでもデフォルト値しか表示されません。そのセクションのコンテンツを取得する方法、
3060 次
2 に答える
4
C# では、HTMLAgilityPack を使用してデータをクローリングできますが、webBrowser.DocumentText を使用する場合、Web ページから ajax コンテンツを読み込んで xpath を取得することはできません。したがって、webBrowser コントロールが Web ページを完全にロードした後。Document_Complete メソッドでは、以下のコードを追加します。
HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
this.webBrowser1.Document;
IHTMLDocument2 currentDoc =(IHTMLDocument2)this.webBrowser1.Document.DomDocument;
doc.LoadHtml(currentDoc.activeElement.innerHTML);
于 2012-12-04T17:13:36.937 に答える
0
Firefox で Firebug を使用します。NET タブの下に、ロードされた追加のコンテンツが表示されます。
于 2012-08-24T08:37:03.730 に答える