3

私の要件は、Web ページから必要なコンテンツを抽出することです。このページには、ajax を使用して入力されているセクションがあります。ページ ソースを表示すると、ajax を使用して読み込まれたコンテンツが表示されません。セクションの内容は、選択したチェック ボックスに基づいて変更されます。「インド」チェックボックスを選択すると、セクションにはインドのすべての詳細が表示されます。ページ ソースには、ajax を使用して表示されるコンテンツではなく、デフォルトのコンテンツのみが表示されます。チェックボックスを選択した後にページソースを確認しましたが、それでもデフォルト値しか表示されません。そのセクションのコンテンツを取得する方法、

4

2 に答える 2

4

C# では、HTMLAgilityPack を使用してデータをクローリングできますが、webBrowser.DocumentText を使用する場合、Web ページから ajax コンテンツを読み込んで xpath を取得することはできません。したがって、webBrowser コントロールが Web ページを完全にロードした後。Document_Complete メソッドでは、以下のコードを追加します。

HtmlAgilityPack.HtmlDocument doc = new HtmlAgilityPack.HtmlDocument();
this.webBrowser1.Document;
IHTMLDocument2 currentDoc =(IHTMLDocument2)this.webBrowser1.Document.DomDocument;

doc.LoadHtml(currentDoc.activeElement.innerHTML);
于 2012-12-04T17:13:36.937 に答える
0

Firefox で Firebug を使用します。NET タブの下に、ロードされた追加のコンテンツが表示されます。

于 2012-08-24T08:37:03.730 に答える