c# - javascriptで設定したWebページの隠しInnerHtmlを取得するには?

Question

次のコードで Web ページのソースを取得できることはわかっています。

browser.DocumentText;

ページの一部のデータは JavaScript 関数によって埋められ、innetHtmlでは表示されませんbrowser.Textが、browserの出力は表示されます。

javascript によってページに追加されたデータのソースコードを取得するにはどうすればよいですか?

score 2 · Accepted Answer

取得したい内部 HTML を含むタグのタイプがわかっている場合は、次のようにすることができます (この例では div タグをループしますが、p やテーブルセルなどを実行できます)。

HtmlElementCollection collection = browser.Document.GetElementsByTagName("div");

foreach (HtmlElement element in collection) {
    string html = element.InnerHtml;
    string text = element.InnerText;
    // do something with the HTML or text here...
}

または、取得する要素の特定の ID がわかっている場合は、次を使用します。

HtmlElement element = browser.Document.GetElementById("someId123");
if(null != element) // do something with it...

score 1 · Accepted Answer

HtmlAgilityPackを試して、この回答に従うことができます。

HtmlWeb webGet = new HtmlWeb();
HtmlAgilityPack.HtmlDocument doc = webGet.Load(url);

c# - javascriptで設定したWebページの隠しInnerHtmlを取得するには?

2 に答える 2

Related

Reference