c# - C# では、webproxy.load() を使用して取得した html ページから URL を解析するにはどうすればよいですか?

Question

現在のディルバート画像を読み込もうとしています。これを行うことで、ページの全文を取得できます。

        var todayDate = DateTime.Now.ToString("yyyy-MM-dd");
            var web = new HtmlWeb();
            web.UseCookies = true;
            var wp = new WebProxy("http://myproxy:8080");
            wp.UseDefaultCredentials = true;
            NetworkCredential nc = (NetworkCredential)CredentialCache.DefaultCredentials;
            HtmlDocument document = web.Load("http://www.dilbert.com/strips/comic/" + todayDate, "GET", wp, nc);

ドキュメントの完全な html を見ると、次のようにページに複数回リストされている画像が表示されます。

<meta property="og:image" content="http://assets.amuniversal.com/c2168fa0c45a0132d8f0005056a9545d"/>

また：

<meta name="twitter:image" content="http://assets.amuniversal.com/c2168fa0c45a0132d8f0005056a9545d">

また

  <img alt="Squirrel In The Large Hadron Collider - Dilbert by Scott Adams" class="img-responsive img-comic" height="280" src="http://assets.amuniversal.com/c2168fa0c45a0132d8f0005056a9545d" width="900" />

この画像から URl を解析する最良の方法は何ですか?

score 1 · Accepted Answer

HtmlAgilityPackまたは同様のライブラリを使用して、応答 HTML の構造を解析し、パーサーによって生成された DOMをたどることができます。

c# - C# では、webproxy.load() を使用して取得した html ページから URL を解析するにはどうすればよいですか?

2 に答える 2

Related

Reference