1

現在のディルバート画像を読み込もうとしています。これを行うことで、ページの全文を取得できます。

        var todayDate = DateTime.Now.ToString("yyyy-MM-dd");
            var web = new HtmlWeb();
            web.UseCookies = true;
            var wp = new WebProxy("http://myproxy:8080");
            wp.UseDefaultCredentials = true;
            NetworkCredential nc = (NetworkCredential)CredentialCache.DefaultCredentials;
            HtmlDocument document = web.Load("http://www.dilbert.com/strips/comic/" + todayDate, "GET", wp, nc);

ドキュメントの完全な html を見ると、次のようにページに複数回リストされている画像が表示されます。

<meta property="og:image" content="http://assets.amuniversal.com/c2168fa0c45a0132d8f0005056a9545d"/>

また:

<meta name="twitter:image" content="http://assets.amuniversal.com/c2168fa0c45a0132d8f0005056a9545d">

また

  <img alt="Squirrel In The Large Hadron Collider - Dilbert by Scott Adams" class="img-responsive img-comic" height="280" src="http://assets.amuniversal.com/c2168fa0c45a0132d8f0005056a9545d" width="900" />

この画像から URl を解析する最良の方法は何ですか?

4

2 に答える 2

1

HtmlAgilityPackまたは同様のライブラリを使用して、応答 HTML の構造を解析し、パーサーによって生成された DOMをたどることができます。

于 2015-05-04T23:29:28.657 に答える