0

HTML をダウンロードしようとしているので、ダウンロードするための最小帯域幅を使用して HTML を解析できます。これは私のコードの一部です。

if (!String.IsNullOrEmpty(siteAddress))
                webReq = WebRequest.Create(siteAddress)

                WebResponse webRes = webReq.GetResponse();

                Stream streamResponse = webRes.GetResponseStream();
                StreamReader streamRead = new StreamReader(streamResponse);
                StringReader sr = new StringReader(streamRead.ReadToEnd().Trim());

                streamResponse.Close();
                streamRead.Close();    
                webRes.Close();

                HtmlAgilityPack.HtmlDocument hDoc = new HtmlAgilityPack.HtmlDocument();
                hDoc.Load(sr);

応答を取得してもテキスト応答のみが提供され、画像もダウンロードされないことを誰かが確認できますか? HTMLAgilityPack メソッドでロードする場合はどうなりますか?

4

2 に答える 2

2

を使用する場合WebClientWebRequestまたはダウンロードするのはhtmlHtmlAgilityPackのみです。

画像 (またはその他のリソース) が必要な場合は、ダウンロードしたドキュメントで画像の URL を検索し、自分でリクエストを発行して取得する必要があります。

少し試してみたい場合は、WebBrowserコントロールに注目してください。そこから、Documentプロパティを取得してそのプロパティを確認し、Imagesすべての画像を自分でダウンロードできます。

何をしたいですか?

于 2011-03-17T15:11:14.767 に答える
1

サイト全体ではなく、サイトの HTML ソースをダウンロードします。それは大きな違いです。

HTML Agility Packの使用方法とこれも参照してください

于 2011-03-17T15:10:08.637 に答える