0

C# を使用して、asp.net のリモート Web ページのコンテンツを読みたいと考えています。asp.netで次のコードを使用して読みました。

 protected void Page_Load(object sender, EventArgs e)
    {
        string TheUrl = "http://www.demosite.com/Default.aspx";
        string response = GetHtmlPage(TheUrl);
        Response.Write(response);

    }
static string GetHtmlPage(string strURL)
    {

        String strResult;
        WebResponse objResponse;
        WebRequest objRequest = HttpWebRequest.Create(strURL);
        objResponse = objRequest.GetResponse();
        using (StreamReader sr = new StreamReader(objResponse.GetResponseStream()))
        {
            strResult = sr.ReadToEnd();
            sr.Close();
        }
        return strResult;
    }

ここで、リモート Web ページのコンテンツ全体を取得します。コンテンツ タグをタグごとに読み取り、そのコンテンツのみを取得します。出来ますか?

助けてください...!前もって感謝します!

4

1 に答える 1

0

HTML Agility パックを使用して、要素をトラバースします。これは、HTML を解析するための最良の方法です。

すべてのテキストノードを取得できるはずです

doc.DocumentNode.SelectNodes("//text()[normalize-space(.) != '']")
于 2012-10-09T11:38:43.130 に答える