0
     Dim url As New Uri("http://www.testpage.com")
    If url.Scheme = Uri.UriSchemeHttp Then
        'Create Request Object
        Dim objRequest As HttpWebRequest = DirectCast(HttpWebRequest.Create(url), HttpWebRequest)
        'Set Request Method
        objRequest.Method = WebRequestMethods.Http.[Get]
        'Get response from requested url
        Dim objResponse As HttpWebResponse = DirectCast(objRequest.GetResponse(), HttpWebResponse)
        'Read response in stream reader
        Dim reader As New StreamReader(objResponse.GetResponseStream())
        Dim tmp As String = reader.ReadToEnd()
        objResponse.Close()
        'Set response data to container
        Label1.Text = tmp
    End If

Webページの一部だけをスクレイピングするにはどうすればよいでしょうか..コードは完全なhtmlコンテンツを正常に取得します.

たとえば..その間のすべてをこすり落としたい<div id="content"> </div>

4

1 に答える 1

1

文字列変数にページの完全なhtmlコンテンツが含まれると、この文字列に対して正規表現を使用して、抽出する部分を返すことができます。

抽出したいものの詳細を提供していないので、正規表現の使用方法に関するリンクを提供します。

正規表現に関する短いチュートリアルはここにあります

于 2012-05-31T21:38:41.497 に答える