0

Classen = "string_14" のすべての td タグから情報を取得して、html コードなしでクリーンに保存するにはどうすればよいですか。

私はこれについて考えました:

enter code here
<table class="string_14">
                <tbody><tr>
                    <td>Postadr.:</td> 
                    <td class="tab_space">Stenslivegen 67, 2817 Gjøvik</td> 
                </tr>
                <tr>
                    <td>Telefon:</td> 
                    <td class="tab_space">611 80 710</td>
                </tr>

                <tr>
                    <td>Mobil:</td> 
                    <td class="tab_space">957 92 455</td>
                </tr>
                </tbody>
                </table>

そして、今日のように見えるようにするための私のコードは、xpath を name =? に書き込むことです。単一の td を取得するにはどのように記述すればよいですか。

        HtmlDocument doc = new HtmlDocument();
        doc.Load(new StringReader(result));
        HtmlNode root = doc.DocumentNode;


        List<string> list = new List<string>();
        foreach (HtmlNode div in root.SelectNodes("//div[@class='biz_list']"))
        {
            string name = doc.DocumentNode.SelectNodes("//d[@class='string_14']/@tr");
            list.Add(name);
            string att = div.OuterHtml;
            list.Add(att);
        }

これから私が望むのは、ページをスクレイピングし、LATE ステージでこれを xml ファイルに保存することです。

4

1 に答える 1

1

あなたが望むのはこれだと思います:

HtmlNodeCollection collection = doc.DocumentNode.SelectNodes("//table[@class='string_14']//td[@class='tab_space']");

詳細については、 XPath チュートリアルを参照してください。

于 2013-03-19T16:50:05.917 に答える