Classen = "string_14" のすべての td タグから情報を取得して、html コードなしでクリーンに保存するにはどうすればよいですか。
私はこれについて考えました:
enter code here
<table class="string_14">
<tbody><tr>
<td>Postadr.:</td>
<td class="tab_space">Stenslivegen 67, 2817 Gjøvik</td>
</tr>
<tr>
<td>Telefon:</td>
<td class="tab_space">611 80 710</td>
</tr>
<tr>
<td>Mobil:</td>
<td class="tab_space">957 92 455</td>
</tr>
</tbody>
</table>
そして、今日のように見えるようにするための私のコードは、xpath を name =? に書き込むことです。単一の td を取得するにはどのように記述すればよいですか。
HtmlDocument doc = new HtmlDocument();
doc.Load(new StringReader(result));
HtmlNode root = doc.DocumentNode;
List<string> list = new List<string>();
foreach (HtmlNode div in root.SelectNodes("//div[@class='biz_list']"))
{
string name = doc.DocumentNode.SelectNodes("//d[@class='string_14']/@tr");
list.Add(name);
string att = div.OuterHtml;
list.Add(att);
}
これから私が望むのは、ページをスクレイピングし、LATE ステージでこれを xml ファイルに保存することです。