HTML アジリティ パックを使用して Web ページを解析し、必要な各子ノードまでトラバースします
。
HtmlDocument doc = web.Load("http://example.com");
HtmlNode list = doc.DocumentNode.SelectSingleNode("//ol[@class='list']")
foreach (HtmlNode inside_li in linode.ChildNodes)
{
if (inside_li.Name == "div")
{
HtmlNode ahref = inside_li.SelectSingleNode("//h3[@desc='title']/a");
}
}
ウェブサイトの構造:- attrib class='list' を持つ多くの ol があり、それぞれに atrrib desc='title' を持つ h3 を持つ div があります (h3 の場所は固定できません)。
質問:- ahref 属性 ["href"] を 10 の配列に格納するとします。次に、すべての要素が最初の要素と同じ文字列を持ちます。だから私は // を使用して、ドキュメント全体を参照していることを理解しましたhttp://example.com。この場合、どうすれば inside_li HtmlNode のどこでも検索できますか。また、ドキュメント全体ではなく inside_li 内を検索するように指示している場合でも、この問題が発生するのはなぜですか