-1

divクラス内のリンク(具体的にはURL)を取得したいと思います。これは、divクラス内のテキスト(一部のテキスト...)を取得するためのコードです。

foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='content']"))
{
    //saves text (node.InnerText) in array          
}

これはサイトからのHTMLです。www.google.comを取得したい

<div class="content">
    <p>Some text... 
    <a href="www.google.com">LINK</a> 
    </p>
</div>
4

3 に答える 3

0
foreach (HtmlNode node in doc.DocumentNode.SelectNodes("//div[@class='novica']/p/a[@href='www.google.com']"))
{
    //saves text (node.InnerText) in array          
}
于 2012-12-31T11:58:08.387 に答える
0

そのコードはあなたの記述に基づいて有効ではありませんが、2 つのオプションがあります。

  1. のノードを取得したら、または子をdiv使用.GetElementsByTagName("a")してリンクを引き出し、その href 属性を取得します。

  2. 代わりにタグSelectNodes()を取得するように XPath を修正します。a//div[@class='novica']/p/a

その要素の を取得する必要がある場合は、最初の方法の方が明らかに優れていますが、2 番目の方法の方が高速です。.InnerTextSome text...

于 2012-12-31T12:00:08.537 に答える
0
foreach (var node in doc.DocumentNode.SelectNodes("//div[@class='novica']"))
{
    var links = node.Descendants("a").Select(n => n.InnerText).ToList();
}
于 2012-12-31T12:00:15.123 に答える