0

href からリンクを抽出しようとしています。<a class="p_l" href="" id="0" target="_blank"> これはページ ビュー ソースに表示されるものですが、firebug を使用して検査すると、href にhttp://home.website.com/preview/preview?uname=3eadsf132sdas. htmlagilitypack を使用してみましたが、href が null を返しています。href でリンクを抽出する方法。

4

2 に答える 2

1

WebRequest クラスを使用して html コンテンツを取得するなど、別のことを試すことができます (方法はこちらを参照)。

href にリンクが含まれていない場合は、動的コンテンツを追加するために Javascript またはその他のプログラミング言語を使用してデータが入力されている可能性があります。スクリプトにアクセスできる場合は、リンクを取得する可能性はわずかですが、そうは思わないでください。

于 2012-08-13T13:36:35.300 に答える
1

この方法を試したことがない場合は、この方法を試してください

    HtmlAgilityPack.HtmlDocument htmlDoc = new HtmlAgilityPack.HtmlDocument();

        htmlDoc.OptionFixNestedTags=true;

        htmlDoc.Load(filePath);

 foreach(HtmlNode link in htmlDoc.DocumentElement.SelectNodes("//a[@href"])
 {
    if(link != null)
    {
      if(link["href"] != null)
      {
       HtmlAttribute att = link["href"];
       var url = att.Value;
      }
    }
于 2012-08-13T11:01:54.807 に答える