0

HtmlAgilityPack を使用して、html ファイル内の href タグを解析しています。href タグは次のようになります。

<h3 class="product-name"><a href="http://www.somewebsite.com/blahblah" title="Click Here to View This Product">Super Cool Product</a></h3>

これまでのところ、URLとタイトルを一緒に正常に引き出して、リストに表示できます. これは、html を解析するために使用しているメイン コードです。

var linksOnPage = from lnks in document.DocumentNode.SelectNodes("//h3[@class='product-name']//a")
                        where
                            lnks.Attributes["href"] != null && 
                            lnks.InnerText.Trim().Length > 0
                      select new
                      {
                          Url = lnks.Attributes["href"].Value,
                          Text = lnks.InnerText
                      };

上記のコードでは、次のような結果が得られます。

Super Cool Product - http://www.somewebsite.com/blahblah

名前とURLを別々に引き出して、それらを一緒に引き出して1つの文字列に入れるのではなく、別々の文字列に入れる方法を見つけようとしています。これを行うために使用できるある種のXpath表記があると思います。誰かが私を正しい方向に導くことができれば、私は非常に感謝しています

ありがとう、マイル

4

0 に答える 0