HtmlAgilityPack を使用して、html ファイル内の href タグを解析しています。href タグは次のようになります。
<h3 class="product-name"><a href="http://www.somewebsite.com/blahblah" title="Click Here to View This Product">Super Cool Product</a></h3>
これまでのところ、URLとタイトルを一緒に正常に引き出して、リストに表示できます. これは、html を解析するために使用しているメイン コードです。
var linksOnPage = from lnks in document.DocumentNode.SelectNodes("//h3[@class='product-name']//a")
where
lnks.Attributes["href"] != null &&
lnks.InnerText.Trim().Length > 0
select new
{
Url = lnks.Attributes["href"].Value,
Text = lnks.InnerText
};
上記のコードでは、次のような結果が得られます。
Super Cool Product - http://www.somewebsite.com/blahblah
名前とURLを別々に引き出して、それらを一緒に引き出して1つの文字列に入れるのではなく、別々の文字列に入れる方法を見つけようとしています。これを行うために使用できるある種のXpath表記があると思います。誰かが私を正しい方向に導くことができれば、私は非常に感謝しています
ありがとう、マイル