0

私はこのウェブページのソースを持っています:

<a href="/StefaniStoikova"><img alt="" class="head" id="face_6306494" src="http://img0.ask.fm/assets/054/771/271/thumb_tiny/sam_7082.jpg" /></a>
<a href="/devos"><img alt="" class="head" id="face_18603180" src="http://img7.ask.fm/assets/043/424/871/thumb_tiny/devos.jpg" /></a>
<a href="/frenop"><img alt="" class="head" id="face_4953081" src="http://img1.ask.fm/assets/029/163/760/thumb_tiny/dsci0744.jpg" /></a>

そして、の直後に文字列を抽出したいと思います<a href-"。しかし、私の主な問題は、これらの文字列が異なり、方法が見つからないように見えることです。agilitypackもwebrequestsもありません。

多分誰かが正規表現について考えていますか?共有する。

4

1 に答える 1

3

HtmlAgilityPackを使用して必要なものを取得するのは非常に簡単です。HtmlDocumentドキュメントが次の名前のオブジェクトにロードされていると仮定しますdoc

HtmlNodeCollection collection = doc.DocumentNode.SelectNodes("//a[@href]");

foreach (HtmlNode node in collection)
{
    // Do what you want with the href value in here. As an example, this just
    //  just prints the value to the console.
    Console.WriteLine(node.GetAttributeValue("href", "default"));
}
于 2012-10-21T21:29:19.477 に答える