0

私はC#.netでプロジェクトを作成しています。このプロジェクトでは、Webページのソースコードを取得し、特定のタグを特定する必要があります。

たとえば、私はすべてを見つける必要があります

           <img> 

コード内のタグ。そして私はそれを変数に保存する必要があります。

私はc#.netアプリケーションでWebページのソースコードを取得することで最初のステップに成功しました。タグを取得してその位置を変数に格納する方法がわかりませんか?

推測してください

4

2 に答える 2

3

HTML を解析するには、 HtmlAgilityPackなどの専用ライブラリを使用しますが、正規表現は使用しないでください。

HTML のスニペットからリンクを抽出する例を次に示します。これを適応させて img タグを取得できます。

于 2012-11-20T09:10:13.127 に答える
0

この作業には HtmlAgitityPack を使用することをお勧めします。タグ付けされたコンテンツを取得するための生の html マークアップは非常に柔軟です。

 HtmlDocument htmlDocument = new HtmlDocument();
 htmlDocument.LoadHtml("<html><head></head><body><div><img /><div><img /><img/></div></div><img/></body></html>");

 var nodes = htmlDocument.DocumentNode.SelectNodes("//img");
 // 4 nodes found
 foreach (var node in nodes)
 {
     // do stuff
 }
于 2012-11-20T09:12:10.637 に答える