私はC#.netでプロジェクトを作成しています。このプロジェクトでは、Webページのソースコードを取得し、特定のタグを特定する必要があります。
たとえば、私はすべてを見つける必要があります
<img>
コード内のタグ。そして私はそれを変数に保存する必要があります。
私はc#.netアプリケーションでWebページのソースコードを取得することで最初のステップに成功しました。タグを取得してその位置を変数に格納する方法がわかりませんか?
推測してください
HTML を解析するには、 HtmlAgilityPackなどの専用ライブラリを使用しますが、正規表現は使用しないでください。
HTML のスニペットからリンクを抽出する例を次に示します。これを適応させて img タグを取得できます。
この作業には HtmlAgitityPack を使用することをお勧めします。タグ付けされたコンテンツを取得するための生の html マークアップは非常に柔軟です。
HtmlDocument htmlDocument = new HtmlDocument();
htmlDocument.LoadHtml("<html><head></head><body><div><img /><div><img /><img/></div></div><img/></body></html>");
var nodes = htmlDocument.DocumentNode.SelectNodes("//img");
// 4 nodes found
foreach (var node in nodes)
{
// do stuff
}