WPF、C#、および VS2010 でアプリケーションを開発していますが、これをどのように進めればよいかわかりません...
HTML ファイル内で参照されるすべての .jpg および .bmp 画像を取得するアルゴリズムに興味があります。HTMLファイル内から本文を抽出するにはどうすればよいですか?
ありがとう
WPF、C#、および VS2010 でアプリケーションを開発していますが、これをどのように進めればよいかわかりません...
HTML ファイル内で参照されるすべての .jpg および .bmp 画像を取得するアルゴリズムに興味があります。HTMLファイル内から本文を抽出するにはどうすればよいですか?
ありがとう
正規表現でできます。
http://msdn.microsoft.com/en-us/library/ms228595.aspx
次のパターンが機能するはずです。
(http?:\/\/.*\.(?:png|jpg|gif))
HTML Agility Packは、HTML ドキュメントから要素を抽出するための非常に堅実なライブラリです。簡単な見方は、Nice API を使用した XPATH のラッパーと見なすことです。