0

WPF、C#、および VS2010 でアプリケーションを開発していますが、これをどのように進めればよいかわかりません...

HTML ファイル内で参照されるすべての .jpg および .bmp 画像を取得するアルゴリズムに興味があります。HTMLファイル内から本文を抽出するにはどうすればよいですか?

ありがとう

4

2 に答える 2

0

正規表現でできます。

http://msdn.microsoft.com/en-us/library/ms228595.aspx

次のパターンが機能するはずです。

(http?:\/\/.*\.(?:png|jpg|gif))
于 2012-04-13T19:11:29.273 に答える
0

HTML Agility Packは、HTML ドキュメントから要素を抽出するための非常に堅実なライブラリです。簡単な見方は、Nice API を使用した XPATH のラッパーと見なすことです。

于 2012-04-13T19:14:38.797 に答える