HTMLファイルを解析してすべての画像ファイルを取得するための正規表現を作成しようとしています。電子メールとして送信する前に画像を埋め込むためにこれを行う必要があります。
画像を参照できる「場所のリスト」はありますか?たとえば、内部<img src="here" />
、CSSスタイルurl('here')
、またはを調べる必要があることはわかっていますがbackground='here'
、それはすべてのケースをカバーしていますか?
そして、正規表現はすでにどこかに存在しますか?正規表現を書くのは苦痛だと思います。ケースを見逃したり、壊れたHTMLマークアップを処理するのを忘れたりしたくありません。
<img>
タグの場合、次のようなものが見つかりました。
(?<=img\s+src\=[\x27\x22])(?<Url>[^\x27\x22]*)(?=[\x27\x22])
しかし、他の場所を含める方法がわかりません。