<img src="http://Some_image.png" alt="somethingIdonotneed"
タスク: イメージ ビット ( src="this stuff.png"
) のみをグループ化し、残りは無視します。
また、何らかの理由で、これを見つけた HTML には、 がありませんでし</img>
た。すべてのタグが閉じていると思いましたか?
ありがとう
<img src="http://Some_image.png" alt="somethingIdonotneed"
タスク: イメージ ビット ( src="this stuff.png"
) のみをグループ化し、残りは無視します。
また、何らかの理由で、これを見つけた HTML には、 がありませんでし</img>
た。すべてのタグが閉じていると思いましたか?
ありがとう
ここでのクイックフィックスは
/img\s+(src="[^"]+")/
ただし、HTML の解析に正規表現を使用しないことを強くお勧めします。
また、これは自己終了 (「void」) タグのリストです。つまり、</...>
終了タグは必要ありません。
<area>
<base>
<basefont>
<br>
<col>
<command>
<embed>
<hr>
<input>
<img>
<keygen>
<link>
<meta>
<param>
<source>
<track>
<wbr>
これを試して、
/img[^>]+?(src\s*=\s*\"[^\"]*\")/i
最初のグループを取得する必要があります。
この正規表現は、必要なものを (全体で、グループなしで) キャプチャします。
(?<=<img )src="[^"]+"