この質問は何度も投稿されていることを知っており、これまでのすべての質問を読み通しました。私はこれを機能させる方法を見つけることができませんでした。
特定のIDを持つimgタグのsrcurlを抽出する必要があります。入力形式は-
<img class"image" id="prdImage" width="277" height="400" alt="someimage" src="http://url/image.jpg"/>
src属性は常に最後であり、クラスは常に最初です。また、このコードは大きなHTMLドキュメントになります。関連する部分だけをあげました。
私が今まで持っているもの-
/<img class="image" id="prdImage".+?src="(.+?)".+?\/>/i
これは、src属性だけでなく、imgタグ全体を返すことを除いて正常に機能しています。
注:このような場合は、DOMパーサーを使用する必要があることを知っています。しかし、このプロジェクトでは、正規表現しか使用できません。