0

この質問は何度も投稿されていることを知っており、これまでのすべての質問を読み通しました。私はこれを機能させる方法を見つけることができませんでした。

特定のIDを持つimgタグのsrcurlを抽出する必要があります。入力形式は-

<img class"image" id="prdImage" width="277" height="400" alt="someimage" src="http://url/image.jpg"/>

src属性は常に最後であり、クラスは常に最初です。また、このコードは大きなHTMLドキュメントになります。関連する部分だけをあげました。

私が今まで持っているもの-

/<img class="image" id="prdImage".+?src="(.+?)".+?\/>/i

これは、src属性だけでなく、imgタグ全体を返すことを除いて正常に機能しています。

注:このような場合は、DOMパーサーを使用する必要があることを知っています。しかし、このプロジェクトでは、正規表現しか使用できません。

4

2 に答える 2

1

これを試して

(?<=<img.*?src=")(.*?)(?="/>)

その正規表現は返されます

http://url/image.jpg

入力文字列から

<img class"image" id="prdImage" width="277" height="400" alt="someimage" src="http://url/image.jpg"/>
于 2012-11-29T09:17:06.623 に答える
0

私は自分で答えを見つけました。これが表現です

/<img class="image" id="prdImage"(.*?)src="(.*?)"\/>/i

これにより、URLが2番目の位置にある配列が返されます。

私は自分でそれを理解したので、私はこの答えを受け入れています。他の誰かがより良い解決策を持っているなら、私は彼らの答えを受け入れます。

于 2012-11-29T11:05:13.360 に答える