2

私のプログラムは、HTML ページのコンテンツを取得し、ページ内の jpg 画像リンクを探します。

正規表現を使用して画像を取得したいのですが、ここで問題が発生します..

それを行うために、私はパターンを使用しました

「http.*?jpg」

しかし、「http://someURL...http://imageURL.jpg」のような表現をキャッチすることができます。

つまり、「jpg」を見つけて、最初の「http」をさかのぼって検索します。

正規表現を使用することは可能ですか?

4

2 に答える 2

3

これは、セミコロンが 1 つしかなく、したがって http: ブロックが 1 つしかないことhttp:[^:]*?jpgを確認するハックな方法です。URL の一般的な区切り文字をさらに選択できます。

http:[^:\"\}\{\s]*?\.jpg

于 2012-06-06T18:29:53.683 に答える
0

負の先読みベースの正規表現を使用して、次のようにhttp://と .jpg` の間で最短のテキストが一致するようにします。

/http:\/\/(?!.*?http:\/\/).+?\.jpe?g/
于 2012-06-06T18:51:33.050 に答える