Find centralized, trusted content and collaborate around the technologies you use most.
Teams
Q&A for work
Connect and share knowledge within a single location that is structured and easy to search.
私のプログラムは、HTML ページのコンテンツを取得し、ページ内の jpg 画像リンクを探します。
正規表現を使用して画像を取得したいのですが、ここで問題が発生します..
それを行うために、私はパターンを使用しました
「http.*?jpg」
しかし、「http://someURL...http://imageURL.jpg」のような表現をキャッチすることができます。
つまり、「jpg」を見つけて、最初の「http」をさかのぼって検索します。
正規表現を使用することは可能ですか?
これは、セミコロンが 1 つしかなく、したがって http: ブロックが 1 つしかないことhttp:[^:]*?jpgを確認するハックな方法です。URL の一般的な区切り文字をさらに選択できます。
http:[^:]*?jpg
http:[^:\"\}\{\s]*?\.jpg
負の先読みベースの正規表現を使用して、次のようにhttp://と .jpg` の間で最短のテキストが一致するようにします。
http://
/http:\/\/(?!.*?http:\/\/).+?\.jpe?g/