0

リンクのリストがありますが、文字列から正しいリンクをフィルタリングして抽出する必要があります。

抽出はmywebsite.comで始まり、9-digitnumber.htmlで終わる必要があります。リンクは文字列であり、文字列に抽出されます

http://blah.com?f=www.mywebsite.com/sdfsf/sdfsdf/sdfsdfsdf/123456789.html&sdfsdf/sf/sdfsd8sdfsdfsdf

等々...

これから、正規表現は抽出する必要があります

mywebsite.com/sdfsf/sdfsdf/sdfsdfsdf/123456789.html

これは、末尾の'@"[0-9]{9}"の番号と一致する必要があります。しかし、私は正規表現に非常に慣れておらず、正規表現の適切な使用方法を学ぼうとしています。

4

2 に答える 2

1

regexを使用してHTMLを解析することは、通常、悪い考えです。特定の例では、次を使用できます。

(mywebsite.com/(.+?)\d{9})

しかし、アンドリューが言ったように、あなたがやりたいことをするために正規表現を使うことは本当に必要ではありません。

于 2012-05-05T19:52:39.693 に答える
1
/mywebsite\.com\/[a-zA-Z0-9\/]*[0-9]{9}\.html/
于 2012-05-05T19:54:37.587 に答える