リンクを抽出しようとしているさまざまなHTMLドキュメントがあります:(1)他のhtmlドキュメント、(2).jpg、.png、.bmpなどの画像ファイル。これを行うには正規表現が必要ですが、理解できないようです。
各htmlページには、次のようなコードが含まれます。
IMG style = "MARGIN-BOTTOM:20px; MARGIN-LEFT:20px" align = right src = "images / sample001.jpg">
IMG style = "MARGIN-BOTTOM:25px; MARGIN-LEFT:25px" align = right src = "images / sample002.png">
IMG style = "MARGIN-BOTTOM:20px; MARGIN-LEFT:20px" align = right src = "images / sample003.bmp">
href = "javascript:parent.POPUP({url:'testDoc001.htm'、type:'shared'、width:600、height:645})">
href = "javascript:parent.POPUP({url:'testDoc002.html'、type:'shared'、width:700、height:712})">
例として、正規表現は上記のHTMLで動作し、結果の配列を生成します。
images / sample001.jpg
images / sample002.png
images / sample003.bmp
testDoc001.htm
testDoc002.html
誰かが私を助けることができますか?本当にありがとう。