0

大量のローカル html ファイルをスクレイピングしようとしています。それぞれには、次のように、異なる window.open パスを使用して、ファイル内に埋め込まれた JavaScript の一部があります。

<script>

function goTo() {

if (document.getElementById('somedomain').checked) {
window.open("http://www.somedomain.com");
}

if (document.getElementById('visit').checked) {
window.open("http://extract-this-url.com/?somevar=12345&anothervar=59305&etc=etc");
}

}
</script>

その 2 番目の URL を抽出しようとしています。これは、ファイルごとに異なる URL になります (最初の「somedomain」URL と同様)。

私はSimpleHTMLDOMを見てきましたが、HTMLファイルに埋め込まれたJavaScriptを実行できるようには見えません。

これを行う適切な方法はありますか?

4

1 に答える 1

1

正規表現を使用するだけです:

preg_match('#visit.*?window\.open\("(.*?)"#is',$text,$matches);
print_r($matches);
于 2013-01-04T11:00:07.590 に答える