ファントム/キャスパーでスクレーパーを構築しています。
この時点で、js スクリプト内でのみページに表示される URL を抽出する必要があります。
ページのソース コードの例:
<script>
queueRequest('URL.aspx?var1='+VAR1+'&var2='+VAR2, getPageMenu');
</script>
とはページ コンテキスト内にあるため、問題なく評価できますが、URL が必要です。URL はハードコードされており、それへの参照はありませVAR1
ん。VAR2
もちろん、URLはページによって異なり、推測することはできません。何か案は?
私のアイデア:
AJAX で div を埋めるためにページの読み込み時に URL が呼び出されるため、XHR リクエストをキャプチャすることを考えていましたが、方法がわかりません。
を使用して、必要なスクリプト要素を取得できました
document.getElementsByTagName('script')
。それもひとつの方法かもしれませんが、200 行以上の中から必要な行だけを取得するにはどうすればよいでしょうか。(で始まるものqueueRequest
)
SO私の質問を明確にするために:
1 と 2 では、どちらのアイデアが優れていますか?
if 1 : casper でリクエスト URL をキャプチャするにはどうすればよいですか?
if 2 :スクリプトで正しい行を取得するにはどうすればよいですか?