一連の Web ページを PHP で次々と解析しようとしていますが、最初のページを開くと、次のページへのリンクが JavaScript に隠されていることに気付きました。
次の Web ページの解析を続行できる方法はありますか? URL に "page=2" のような変数が暗号化されている場合、そのように処理しますが、URL は暗号化されています。
-LPG
一連の Web ページを PHP で次々と解析しようとしていますが、最初のページを開くと、次のページへのリンクが JavaScript に隠されていることに気付きました。
次の Web ページの解析を続行できる方法はありますか? URL に "page=2" のような変数が暗号化されている場合、そのように処理しますが、URL は暗号化されています。
-LPG
唯一の方法は、javascript リンクを解析して追跡する正規表現を作成することです。これはおそらく、ページへの URL が JavaScript コードに含まれている場合にのみ機能します。たとえば、次のようになります。
<a href="javascript:open('something/some_page.html');">Something</a>
ただの代わりに
<a href="javascript:open(someField.value);">Something</a>
2 番目の例では、実際には PHP を使用して JavaScript リンクを処理する必要があり、これは非常に困難な場合があります。
また、サイトごとに URL の形式が異なるため、Web サイト固有の正規表現を作成する必要があることにも注意してください。そのため、 Cnn.com は Reddit.comとは異なる形式で URL を作成する可能性があります。