URL を取得するために、php では curl を、Python では httplib2 を使用します。
ただし、ページを読み込んだ後に JavaScript (AJAX) を使用してデータを取得し、後でページの特定のセクションを上書きするだけのページもあります。
では、JavaScript を処理できるコマンド ライン ユーティリティはありますか?
私が言いたいことを知るには、monster.com にアクセスして、仕事を探してみてください。
その後、Ajax がジョブのリストを取得していることがわかります。したがって、キーワード検索に基づいて求人を取得したい場合は、求人のないページが表示されます。
しかし、ブラウザ経由で動作します。