0

Java を使用したデータ抽出の実験を行ったところ、このフォーラムで検索したところ、スクリーン スクレイピングと呼ばれていることがわかりました。Java 用のスクリーン スクレーパー ライブラリを探していて、結果を解析する JSoup を見つけました。

私の問題は、検索フォームが送信されたときにpostメソッドを使用するターゲットWebサイトです。それを再現するのは簡単ではありません。また、送信アクション後の応答コードが302であることをクロムの開発者ツールで確認し、いくつかのページにリダイレクトしてから、結果ページ。

誰かが私にヒントを与えるか、jsoupでそれを行う方法のチュートリアルを教えてください。私の場合、ai*ras*ia.*com からフライト スケジュールを取得しようとしています。

4

1 に答える 1

0

JSOUP には .followRedirects(followRedirects) という関数があり、リダイレクトに従うかどうかを選択できます。デフォルトでは「true」に設定されています。

これらは、リダイレクトを許可する HTTP コードです。

  • 301 - HTTP_MOVED_PERM
  • 302 - HTTP_MOVED_TEMP
  • 303 - HTTP_SEE_OTHER
于 2013-02-15T17:18:50.493 に答える