HTMLUnit を使用して Web サイトをスクレイピングする Java アプリケーションを構築しようとしています。一部のデータを抽出した後、アプリケーションで次の例外が発生します - java.lang.RuntimeException: org.apache.http.conn.HttpHostConnectException: 接続が拒否されました。
アプリケーションを再度実行すると、同じ例外で失敗する前に、一部のデータを再度抽出できます。おそらく、サーバーは同じクライアント IP からの多くのリクエストを確認し、リクエストの接続を拒否します。
また、アプリケーションでこの問題が発生した場合、ブラウザを使用してサイトに接続できます。
どうすればこの問題を克服できますか? Webスクレイピングアプリケーションでは、そのような問題にどのように取り組み、解決していますか?