データを収集するために、Java コードから Google Scholar に対して複数 (100 以上) の HTTP リクエストを行う必要があります。ただし、約 20 回のリクエストの後、このサイトはこれを阻止し、キャプチャを生成します。リクエストが単一の IP から来ないようにすることで、リクエスト元システムの IP アドレスを定期的に変更し、キャプチャの発生を回避できる「Amazon スポット インスタンス」について聞いたことがあります。詳細について、誰か助けてもらえますか? (Amazon EC2 スポット インスタンス以外の代替方法でも問題ありません)