単一のホストから複数のページから HTML コンテンツを取得し、そこからデータを抽出する Java アプレットを作成しました。私は Jsoup を使用しており、完全に機能していますが、ブラウザーで設定されたそのホストの Cookie を自動的に使用し、後続の要求で新しく設定された Cookie を送信します。(これはJavaによってネイティブに行われていると思います)
アプレットの実行時にサーバーによって設定されたすべての Cookie を無視し、ブラウザーが既に持っている可能性のあるすべての Cookie を無視するようにします。
私のコードはとてもシンプルです。
String url = "http://example.com/my/web-page.html";
Document document = Jsoup.connect(url).userAgent("<hard-coded static value>").get();
// Extract data from document with org.Jsoup.nodes.Document.select(), etc.
これは、すべて同じホスト (example.com) を持つ複数の URL で繰り返されます。
要約すると、私は基本的にそれをしたい:
- ブラウザに設定されている可能性のある example.com の Cookie を無視します。
- アプレットがリクエストを行ったときにサーバーが新しい Cookie を設定した場合、それ以降のリクエストではそれを無視します。可能であれば、Cookie がブラウザに保存されないようにブロックします。
私はたくさん検索しましたが、解決策を見つけることができませんでした。いくらでも助けていただければ幸いです。Apache HTTPClient やその他のサードパーティ ライブラリを使用してもかまいませんが、アプレットのファイル サイズを小さく保つために使用しないほうがよいと考えています。
事前にたくさんのありがとう:)