1

URL のリストから .html の Web ページをダウンロードしようとしていますが、これらの Web サイトの一部はセッション Cookie を使用しており、Jsoup.connect("url") を試行すると 403 が返されます。
そのため、Map / HashMap を使用しましたJsoup で Cookie を管理する方法、Jsoup でCookieとセッションを維持する方法、Cookie を取得する方法など..、それでも 403.

本当に驚いたのは、Mac Automator のような非常に単純なアプリで仕事ができ、実際には HTML ではなくテキストのみを保存できることですが、まだ...

このCookieの後退を乗り越える方法を知っている人はいますか? このページを使用した例は素晴らしいでしょう。http://pubs.acs.org/doi/full/10.1021/ja312087x

thx!!!

4

1 に答える 1

1

この回答を見てください https://stackoverflow.com/a/15369631/516167

ページを開く必要があります。この後、フォーム データ (ログイン、パスワード)、Cookie、および POST に必要なその他のパラメーターを送信します。

于 2013-03-15T22:18:38.930 に答える