URL のリストから .html の Web ページをダウンロードしようとしていますが、これらの Web サイトの一部はセッション Cookie を使用しており、Jsoup.connect("url") を試行すると 403 が返されます。
そのため、Map / HashMap を使用しましたJsoup で Cookie を管理する方法、Jsoup でCookieとセッションを維持する方法、Cookie を取得する方法など..、それでも 403.
本当に驚いたのは、Mac Automator のような非常に単純なアプリで仕事ができ、実際には HTML ではなくテキストのみを保存できることですが、まだ...
このCookieの後退を乗り越える方法を知っている人はいますか? このページを使用した例は素晴らしいでしょう。http://pubs.acs.org/doi/full/10.1021/ja312087x
thx!!!
1413 次
1 に答える
1
この回答を見てください https://stackoverflow.com/a/15369631/516167
ページを開く必要があります。この後、フォーム データ (ログイン、パスワード)、Cookie、および POST に必要なその他のパラメーターを送信します。
于 2013-03-15T22:18:38.930 に答える