1

私は、Webページにアクセスし、すべての画像と一般的なドキュメント(.docx .pdfなど)を検索してダウンロードし、ページ上の各リンクにアクセスして同じことを行うプログラムを作成しています。私が遭遇している問題は、リンクの解析に深く入り込むと、jsoupで400のエラーが発生することです。 Exception in thread "main" org.jsoup.HttpStatusException: HTTP error fetching URL. Status=400, URL=http://www.somerandomurl.com

コード:

Document doc = Jsoup.connect(urlstring).userAgent("Chrome").get();

ヘルプ?

4

2 に答える 2

0

リンクをどのように解析しますか (さらにコードを追加してください)。多くの場合、単純な属性の代わりに絶対リンクを使用する必要があります。

于 2012-10-08T08:29:46.013 に答える
0

URL に含まれるアクセントや特殊文字に問題がある可能性があります。

于 2014-02-14T09:44:17.000 に答える