任意のページのHTMLダンプを解析しようとしています。HTMLパーサーを使用し、解析にはJSoupも試しました。
Jsoupで便利な関数を見つけましたが、呼び出し中に403エラーが発生しますDocument doc = Jsoup.connect(url).get();
htmlダンプを取得するためにHTTPClientを試しましたが、同じURLで成功しました。
JSoupがコモンズhttpクライアントからコンテンツを提供しているのと同じURLに403を提供しているのはなぜですか?私は何か間違ったことをしていますか?何かご意見は?