Web から HTML ドキュメントを読み込んで解析するためのコードを書いています。
私は次のようにJDOMを使用しています:
SAXBuilder parser = new SAXBuilder();
Document document = (Document)parser.build("http://www.google.com");
Element rootNode = document.getRootElement();
/* and so on ...*/
そのようにうまく機能します。しかし、URL を「http://www.kijiji.com」などの他の Web サイトに変更すると、parser.build(...)
回線がハングします。
なぜハングするのですか?kijiji が私が「本物の」Web ブラウザではないことを知っているためではないかと考えています。おそらく、http リクエストをスプーフィングして、IE などから来ているように見せる必要がありますか?
どんなアイデアも役に立ちます、ありがとう!
ロブ