0

Jsoup を使用してリンクを解析したい。正常に動作しますが、「http://translate.google.com」のようなリンク (ドットが 1 つ以上含まれる) をパラメーターとして渡すと、エラーが発生します。

public class HtmlProcessor {

    public String[] getLinks(String url) throws IOException {

        Vector <String> hrefs = new Vector <String> ();

        try {

            Document doc = Jsoup.connect( url ).get();
            Elements links = doc.getElementsByTag("a");


            for (Element link : links) {

                hrefs.add(  link.attr( "href" ) );
            }
        } catch (ConnectException ex) {
            System.out.println(ex.getMessage());
        }

        return hrefs.toArray( new String [hrefs.size()] );      
    }
}
4

1 に答える 1

0

http://translate.google.comにアクセスしようとしたところ、ユーザー エージェント エラーが発生しました。これを試して; それは私のために問題を修正しました:

Document doc = Jsoup
        .connect( url )
        .userAgent("Mozilla/5.0 (Windows NT 6.1; WOW64; rv:17.0) Gecko/17.0 Firefox/17.0")
        .get();
于 2012-09-17T20:35:52.447 に答える