0

このコードは次のとおりです。

Document doc = Jsoup.connect("http://wikitravel.org/en/San_Francisco").get();
System.out.println(doc.select("h2:contains(Get around) ~ *:not(h2:contains(See) ~ *)"));

http://pastebin.com/gkcCfr1Fを出力します。「not」セレクターを包括的にするセレクターはありますか? 現在、ウィキの個々のセクションを解析しようとしているため、id="see" を含む最後の h2 タグを他のすべてと一緒に削除したい場合、"see" の後のすべてを削除しています。

私が取得したい最終的な出力は次のとおりです。http://pastebin.com/ntpVrgui

4

1 に答える 1

0

私はこのようなことをします:

コンテンツ div を取得します。

 StringBuilder sb = new StringBuilder();
    boolean start = false;
    Document doc = Jsoup.connect("http://wikitravel.org/en/San_Francisco").get();
            Elements content = doc.select("#content");
            for (Element element : content) {
                /*Pseudo code
                   if element is h3 and it contains span with id Navigating and if start is  
false append it to stringbuilder, set start to true, else append everything in between until you reach h2 with span id See
                  */                
    }
于 2012-08-03T00:13:03.360 に答える