0

Google ショッピング (http://www.google.co.uk/m/products?q=5010459007289、電話の Web サイト) から製品名情報を抽出しようとしています。

製品名は、クラス「owb63p」のスパンの間に常に表示されます。たとえば、

"<span class="owb63p">Highland Spring Sports Bottle 750 Ml</span>"

私は JSoup を初めて使用します。URL に接続してドキュメント全体を取得できますが、必要な情報のみを取得できるように設定するのに助けが必要です。

ありがとう

4

4 に答える 4

1

JSoup では次のようになります。

Document doc = Jsoup.connect("www.google.co.uk/m/products?q=5010459007289").get();
Element title = doc.select("span.owb63p").first();
    System.out.println(title.text());
于 2012-02-27T10:54:53.637 に答える
0

JSoup はあまり好きではありませんが、apache jerichoでは次のようになります。

            Source source=new Source(new URL(sourceUrlString));
    String content=source.getFirstElementByClass( "owb63p" ).getContent().toString();
于 2012-02-25T13:23:04.340 に答える
0

JSoupの例には、探しているものが含まれているようです。

于 2012-02-25T14:21:19.467 に答える
0

あなたは試すことができます

doc.select("span").get(0).data();

または、複数のスパンタグを単純に繰り返すことができます...

于 2012-04-18T15:46:33.957 に答える