java - jsoupselect要素

Question

jsoupを使用してデータのWebサイトをスクレイプしようとしています。しかし、テキストの取得に問題があります。

HTMLの一部は次のようになります

<p class="time">9:00</p>

これは、コード行を使用してうまく取得できます。

Document doc = Jsoup.connect(url).get();
doc.select("p.time").text());

しかし、htmlの次のビットは次のようになります。

<p class="date"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p>

入手方法がわかりません。行の使用：

doc.select("p.date").text());

空の文字列を取得します。私はそのバリエーションを試しましたが（つまり、「p.date」を選択してからdate.select（ "strong"）を試しました）、空の文字列を考え続けます。

その日付のテキストを取得するにはどうすればよいですか？

score 1 · Accepted Answer

問題を再現できません。

Document doc = Jsoup.parse("<html><body><p class=\"date\"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p></body></html>");
String s = doc.select("p.date").text();
System.out.println(s);

これは、「2012 年 7 月 27 日金曜日」と表示されます。

java - jsoupselect要素

1 に答える 1

Related

Reference