0

jsoupを使用してデータのWebサイトをスクレイプしようとしています。しかし、テキストの取得に問題があります。

HTMLの一部は次のようになります

<p class="time">9:00</p>

これは、コード行を使用してうまく取得できます。

Document doc = Jsoup.connect(url).get();
doc.select("p.time").text());

しかし、htmlの次のビットは次のようになります。

<p class="date"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p>

入手方法がわかりません。行の使用:

doc.select("p.date").text());

空の文字列を取得します。私はそのバリエーションを試しましたが(つまり、「p.date」を選択してからdate.select( "strong")を試しました)、空の文字列を考え続けます。

その日付のテキストを取得するにはどうすればよいですか?

4

1 に答える 1

1

問題を再現できません。

Document doc = Jsoup.parse("<html><body><p class=\"date\"><strong>FRIDAY 27<sup>th</sup></strong> JULY 2012</p></body></html>");
String s = doc.select("p.date").text();
System.out.println(s);

これは、「2012 年 7 月 27 日金曜日」と表示されます。

于 2012-07-01T21:08:52.637 に答える