2

JSoup と Java を使用して Web サイトから特定のデータを抽出しようとしています。これまでのところ、私は達成しようとしていることに成功しています。

<ul class="beverageFacts">
<li><span>Årgång</span><strong>**2009**&nbsp;</strong></li>

上記HTMLの**内を抽出したい。これを行うには、JSoup で次のコードを使用します。

doc.select("ul.beverageFacts li:lt(1) strong");

lt(1) を使用しているのは、省略したいリスト項目がさらにいくつかあるためです。

今私の問題に; データを抽出しているサイトにはオプションの情報タブがあり、「beverageFacts」というクラスもあります。私のコードは、現時点ではそのデータも抽出しますが、これは望ましくありません。

コードはウェブサイトのソースのさらに下にあり、ここでもインデクサー :lt(1) を使用しようとしましたが、機能しません。

<div id="beverageMoreFacts" style="display: block">
<ul class="beverageFacts"><li class="half">
<span> Färg</span><strong> Ljusgul färg.</strong>

私の全体的な結果は、「2009 Ljusgul färg」を抽出することです。「2009」だけではなく。最初の部分のみを抽出し、残りを省略するようにコードを作成するにはどうすればよいですか?

編集:次を使用して同じ結果が得られます:

 doc.select("ul.beverageFacts li:eq(0) strong");

ありがとう、Z

4

1 に答える 1

0

両方を認定する必要がありますが、1 つの部分のみを認定しています。これを試して:

doc.select("ul.beverageFacts:eq(0) li:eq(0) strong");

あなたが言っているのは、飲み物の各リストの最初のリスト項目を教えてください. 代わりに言う必要があるのは、次のとおりです。最初の飲み物のリストの最初の項目を教えてください。

于 2012-06-10T10:36:15.170 に答える