JSoup と Java を使用して Web サイトから特定のデータを抽出しようとしています。これまでのところ、私は達成しようとしていることに成功しています。
<ul class="beverageFacts">
<li><span>Årgång</span><strong>**2009** </strong></li>
上記HTMLの**内を抽出したい。これを行うには、JSoup で次のコードを使用します。
doc.select("ul.beverageFacts li:lt(1) strong");
lt(1) を使用しているのは、省略したいリスト項目がさらにいくつかあるためです。
今私の問題に; データを抽出しているサイトにはオプションの情報タブがあり、「beverageFacts」というクラスもあります。私のコードは、現時点ではそのデータも抽出しますが、これは望ましくありません。
コードはウェブサイトのソースのさらに下にあり、ここでもインデクサー :lt(1) を使用しようとしましたが、機能しません。
<div id="beverageMoreFacts" style="display: block">
<ul class="beverageFacts"><li class="half">
<span> Färg</span><strong> Ljusgul färg.</strong>
私の全体的な結果は、「2009 Ljusgul färg」を抽出することです。「2009」だけではなく。最初の部分のみを抽出し、残りを省略するようにコードを作成するにはどうすればよいですか?
編集:次を使用して同じ結果が得られます:
doc.select("ul.beverageFacts li:eq(0) strong");
ありがとう、Z