0

JSOUP を使用して、このスニペットから「ムービー」テキストを抽出したい: ここに画像の説明を入力

お気づきのように、2 番目の span タグには、最初の span 以外に ID もクラスもありません。私の質問は、どうすればそのテキストを取得できますか?

ありがとうございました。

<span>                                                             
</span><span><span class="contentTitle">
Program Type:</span>
<span style="font-size: 14px;">
Movie</span>
<br />
</span><span id="MainContent_trProgramCategories"><span class="contentTitle">
 Categories:</span>&nbsp; 
<span style="font-size: 14px;">Horror, Thriller
</span>
4

3 に答える 3

2

メソッドをいじって、データを削り続ける必要がありますselect(...)。たとえば、単純に次のようにします。

Elements myEles = doc.select("div[id=MainContent_UpdatePanel2] td");
String text = myEles.text();

System.out.println(text);

あなたがおそらく興味を持っているもののほとんどを取得します。

于 2013-08-13T02:29:25.703 に答える
1

「うなぎいっぱいのホバークラフト」が提案したものを使用できます。

ただし、将来の使用例として、要素の CSS パスまたは XPath を取得する最も簡単な方法は、Firebug 拡張機能を使用することです。

Firebug 拡張機能

「虫のような画像」の横にある「マウス ポインターのようなアイコン」をクリックして、ブラウザーから値を取得する要素を選択すると、次の行の XPath/CSS テキスト ボックスにパスが表示されます。使用する。

そのテキストをコピーしてコードに貼り付けるだけです

doc.select("HERE PASTE THE XPATH/CSS PATH THAT YOU COPIED FROM FIREBUG").text();

クロムを使用している場合は、

あなたはできる

  1. テキスト値を取得する要素を右クリックします
  2. 「要素を調べる」を選択
  3. デバッガーで強調表示された要素をもう一度右クリックします
  4. 「XPathのコピー」を選択
于 2013-08-13T09:48:52.647 に答える