java - IDまたはクラスを持たないタグからテキストを取得する方法

Question

JSOUP を使用して、このスニペットから「ムービー」テキストを抽出したい: ここに画像の説明を入力

お気づきのように、2 番目の span タグには、最初の span 以外に ID もクラスもありません。私の質問は、どうすればそのテキストを取得できますか?

ありがとうございました。

<span>                                                             
</span><span><span class="contentTitle">
Program Type:</span>
<span style="font-size: 14px;">
Movie</span>
<br />
</span><span id="MainContent_trProgramCategories"><span class="contentTitle">
 Categories:</span>&nbsp; 
<span style="font-size: 14px;">Horror, Thriller
</span>

score 2 · Accepted Answer

メソッドをいじって、データを削り続ける必要がありますselect(...)。たとえば、単純に次のようにします。

Elements myEles = doc.select("div[id=MainContent_UpdatePanel2] td");
String text = myEles.text();

System.out.println(text);

あなたがおそらく興味を持っているもののほとんどを取得します。

score 1 · Accepted Answer

「うなぎいっぱいのホバークラフト」が提案したものを使用できます。

ただし、将来の使用例として、要素の CSS パスまたは XPath を取得する最も簡単な方法は、Firebug 拡張機能を使用することです。

Firebug 拡張機能

「虫のような画像」の横にある「マウスポインターのようなアイコン」をクリックして、ブラウザーから値を取得する要素を選択すると、次の行の XPath/CSS テキストボックスにパスが表示されます。使用する。

そのテキストをコピーしてコードに貼り付けるだけです

doc.select("HERE PASTE THE XPATH/CSS PATH THAT YOU COPIED FROM FIREBUG").text();

クロムを使用している場合は、

あなたはできる

テキスト値を取得する要素を右クリックします
「要素を調べる」を選択
デバッガーで強調表示された要素をもう一度右クリックします
「XPathのコピー」を選択

java - IDまたはクラスを持たないタグからテキストを取得する方法

3 に答える 3

Related

Reference