私はxPathを使用して新聞のコードを(練習のために)トラバースしようとしています。現在、主要な記事、写真、およびそれについての簡単な説明を取得したいと思います。しかし、私はこれまでのところxPathにそれほど熟練しておらず、簡単な説明にたどり着くことができません。
このコードで:
<div class="margenesPortlet">
<div class="fondoprincipal">
<div class="margenesPortlet">
<a href='notas/n1092329.htm' ><img id="LinkNotaA1_Foto" src="http://i.oem.com.mx/5cfaf266-bb93-436c-82bc-b60a78d21fb6.jpg" height="250" width="300" border="0" /></a>
<div class="piefoto_esto">Un tubo de 12 pulgadas al lado de la Vialidad Sacramento que provocó el corte del servicio durante toda la mañana y hasta alrededor de las cuatro de la tarde. Foto: El Heraldo de Chihuahua</div>
<div class="cabezaprincesto"><a href='notas/n1092329.htm' class='cabezaprincesto' >Sin agua 8 mil usuarios</a></div>
<div class="resumenesto"><a href='notas/n1092329.htm' class='resumenesto' >La ruptura de una línea en el tanque de rebombeo de agua Sacramento dejó sin servicio a ocho mil usuarios, en once colonias del sur de la ciudad. </a></div>
</div>
</div>
</div>
写真(キャプション付きまたはキャプションなし)を取得してから、記事のタイトルを取得したいと思います。私が使用することによって得ることができるこれらの3つのもの:
// div [@ class='fondoprincipal']<-メインの画像とキャプションを表示します
// a [@ class ='cabezaprincesto'] / text()<-記事のタイトルを教えてください
しかし、class = "resumenesto"のdivである小さな説明を取得できません。同じIDが残りのHTMLで何度も使用されているため、そのIDで何も取得しようとしませんでした。余分なアイテムがたくさん。
どうすればこの特定のものを入手できますか?それでは、別のWebページに解析するための良い方法を教えてくれる人はいますか?私はおそらくphpがそれらの値を使用していくつかのhtmlを書くことを考えていましたが、私は本当にわかりません...
編集
「この特定のもの」とは、div class="fondoprincipal"内にあるこのdivclass="resumenesto"を取得する方法です。..
編集2
ありがとうございます。xPathトラバーシングがもう少し明確になりました。しかし、私の2番目の質問について、別のWebページに解析するための良い方法を教えてくれる人はいますか?私はおそらくphpがそれらの値を使用していくつかのhtmlを書くことを考えていましたが、私は本当にわかりません。