以下の構造に従うHTMLを扱っています。「RANDOM TEXT」を無視して「TEXT I WANT」をCSSセレクターで引っ張りたい。
私が現在使用しているセレクターは、すべてのテキストをプルしています。
variable = page.css('div.eight.columns.listingDetail p')
これはHTMLです:
<div class="eight columns listingDetail">
<p>
<span class="bold">RANDOM TEXT</span>
TEXT I WANT 1
</p>
<p>
<span class="bold">RANDOM TEXT</span>
<span class="bold price">
TEXT I WANT 2
<span></span>
</span>
</p>
<p>
<span class="bold">RANDOM TEXT</span>
</p>
<p>
<span class="bold">RANDOM TEXT</span>
TEXT I WANT 3
</p>
</div>