Web サイトをスクレイピングしています。この HTML ドキュメントから数値を取得する必要があります。
<td>
<span style=" color: red; font-weight: bold;"> 1.950</span>
</td>
<td> 3.400</td>
1.950 と 3.400 の両方を抽出する必要がありますが、一方の値が a にしかなく、もう一方の値にもスパンがある場合、その方法がわかりません。パスの親と子の両方を取得する一般的な方法はありますか? scrapy
でフレームワークを使用していHtmlXPathSelector
ます。/td/text()
1 つのパスともう 1 つのパスを使用できますが/td/span/text()
、1 つのクエリで行う必要があります。これはどのように達成できますか?