私はこの分野で初めてであり、より多くの情報が必要です。インターネットで情報が見つかりませんでした。たとえば、今私はこの関数を使用していますhxs.select('//div[@id="CategoryBreadcrumb"]//text()').extract()
。これdiv
で私は1つを除いてそれぞれにnchorsを持っていul
ます。タグが含まれていないからのテキストが必要です。hxsフィルタリングについても教育的なリンクを提供していただければ幸いです。前もって感謝します!これは、必要なものを視覚化できない場合の例です。li
a
li
li
a
<div id='CategoryBreadcrumb'>
<ul>
<li><a href=#>I dont need</a></li>
<li><a href=#>I dont need</a></li>
<li><a href=#>I dont need</a></li>
<li>Text that i need</li>
</ul>
</div>