2

製品ページから Web サイトをクロールしようとしていますが、製品の説明を破棄しようとしていますが、製品の説明のみを選択するにはどうすればよいですか :

ページへのリンク

xPath : hxs.select('//div[@class="product-shop"]/p/text()').extract()

HTML はかなり大きいので、上記のリンクを参照してください。

他の詳細ではなく、製品の説明のみを選択したい...

私がこれを行う場合:

[" ".join([i.strip() for i in hxs.select('//div[@class="product-shop"]/p/text()').extract()])]

output : 
[u'Itemcode: 12BTS28271 Brand: BASICS InStock - Ships within 2 business days. Tip: 90% of our shipments reach within 4 business days! This product is part of the Basics T.shirts line made of 100% Cotton. Stripes Muscle Fit T.shirts that come in Green Color. Casual that comes with Henley away.']

しかし、私は欲しいだけです:

[u'This product is part of the Basics T.shirts line made of 100% Cotton. Stripes Muscle Fit T.shirts that come in Green Color. Casual that comes with Henley away.']
4

1 に答える 1