7

私がやっている

item['desc'] = site.select('a/text()').extract()

しかし、これはこのように印刷されます

[u'\n                    A mano libera\n                  ']

[u'\n 、traling space および '] のような奇妙な文字を削除するにはどうすればよいですか?

トリミング(はがす)ができない

exceptions.AttributeError: 'list' object has no attribute 'strip'

文字列に変換してからストリッピングすると、結果は上記の文字列になりました。これはUTF-8であると思われます

4

3 に答える 3

1
desc = site.select('a/text()').extract()
desc=[s.strip() for s in desc]
item['desc']=desc[0]
于 2016-07-18T11:32:52.417 に答える