私はこのコードを持っています
site = hxs.select("//h1[@class='state']")
mydata = site.select("string()").extract()
cleaned_mydata = re.sub(ur'(\s)\s+', ur'\1', mydata[0], flags=re.MULTILINE + re.UNICODE)
log.msg(str(mydata),level=log.ERROR)
log.msg(str(cleaned_mydata),level=log.ERROR)
最初の出力は
エラー:[u'\ r \ n 212 \ r \nxxxxにphpを含むジョブ\r\ n']
他の出力は
xxxxxxにphpを含むジョブ
正規表現も212
数値を削除しています。どうすれば修正できますか