3

正規表現を使用してウェブサイトから価格をコンパイルしています。

PriceFinder = re.compile('(?<=\n\s\<b>\$)(\d*\.\d{2})(?=\<\/)|(?<=\"FF0000"><b>\$)(\d*\.\d{2})(?=\<\/)')
Price = re.findall(PriceFinder, str(soup))
print Price

私は次の結果を得ています:

[('', '30.99'), ('', '30.99'), ('', '30.99'), ('34.99', ''), ('34.99', '')

空の要素のないリストを取得するには、正規表現に何を追加する必要があるかを知りたいです。

['30.99','30.99','30.99','34.99','34.99']

ありがとう

4

1 に答える 1

0

わかりました、私はこの質問に答えるために私の最初の python を書きました:

#!/usr/bin/python

import re

r = re.compile('(?:\n\s\<b>\$|\"FF0000"><b>\$)(\d*\.\d{2})(?=\<\/)')
p = re.findall(r, '<x y="FF0000"><b>$30.99</b></x>\n <b>$31.99</b>')
print p

プリントアウト['30.99', '31.99']

于 2013-06-26T20:44:56.880 に答える