テキストドキュメントで価格を見つける必要があります。私のコードは次のようになります。
sentence = "This is test text $25,000 $25,000$20,000 $30"
pattern = re.compile(ur'[$€£]?\d+([.,]\d+)?', re.UNICODE | re.MULTILINE | re.DOTALL)
print pattern.findall(sentence)
望ましい結果は次のとおりです。
['$25,000', '$30']
これは私のタスクにとって有効な結果ではないため、結果に$ 25,000$20,000を含める必要はありません。完全な単語の一致のみが必要です。
しかし、私はこの結果を得る:
['$25,000', '$25,000', '$20,000', '$30']
空白または句読点で区切られた価格のみを含むように正規表現を書き直すにはどうすればよいですか?